[depositar] 以技術克服科研運算可再現性的挑戰 貫徹開放科學的理念

去(2023)年 10 月,研究資料寄存所(depositar)迎來了 Binder 的整合,這也是 depositar 協助研究人員達成「運算可再現性」(computational reproducibility)的一個里程碑。使用者只需將程式碼和相關資料放入同一資料集中,並於資料集頁面點選 Binder 功能按鈕,或於 Binder 服務首頁輸入資料集網址,就能迅速在平臺上建立該程式碼的運算環境,並重現它的執行結果。其實不只 depoistar,其他科研單位例如歐洲網格基礎設施(European Grid Infrastructure, EGI)、日本國立情報學研究所(National Institute of Informatics, NII)也紛紛在近兩年引入類似的功能。

2023 國際資料週「資料節慶」 一窺研究資料管理發展

文/王家薰/中央研究院資訊科學研究所 專案經理、莊庭瑞/中央研究院資訊科學研究所 副研究員

本文亦刊登於 2024-01-15 科技報導

若是想要了解科學資料政策、研究資料管理,以及相關資訊技術的發展趨勢,或是想和不同學科領域的資料專家討論各種前沿議題,那麼兩年一次的國際資料週(International Data Week, IDW)是不容錯過的盛會。為期四天的國際資料週會議由研究資料聯盟(Research Data Alliance, RDA)、國際科學資料委員會(The Committee on Data of the International Science Council, CODATA),以及世界資料系統(World Data System, WDS)共同籌辦,目的在於促進研究資料在科學、教育及各學科領域的交流與合作,並加速資料科學的發展。

讓大眾取用政府資助的研究成果 美國與臺灣新近的發展

美國 OSTP 設定今(2023)年為「開放科學年」(Year of Open Science),聯邦政府各部門將發展開放科學策略,並要求各機構在8月底前更新他們的「公眾取用方案」(Public Access Plan),以符應去年 8 月的備忘錄。今年 7 月,美國的「國家科學基金會」(National Science Foundation, NSF)也在網站公布了〈NSF公眾取用方案 2.0〉。 本文將概述美國的公眾取用方案細節,以及臺灣新近的發展。對於政府資助的科研產出,在知識普及和公眾近用層面的政策發展以及實施方法,美國或可為臺灣借鏡。NSF 的方案首先肯認研究論文與資料的開放和公平傳播,與促進科學進步密切相關。但也需要考慮實施公眾取用的同時,資源短缺的研究機構潛在的公平性議題。

過去還是未來?淺談萬物相連的語意網

「語意網」這個概念,在 1994 年就已被發想,並於 1998 被正式提出 (Berners-Lee, 1998)。簡單來說,語意網即「資料的網絡」(web of data) (W3C, 2015)。「資料」是指於網路上流通的各式資訊,舉凡近期上映的電影情報、私房景點地圖、部落格文章等,皆屬資料的範疇。語意網的目標,在於以通用的標準格式,將這些資料描述成為一個個「資源」(resource),而此標準格式即為「資源描述架構」(Resource Description Framework; RDF)。

當資料管理作為 NGO 提倡企業綠色轉型的推手——專訪綠色公民行動聯盟

本文介紹綠盟研究團隊如何善用政府開放資料,建置「透明足跡」環境資料庫,並在透明足跡資料庫的基礎上,推出「掃了再買」行動應用程式、「 ESG 檢測儀」企業環境永續資料平台,透過向大眾揭露企業環境表現的方式,捲動公民社會、政府、企業共同促進台灣產業的永續轉型。

資料為體,系統為用

「機器學習」 已是常見的用語,多數人都不陌生。簡單地說,機器學習使用自動化的方法分析給定的資料,生成高效率的運算模型,用來判別之後同類型的資料。用來訓練模型的資料越多,得到的模型也就越精細。當然,訓練資料的特質,影響了生成模型的特性。因為資料缺失導致模型偏差的情形也時有所見,卻很難避免。

讓資料價值顯現的「台灣生物多樣性網絡」——專訪柯智仁、張慧玲研究員

TBN 的平台上已累積超過 1000 個不同的資料集,總計超過 1,200 萬筆生態資料;而在蒐集資料外,TBN 也透過不同方式,強化其平台上資料的流通與應用。例如目前在平台上,所有的生態資料都可透過地圖網格的視覺化方式顯示其分布狀態;TBN 也在 2021 年參與成立臺灣生物多樣性資訊聯盟(Taiwan Biodiversity Information Alliance,TBIA),擴大平台上資訊的流通。

俄烏戰爭:國際科學社群的回應(3/1-4/30)

俄烏戰爭自 2 月底展開至今,已邁入第三個月。國際科學界亦持續對其有各式回應。以下整理由 3 月初至今,世界各地的科學社群所發起的行動。這並非一份完整的清單,我們僅蒐集了目前認為具影響力的行動或事件,並會視情形持續更新。

最後更新:5 月 17 日 上午 10:00

---

研究資料亂到不行?你需要的是「資料管理方案」——淺談什麼是「開放科學」

在資料管理實務上,各研究單位因資源配置、研究領域、研究方法、研究文化等差異,所遭遇的問題及可能的解方亦各不相同。聆聽彼此經驗,了解對方解決問題的脈絡,是找尋自身合適的資料管理方式的有效途徑之一。