研究資料亂到不行?你需要的是「資料管理方案」——淺談什麼是「開放科學」

原文刊登於 2021/12/22 泛科學,文/何明諠

什麼是「開放科學」?

大體而言,開放科學是關於「有品質、完整、平等與利益共享的科學環境」的一套構想 [1],它希望能移除知識藩籬,激發研究創意。為了達成這些核心價值,不同的科學社群衍生了不同實務作法,也造就了過往「開放科學」紛雜的內涵。

儘管如此,一般在討論「開放科學」時,仍認為其有幾個核心的關注面向,如開放近用科學成果(如論文)、開放研究資料、研究過程中使用科技工具進行開放協作等。歐盟OECD聯合國等國際組織在近年來亦紛紛制定相關政策、白皮書,並投入經費致力於開放科學的推展。

脈絡不同,資料管理方式也不同

「我知道開放科學很好,我也有滿手的資料,但是……」,在資料科學盛行的時代,幾乎所有研究者在處理資料時,都會遭遇各種「但是」的問題:但是資料很亂不知從何著手、但是不曉得要釋出哪些資料、但是沒有心力…。

在這樣的脈落下,中央研究院資訊科學研究所等 5 個單位,在 2021 年 10 月 7 日舉辦了 2021 研究資料管理工作坊。工作坊共概分成 5 個資料管理的主題,分別涉及「生物多樣性」、「多面向資料管理」、「氣候、海洋及空氣資料」、「研究團隊經驗分享」、「個人資料管理」等面向,邀請近 20 位來自不同領域、單位的講者,分享他們在研究資料管理 (Research Data Management, RDM)上的經驗。

 

2021 workshop banner

圖/2021 研究資料管理工作坊

在資料管理實務上,各研究單位因資源配置、研究領域、研究方法、研究文化等差異,所遭遇的問題及可能的解方亦各不相同。聆聽彼此經驗,了解對方解決問題的脈絡,是找尋自身合適的資料管理方式的有效途徑之一。

以本次工作坊為例,我們即觀察到,同是為了提昇資料的利用價值,有的單位選擇將資源優先配置在蒐集更多資料;有的則是積極建立、宣導資料處理的 SOP;另外也有強調個別資料集的品質控管與說明。

TBN's statistic

圖為「台灣生物多樣性網絡」在回應資料價值時,將重點放置於增加資料量的成果圖。
圖/柯智仁 - 讓資料的價值被看見能否鼓勵資料的管理與開放?

我們也發現,有關資料即時利用的需求,時常不在研究團隊最初的預期中,且需求亦可能來自團隊內部或外部。而為了回應需求,有的研究單位選擇投入心力在軟硬體上,打造自動化流程,以應付外部大量的資料索取要求;有的研究單位,則優先建立單位內部的即時資料分享環境,再適度滿足外部需求。

以上各種應對方式間的差異,多半是因各單位在處理同一問題時,身處不同的脈絡所致。

 

逐漸上軌道的研究工具:資料管理方案

在本次工作坊中,亦有關於「資料管理方案」(Data Management Plan, DMP)的場次。DMP 是一份描述研究資料如何被蒐集、使用、管理、保存、分享等歷程的文件。通常是在研究開始前撰寫,在研究中隨時修正,藉此研究者能更有效地管理資料。

近年來,DMP 已逐漸成為計畫申請者被要求檢附的文件。目前在網路上也能找到各式的 DMP 範本,協助研究者撰寫 DMP。例如研究資料寄存所(depositar)翻譯的 Science Europe 研究資料管理指南,就提供了一份 DMP 的範本。

在工作坊中,科技部永續學門指出,資料管理是開放科學的一部分,因此永續學門自 2020 年 8 月開始推動資料管理方案試辦計畫,透過經費補助的方式,鼓勵整合型計畫提出 DMP。本次工作坊亦有兩個參與試辦計畫的研究團隊,分享他們在撰寫及執行 DMP 的歷程。在研究資料管理概論這個場次,亦仔細介紹了 DMP 可能包含的內容。

MOST's DMP policy

科技部永續學門自 2020 年 8 月開始試辦資料管理方案。
圖/

但鑒於 DMP 在國際上逐漸成為「要求」,亦不乏質疑認為,撰寫 DMP 可能僅是加重研究者行政負擔;對此,一份 2021 年 4 月有關歐盟推行 DMP 的實證研究指出,超過 80% 的研究者認為 DMP 對他們的研究有幫助,這或可有效緩解相關的疑慮。

 

DMP benefits

超過八成的研究者認為 DMP 帶來了比行政負擔更多的正面效益。
圖/Open Research Europe

研究資料管理與開放科學

2021 研究資料管理工作坊的簡報及錄影,已在 11 月中悉數公開在工作坊網站。而工作坊後不久,在 2021 年 11 月底,我們見到聯合國教科文組織(UNESCO)通過了一份開放科學建議書(UNESCO Recommendation on Open Science)。這份文件共獲得 193 個與會國支持。UNESCO 表示,與會國們的共同支持,使向來意義紛雜的「開放科學」首次取得了全球性的定義。

UN open science

聯合國教科文組織於 2021 年 11 月底通過的開放科學建議書。圖/UNESCO

UNESCO 針對開放科學的定義與說明很長(參見建議書第 7 頁至第 16 頁),我們無意在最後的篇幅中細說。但很清楚的一點是,「開放研究資料」(open research data)是構成 UNESCO「開放科學」定義的一部分。

身為國際社群的一員,台灣有許多的跨國研究計畫,過去兩年的防疫,亦受益於國際的開放研究資料許多(如使用 GISAID 資料庫進行研究)。

國內研究社群與開放研究資料或開放科學的國際標準接軌,既是必須,亦是互惠,而研究資料管理將是達成此目標不可免的基本功。在「開放科學」取得重大國際進展的此時,再次回顧本次工作坊的內容,應是一件更饒富意義的事。

 

UN open science recommendation

開放科學建議書:開放科學的定義 – 包含「開放研究資料」。
圖/ UNESCO

註釋:

  1. Why the world needs to embrace open science? https://www.weforum.org/agenda/2021/10/why-open-science-is-the-cornerstone-of-sustainable-development/

參考文獻: