長期社會生態系統研究的資料管理原則

文/黃寶霈(國立臺灣大學圖書資訊學研究所碩士生)

在國科會自然科學及永續研究發展處的支持下,2021 年起臺灣展開了本土的長期社會生態系統研究(Long-Term Socio-Ecological Research,簡稱 LTSER),意即在不同類型且具代表性的地區進行長時間、系統性的監測調查,以探討人類社會與自然生態二大系統於長期互動下的關係與影響。目前臺灣 LTSER 計畫已於臺北水源特定區彰化芳苑二地各設立社會生態系統核心觀測站,以各自的核心研究議題建置基礎設施,預期穩定產出環境監測資料,以吸引更多研究團隊與資源投入長期社會生態系統的研究。

LTSER 的開展可回推至 1980 年代,美國由國家科學基金會(National Science Foundation,簡稱NSF)推動的長期生態系統研究(Long-Term Ecological Research,簡稱 LTER)。LTER 網絡於全美不同類型且具代表性的生態系統中進行系統性監測研究,為此類型研究的前鋒,也影響與促成了後續 1993 年的國際長期生態研究網(The International Long-Term Ecological Research,簡稱 ILTER)的成立。身為 ILTER 地區會員的歐洲長期生態研究網(LTER Europe)於 2007 年成立時,更宏觀地將生態系統所屬地理區域中的文化歷史、經濟社會等層面納入研究範疇,是為 LTSER 的開端1

奠基於生態學研究的特性——長期、各研究站點細緻深入研究、站點分佈範圍廣泛2——LTSER 融合生態與社會等跨領域的研究方式,整合利益關係者的觀點以了解人類與環境互動的拉扯,在試圖回應研究問題之時,也透過分享研究資料達成整體共榮3。而 LTSER 的成功並非一蹴可幾之事,除了持續的資助經費、彈性且堅實的研究網絡之外,LTSER 亦從提供可取用的資料與資訊達成其目標4,於此,研究資料管理的實踐更顯重要。

LTSER 於資料管理面的總體策略

跨領域、各研究站點深入卻分佈廣泛等特性,使 LTSER 產出的研究資料具多元、稀缺、分散的特性,其中的「稀缺」係指各站點依據自身核心研究議題蒐集資料之下,資料量體較為稀少而有珍貴之意5。而究竟該如何做,才能持續且有效管理多元、分散的研究資料呢?

因應 LTSER 仍處於早期發展階段,文獻與各方討論較少,對此,以下關於資料管理的爬梳與統整,主要參照發展相對成熟的 LTER 與長期監測研究的經驗。而從其經驗中發現,LTSER 總體資料管理策略可分高層級、基礎層級進行部署6,71)。

ltser-diagram
圖1:LTSER 可參考的資料管理二層級策略,整理自 Common information management framework: In practice by E. C. Meléndez-Colom, & K. S. Baker, 2002.

 

基礎層級是由資料互動第一線的研究站點構成。在此層級,各研究站點間資料管理人員與研究者搭配合作,一同對資料進行持續與回溯的管理,在透徹地描述資料脈絡外,也設計符合自身需求的技術工具。如 LTER 各站點便有駐點資料管理者(embedded data manager)與相關工作團隊(如系統管理者、空間資料管理工程師、品質監控技術員等),其任務便是搭起研究人員與資料管理間的橋樑,一同設計與建置出各站點於資料管理流程上所需的規範與技術工具。

至於串聯研究站點的合作網絡則為「高層級」策略,其以資料能被整合並提供多方再用為主要訴求,建置共同資料基礎建設如中央資料儲存庫(data repository),並發展與訂定統一標準,像是後設資料標準(metadata standard)、控制語彙(controlled vocabulary)等。同時,思考如何與相關社群(如學術機構、資料中心等)相互合作學習,讓資料得以回應更宏觀且多元的研究問題,創造更多資料利用與研究發展的可能性。

LTSER各站點於資料管理面的原則

如同一般研究資料管理,各研究站點中的資料管理原則亦須從規畫、收集、描述、品質確保、保存與分享、分析、評估等面向切入思考,且不少面向的實踐常仰賴於高層級的合作網絡部署。以下將說明各面向與主要任務8,9(如表2),並以 2010 年退場的 LTER Shortgrass Steppe(簡稱 LTER-SGS)站點之資料管理經驗為輔助說明10

1. 關乎資料的規畫

規畫是研究資料管理流程的首要步驟,可先從釐清組織所期待他人再次利用資料的狀況開始,以此發展對應的資料管理方案 (data management plan)、以及規劃一系列基礎建設,如資料收集機制、對應描述標準、儲存結構等。基礎建設的規劃可參照他方已發展成熟的長期觀測計畫之指南、標準、政策。此外,研究資料管理常因應研究問題不同,而有執行上的差異,可藉 5W1H 面向思考資料在研究設計中的關係與定位:1) 為什麼 (Why):研究目標與收集到的資料之間的關係;2) 如何進行 (How):資料蒐集流程與細節;3) 在哪裡 (Where):資料蒐集的樣區位置座標;4) 何時 (When):蒐集資料的頻率與時間點;5) 做什麼 (What):蒐集什麼樣的資料;6) 誰 (Who):蒐集資料時的相關人員角色與責任。

以 LTER-SGS 為例,資料管理人員便透過盤點資料實踐方式、確認資料需求、規劃資料流動方式、設計資料系統與協調資料安排等行動,用以支援站點研究中資料管理的需求。

2. 資料收集

不論是採取系統自動回報或/和人工記錄,依據方法的優劣評估該收集方式對此研究需求的適切性,皆須注意在變更紀錄時,不應直接刪除原始值或使其難以辨認,並應提供在旁註解說明的可能性,同時,定期校正相關設備可確保資料收集上的有效與一致性,如設備應在每季研究前或按照製造商的時間間隔建議下校準,而相機、GPS 接收器和數據紀錄器的時間紀錄須確保同步狀態等。

如 LTER-SGS 便發展出自身的現地採樣紀錄流程指南,以使資料收集作業更有系統與一致性。

3. 資料描述

資料的描述決定了他人理解資料的程度,如何正確、完整、全面並以讓人理解的方式描述資料是重要課題。後設資料標準或控制語彙可用以確保描述的欄位名稱及內容用詞的一致性。此資料描述標準通常是由研究網絡一同訂定,以提升網絡間的資料互通性,如 LTER 相關的研究網絡即採納生態後設資料語言(Ecological Metadata Language, 簡稱 EML)作為研究站網絡共同使用的採納後設資料標準,並建置適用的控制語彙表。而各站點作為實踐與持續更新的第一線設施,在描述標準之外,亦須在資料再用最大效益與人員時間成本取得平衡下,思考資料描述的詳盡程度,對此,LTER 網絡提出 EML 最佳實例與詳盡度對照表,列出不同詳盡度目標下須具備的欄位條目供各站點參考。

在 LTER-SGS 的案例中,站點雖於成立初期制訂符合自身需求的資料紀錄模版,然隨後亦採用 EML,促成更便利的資料整合與流通工作。

4. 資料品質確保

資料的品質會直接影響他人再用資料的信心,在資料收集期間與收集完成後,皆須進行品質確保的工作。於資料收集期間,可藉重複檢測與定期匯報,以確認資料品質是否符合原先期待;收集完成後,則進行資料正確呈現的核實、驗證資料內容與合理性、最後認證資料品質狀態是否能有效被利用與分享。

實務上來說,各站資料管理人員常作為品質檢驗的守門人,並搭配工具協助檢視,如 LTER 各站資料管理者會先來回檢視研究者提供的資料品質,而LTER網絡為確保資料集結構與其後設資料間的一致性與準確性,開發 EML Congruence Checker (ECC) 品質檢驗分析系統,以自動檢驗工具協助確保部分資料品質11

5. 資料保存與分享

資料的保存攸關於資料後續能否被近用與再用,其中包含:資料儲存的檔案格式盡量採以較能支援永續利用的非專屬格式(如tiff、odf、xml、csv等),而用以儲存的資訊系統也盡可能採用自由軟體。資料儲存系統的需求又可分為研究站點內部管理的資料庫、以及對外整合與公開的資料儲存庫二種;前者建議使用較有彈性度的關聯式資料庫,後者則選用可靠穩定的資料儲存庫。另外,當分享資料時,須考量資料所有權與機敏性,以對應查看或使用資料的權限級別。

以 LTER-SGS 為例,其自行設計與維護本地端資料與資訊的資料庫系統與網站,主要是為促進內部不同專案研究人員間的溝通,這些系統與網站除了儲存資料與其後設資料外,也存放相關研究素材與數位物件,而於此之上,在資料更具結構化且經後設資料標準檢驗後,資料與其後設資料將被打包成資料檔案集(data package),上傳至網絡共同使用的資料儲存庫平台 Environmental Data Initiative (EDI),進而達成與他方資料整合與分享的期盼。

6. 資料分析

當進行分析時,資料可能會經多次變動,對此,須詳實記載分析的發展與相關流程,並設定版本控制,以確保可追蹤還原的資料軌跡。文獻中較少提及站點如何記錄資料變動的實務工作,然可推估操作分析的研究者須具備良好資料管理意識,於工作手冊與實驗紀錄簿中確實記下每次變動的考量與版本差異,如同麵包屑一般記錄來時的路,以期未來有重現路線與折返原點的可能性。

7. 資料管理評估

定期評估能作為現況與理想差距的檢核點,並反思資料管理於研究中的價值與影響。可從最近一次的資料管理流程與資料狀態著手,接續確認資料收集方法的可用性,亦即能否被他人重製重現、資料描述紀錄的完整性、資料品質檢驗流程的有效性等,也尋求更多提升整個資料管理基礎建設與流程效率的方法。

評估不只能為自身帶來效益亦可成為他人明燈,LTER-SGS 便在計畫終結後,回顧自身策略與經驗後提出相關資料管理建議方向,提供給多方參照。

在關切當下資料管理的議題之餘,研究站點須時刻宏觀思考「長期性」資料保存所代表的涵義與實踐方式,以保有計劃終結後的資料永續生命,此時,在以研究站點為主的網絡之外,與他方單位的合作更是重要支柱。例如,LTER-SGS 在計畫終結後,除原存放於中央資料儲存庫之標準化研究資料外,其與當地的科羅拉多州立大學圖書館合作下,將與自身研究專案相關的脈絡資料移轉至該機構資料儲存庫,達成更多資料延續保存與取用的機會。

 

面向

目標

主要任務

1

計畫

確立整體研究過程中的研究資料管理方針

  • 思考資料再用者的潛在需求
  • 思考研究設計中的資料面向
  • 建置資料管理的基礎建設
  • 分派人員角色與責任、訓練
  • 決定工作空間與檔案管理

2

收集

確立資料收集的適切性與有效性

  • 選擇與定期評估收集方法
  • 考量不同資料類型所延伸出的需求
  • 定期校正儀器
  • 強化完整與小心收集資料的文化慣習

3

描述

確立描述資料的後設資料符合 4C原則:正確(Correct)、完整(Complete)、全面的(Comprehensive)、能被理解的(Comprehensible)

  • 實行一致的後設資料標準
  • 搭配控制詞彙
  • 決定描述的詳盡度

4

品質確保

確保資料品質符合他人再用需求

  • 於資料收集期間,反覆再測與定期匯報
  • 於資料收集完成後:
    • 核實資料的正確性、完整性、一致性
    • 驗證資料的內容與合理性
    • 認證資料符合能被利用與分享的基準

5

保存與分享

確保資料得以永續存在,並有近用機會

  • 確認須儲存物件、格式
  • 確立檔案命名管理
  • 決定儲存空間與管理方式
  • 訂定定期儲存資料的時間
  • 若要分享,先確認資料的所有權、機敏性、近用權限

6

分析

確保得以追蹤資料變動軌跡

  • 發展並記錄對應的分析流程
  • 確保進行版本控制 (資料軌跡)

7

評估

確認資料管理於研究過程中的意義、成果與後續影響

  • 檢視最近一期資料累積的狀態與管理方式
  • 確認資料收集計畫的可用性與重現性
  • 反思人員訓練的反饋和建議
  • 確認後設資料紀錄的完整度
  • 確認資料品質檢驗流程的有效性
  • 思考如何提升設備、工作流程、資料處理流程、基礎建設的效率
  • 思考資料/研究專案資訊對利益相關者與潛在使用者的影響與價值

表 2:可參考的資料管理原則與任務

小結

對 LTSER 而言,規劃堅實且彈性的資料管理策略是達成資料永續的必要基石。國際上以站點前線與網絡支持的資料管理二層級為框架,由貼近資料的各自研究站點自行建立資料管理規劃,而連結各站的中央資料儲存庫作為站點間於資料整合時的重要機制,確立規範標準以期保障資料品質。而在長期研究常有科技、設備、分析方法變動下,除了避免重要資料流失之外,新資料能否「嵌入」既有資料集持續累積是為一大挑戰,資料與其後設資料的持續性與一致性更顯為重要。與此同時,資助或主管機構應須體認到資料管理並非輕易之事,對此訂定相關政策並提供資料管理專業人力協助與支持體系,減輕研究人員的負擔、提升其資料管理意識與動力。

最終,期待在長期資料管理的協助下,能夠帶來各方對臺灣生態與社會系統的理解,以及滋養出更多多元研究的可能性。

參考資料

1. Dick, J., Orenstein, D. E., Holzer, J. M., Wohner, C., Achard, A.-L., Andrews, C., Avriel-Avni, N., Beja, P., Blond, N., Cabello, J., Chen, C., Díaz-Delgado, R., Giannakis, G. V., Gingrich, S., Izakovicova, Z., Krauze, K., Lamouroux, N., Leca, S., Melecis, V., … Van Ryckegem, G. (2018). What is socio-ecological research delivering? A literature survey across 25 international LTSER platforms. Science of The Total Environment, 622-623, 1225–1240. https://doi.org/10.1016/j.scitotenv.2017.11.324

2. Karasti, H., Baker, K. S., & Halkola, E. (2006). Enriching the notion of data curation in e-science: Data managing and information infrastructuring in the Long Term Ecological Research (LTER) Network. Computer Supported Cooperative Work (CSCW), 15(4), 321-358. https://doi.org/10.1007/s10606-006-9023-2

3. Mauz, I., Peltola, T., Granjou, C., van Bommel, S., & Buijs, A. (2012). How scientific visions matter: Insights from three long-term socio-ecological research (LTSER) platforms under construction in Europe. Environmental Science & Policy, 19-20, 90-99. https://doi.org/10.1016/j.envsci.2012.02.005

4. Gingrich, S., Schmid, M., Dirnböck, T., Dullinger, I., Garstenauer, R., Gaube, V., Haberl, H., Kainz, M., Kreiner, D., Mayer, R., Mirtl, M., Sass, O., Schauppenlehner, T., Stocker-Kiss, A., & Wildenberg, M. (2016). Long-term socio-ecological research in practice: Lessons from inter- and transdisciplinary research in the Austrian Eisenwurzen. Sustainability, 8(8), 743. https://doi.org/10.3390/su8080743

5. Gingrich, S., Schmid, M., Dirnböck, T., Dullinger, I., Garstenauer, R., Gaube, V., Haberl, H., Kainz, M., Kreiner, D., Mayer, R., Mirtl, M., Sass, O., Schauppenlehner, T., Stocker-Kiss, A., & Wildenberg, M. (2016). Long-term socio-ecological research in practice: Lessons from inter- and transdisciplinary research in the Austrian Eisenwurzen. Sustainability, 8(8), 743. https://doi.org/10.3390/su8080743

6. Meléndez-Colom, E. C., & Baker, K. S. (2002). Common Information Management Framework: In Practice. https://www.researchgate.net/profile/Eda-Melendez-Colom/publication/254194586_Common_Information_Management_Framework_in_Practice/links/5505c6ab0cf24cee3a050692/Common-Information-Management-Framework-in-Practice.pdf?origin=publication_detail

7. Porter, J. (2020, September 3). LTER Information Management [PowerPoint slides]. https://lter.tari.gov.tw/lterweb/sites/default/files/2020-09/LTER%20Information%20Management.pdf

8. Michener, W. K., Porter, J., Servilla, M., & Vanderbilt, K. (2011). Long term ecological research and information management. Ecological Informatics, 6(1), 13-24. https://doi.org/10.1016/j.ecoinf.2010.11.005

9. Sutter, R. D., Wainscott, S. B., Boetsch, J. R., Palmer, C. J., & Rugg, D. J. (2015). Practical guidance for integrating data management into long‐term ecological monitoring projects. Wildlife Society Bulletin, 39(3), 451-463. https://doi.org/10.1002/wsb.548

10. Kaplan, N. E., Baker, K. S., & Karasti, H. (2021). Long live the data! Embedded data management at a long‐term ecological research site. Ecosphere, 12(5), e03493. https://doi.org/10.1002/ecs2.3493

11. O’Brien, M., Costa, D., & Servilla, M. (2016). Ensuring the quality of data packages in the LTER network data management system. Ecological Informatics, 36, 237-246. https://doi.org/10.1016/j.ecoinf.2016.08.001

延伸參考資料

1. Angelstam, P., Manton, M., Elbakidze, M., Sijtsma, F., Adamescu, M. C., Avni, N., Beja, P., Bezak, P., Zyablikova, I., Cruz, F., Bretagnolle, V., Díaz-Delgado, R., Ens, B., Fedoriak, M., Flaim, G., Gingrich, S., Lavi-Neeman, M., Medinets, S., Melecis, V., … Yamelynets, T. (2019). LTSER platforms as a place-based transdisciplinary research infrastructure: Learning landscape approach through evaluation. Landscape Ecology, 34(7), 1461-1484. https://doi.org/10.1007/s10980-018-0737-6

2. Christensen, S. W., Brandt, C. C., & McCracken, M. K. (2011). Importance of data management in a long-term biological monitoring program. Environmental Management, 47(6), 1112-1124. https://doi.org/10.1007/s00267-010-9576-1

3. Laney, C. M., Baker, K. S., Peters, D. P. C., & Ramsey, K. W. (2013). Recommendations for data accessibility. In Long-Term Trends in Ecological Systems (pp. 216-225). United States Department of Agriculture. https://jornada.nmsu.edu/bibliography/13-029-16.pdf

4. Long-Term Ecological Research Network [LTERnet]. (2004). EML Best Practices for LTER Sites. https://lternet.edu/wp-content/uploads/2012/08/emlbestpractices_oct2004_final.pdf

5. Long-Term Ecological Research Network [LTERnet]. (2011). Strategic and Implementation Plan: LTER Research and Education. https://lternet.edu/wp-content/uploads/2010/12/LTER_SIP_Dec_05_2010.pdf

6. Michener, W. K., Porter, J., Servilla, M., & Vanderbilt, K. (2011). Long term ecological research and information management. Ecological Informatics, 6(1), 13-24. https://doi.org/10.1016/j.ecoinf.2010.11.005

7. Mirtl, M., Orenstein, D. E., Wildenberg, M., Peterseil, J., & Frenzel, M. (2013). Development of LTSER platforms in LTER-Europe: Challenges and experiences in implementing place-based long-term socio-ecological research in selected regions. In S. J. Singh, H. Haberl, M. Chertow, M. Mirtl, & M. Schmid (Eds.), Long Term Socio-Ecological Research (pp. 409–442). https://doi.org/10.1007/978-94-007-1177-8_17

8. Peters, D. P. C. (2010). Accessible ecology: Synthesis of the long, deep, and broad. Trends in Ecology & Evolution, 25(10), 592-601. https://doi.org/10.1016/j.tree.2010.07.005