完整開放資料分析流程,推動聲景生態調查——專訪林子皓博士

文字/劉宜庭|編輯/何明諠、王家薰


我們希望能做到像卡拉 OK 一樣,把人聲、伴奏的聲音分開,伴奏音樂裡面的小提琴、鼓,這些不同的樂器也都能分開,如同在自然的聲景裡面,把風的聲音、各種蟲聲、鳥的聲音分開,去看物種或自然活動本身的狀況是什麼物種或事件的相依性、互動關係又是什麼並能讓其他團隊透過共通的平台,搜尋聲景的檔案、進行他們想要的分析,例如透過不同都市的清晨鳥叫聲,進行生態調查。

-林子皓(中央研究院生物多樣性研究中心助研究員)

聲音景觀(soundscape,簡稱聲景)由環境音 (geophony) 、動物音 (biophony) 與人為噪音 (anthropophony) 共同組成,透過分析同一地點留下的聲音紀錄,如聲音的頻率、響度或時間上的組成與變化等,不僅可辨識天氣事件,探討物種多樣性的時空變化,也能利用動物聲音與人為噪音的互動,了解人類活動對生態的影響。

中央研究院生物多樣性研究中心助研究員林子皓博士投入聲景生態學 (soundscape ecology) 領域超過 10 年,現為「海洋生物多樣性聆聽計畫」主持人,專注建立涵蓋潮間帶、河口、珊瑚礁等生態系的水下聲景監測網路,並積極參與國際科研合作。

本文介紹林子皓博士如何完整開放聲景的原始資料、分析方法、研究結果,回顧在聲景研究資料管理上遭遇的困難,並鼓勵各界投入生態聲學與資訊分析的行列。

聆聽海洋生物多樣性,紀錄人為活動干擾

林子皓指出,聲景的研究資料主要是野外蒐集的長時間錄音檔案,資料結構單純,確認清楚錄音機放置的位置與環境狀況、錄音機的序號、錄音的頻率(連續錄音或每 5 分鐘錄 2 分鐘等設定)、錄音檔的名稱與時間戳記,詳實登記相關資訊,「剩下的就是研究產出的部分,根據不同的研究目的,進行不同的資料分析流程」。

2016 年到 2018 年,我主要發展基於陸域生態系統的聲景監測,針對台灣的森林、都市綠地錄音。」而在 2018 年到日本參與海下聲景探測計畫後,林子皓開始聚焦在海洋生態 ,希望建立台灣的海域聲景生態監測網路。「透過紀錄珊瑚礁、河口等不同生態系的環境變化,分析鯨豚、無脊椎生物、魚類等動物發出的聲音,了解觀光活動等人為干擾對生態的影響。」

以基隆潮境公園附近海域的聲景監測為例,林子皓指出,潮境公園是台灣很熱門的潛水景點,尤其在連續假期會有大量潛水客,聲景會變得很吵;研究團隊於是比較該地點近兩年端午連假的聲景,發現 2021 年疫情爆發時,出現更多的魚類聲音。

「這顯示人為活動消失後,可能出現我們意想不到的環境生態狀況,而這需要新的觀測技術才有辦法掌握;只看地景、照片,並無法了解當地棲息的野生動物對人為噪音的適應情況。」聲景生態學的紀錄,有助於準確評估棲地營造、噪音管制的成效。

林子皓研究團隊從 2020 年開始,在基隆潮境公園、小琉球、綠島等地點設置水下聲學監測站,持續蒐集水下錄音資料。「這三個水下錄音的地點,剛好是一個三角形,把台灣大部分的範圍都包在裡面,未來會是台灣很有特色的資料集。」

圖說:林子皓研究團隊在台灣沿海(地圖上紅色圖釘標示處)設置多處水下聲學監測站。(攝影:劉宜庭)
圖說:林子皓研究團隊在台灣沿海(地圖上紅色圖釘標示處)設置多處水下聲學監測站。(攝影:劉宜庭)

 

林子皓指出,台灣是高度受到人為干擾,同時有很多自然災害的副熱帶氣候環境,如果台灣能做出好的研究結果,跟我們同一緯度帶或鄰近的國家,就能透過台灣的經驗,知道人為開發或自然災害時,棲地或生物多樣性可能產生的變化。

生態研究常需跨國界的特性,亦促使林子皓積極與國際組織合作。「我們正在與國際安靜海洋實驗( International Quiet Ocean Experiment ,簡稱 IQOE )研究組織合作, IQOE 提倡透過一個全球性的研究資料平台,去追蹤人為噪音對全球海洋生態環境的影響」。

聲景分析流程全雲端開放,克服工具迭代差異

林子皓研究團隊積極推動開放科學的聲景計畫,在雲端音訊平台上開放聲景音訊檔案,釋出開源的聲景分析工具,包括聲音資料轉出頻譜圖的工具、集群自動化分類的分析工具等,並設計互動式網頁、聲景資料分析教學,引導更多人動手探索聲景。

以當前在研究資料寄存所 (depositar) 持續更新的海洋生態資料為例,包含基隆潮境公園、桃園觀新藻礁、台灣西部沿海的白海豚棲地、日本沖繩瀨底島珊瑚礁等多地在內的研究資料,林子皓均開放給大眾探索及使用。相關資料集伴隨著清楚的研究計畫資訊、研究資料蒐集時間與地點、資料授權條款、資料引用格式等,林子皓研究團隊也針對各筆資料集,提供可執行 Python 程式語言的 Google Colab 分析教學,詳細說明所使用的參數、模型,與得到的分析結果。

harry 2
圖說:林子皓研究團隊完整開放聲景資料分析流程,包括原始錄音資料、資料分析程式與研究結果。(來源:海洋生態聲學與資訊研究室)

 

將論文或研究成果有關的資料雲端化,是林子皓研究團隊的目標之一。研究團隊把所使用的原始資料、分析工具、分析結果開放在研究資料寄存所。部分聲景的原始錄音檔會發布在亞洲聲景平台、SoundCloud等雲端音訊平台;聲景分析的工具集也會更新在 GitHub 上。

林子皓指出,聲景資料處理流程完整開放在雲端,可確保分析結果在離線或連線狀態都能執行;當大家使用共通的研究資料、分析工具,也有助於不同的研究團隊進行交流,討論如何根據不同的研究目的,調整分析工具的設定細節。

「一筆聲音資料裡面涵蓋很多內容,我們在這次研究只針對一部分動物的聲音分析,但下次可以對更多的動物聲音、人為噪音與整體性聲景進一步分析。即使原始錄音資料相同,研究目的改變也會衍生出分析程式的差異;使用不同的參數、模型,同一套程式便會產出不同的分析結果。我習慣盡量用自動化的方法,連接原始資料和分析結果,盡量避免中間過程出現人工判斷,例如人為評估個別資料的等級,分類好或不好。」

從陸域到水域,資料開放難度升級

回顧開放研究資料的歷程,林子皓表示,主要困難是在錄音資料的蒐集、維護與永續使用。海域的錄音成本和難度比陸域更高,舉例來說,陸域聲景錄音機一台要價兩萬多台幣,海域聲景錄音機一台動輒要價十多萬台幣;設置在珊瑚礁生態系的錄音機能夠固定在海床,原則上整年都能收到錄音檔,但是河口生態系的錄音機只能用繩子、鐵板、浮球固定,繩子可能被海水腐蝕、漁民割破、流刺網或拖網弄斷,錄音機的損耗初估三成至五成,同一台機器也很難連續錄音三個月以上。

harry-pic3
圖說:林子皓研究團隊在珊瑚礁生態系架設水下錄音機。(來源:https://sites.google.com/biodiv.sinica.edu.tw/oceansound/%E8%81%B2%E6%99%AF%E7%A0%94%E7%A9%B6

 

資料維護與永續使用方面,林子皓指出,研究資料全部開放在雲端,在聲景研究領域是很罕見的做法,維護成本也很高,需要面對雲端空間儲存限制等問題。以亞洲聲景平台為例,該平台由行政院農業委員會林業試驗所、中央研究院網格計算專題中心共同建構,獲歐盟成立的Asi@Connect8 計畫經費支持,整合中央研究院生物多樣性研究中心、東協生物多樣性中心、香港、馬來西亞、菲律賓、泰國、越南的合作夥伴,保存以陸域生態系為主、台灣與東南亞各國的聲景錄音資料,但隨著歐盟資助停止,受到平台儲存容量的限制,已無法持續在亞洲聲景平台新增大量音訊資料。

「目前我手上已有超過 100TB 的錄音資料,而每個監測地點通常會設置兩個測站,每個測站一年會新增近 1TB 的資料,相當於每年會新增 10TB 20TB 的資料;坦白說,我也不知道現在的這個研究計畫結束、沒有經費之後,還能否繼續維持原始錄音檔案、分析工具完整雲端開放的做法」。

林子皓也提到,台灣學術圈普遍缺乏研究資料開放的意識,間接導致研究資料的永續使用成為一大難題,「通常一個研究計畫結束後,主要產出研究報告或論文,學者對於計畫執行過程中所蒐集的資料,比較欠缺公開發布研究資料,或讓別人知道你有哪些研究資料的意識。」若研究者能有更多研究資料開放或使用開放研究資料的經驗,相信將有助於研究資料的開放與再利用。

結語:強化資料可應用性,提升資料的社會影響力

在討論資料管理的未來期待時,林子皓指出,聲音資料的「應用」是他當前很在意的部分,但基於聲音不好辨識的特性,卻同時也是很難推動的一塊。

林子皓也坦言,就研究的行政面來談,發布聲景資料,但欠缺資料的應用,對爭取研究資源的幫助有限,「實務上的問題是,當我一直在做資料發布,但沒有相關的資料應用,就不容易爭取計畫資源;因為我雖一直在產資料,卻沒有對社會有影響力的結果,別人其實並不欣賞這件事情。」

為此,研究團隊近來也投注更多心力在提升資料的可應用性,像是落實開放科學。

林子皓表示,團隊目前除了會將所蒐集的資料開放,供所有研究團隊取用,執行各種分析外分析資料所需要的工具或原始碼,也都會一併開放。「我們其實希望其他人用我們的 code ,添加上他們的想法後,將他們的 code 也發佈出來。這會是一種很有趣的資料應用狀況,可以看各研究團隊,基於同一份資料,為了不同目的,如何去做分析。」

除了開放科學外,林子皓團隊也致力於提供各領域都能用的資料分析結果、希望建立一個可串聯各方聲音資料的收納平台等。

儘管步步艱辛,但未來的聲景資料管理,應仍是精采可期的。

延伸閱讀