什麼是 DOI 數位物件識別號?

文/穆昱佳(中央研究院資訊科學研究所研究助理)

DOI 發展歷史

隨著數位世界的快速發展,文獻資料的產製不再停留於傳統的書面出版、紙本雜誌乃至實體 CD/DVD 等實體物件的形式,僅有數位形式、沒有實體物件的「純數位資料」在目前的流通是越發地盛行。然而數位資料的種類繁多,流通、驗證與檢索的需求也與傳統的實體物件索引有所不同,例如在書籍查詢時,常用的 ISBN-10/13 或 ISSN,雖能提供唯一性的編碼,但在透過 URL 技術連結資料的網路世界中,僅依賴 ISBN 與 ISSN,並無法對數位的書籍或雜誌進行綁定。此外,數位世界的資料具易搬易改的特性,如何讓網路使用者能隨時找到不同位置的資料、甚至確認不同版本的物件的同一性,亦需有獨特的方法。

為了解決數位資料索引的問題,國際數位物件識別號基金會(International DOI Foundation,簡稱 IDF)在 1998 年建立了數位物件識別碼(Digital Object Identifier, DOI)概念與系統,用於各式數位資源的檢索。有別於傳統識別碼僅提供書面編碼,DOI 提供有永久數位轉址的服務,使得各數位物件具有獨特且固定的連結,不會因伺服器改版、遷移或請求逾時等各類因素而更動,亦不會因物件變更存放位址,造成連結失效,無法存取物件的情形。DOI 的收錄範圍包含但不限於電子書、數位期刊以及數位學位論文。

目前 DOI 已經由 ISO 納為資訊與文件的通行標準 ISO 26324:2012,應用於各領域的數位物件發行與識別,全球發配的 DOI 識別碼數量高達 2 億 7500 萬筆 。

DOI 功能簡述

做為一款 PID,DOI 主要由 IDF 負責整體平台政策制定(包含 metadata 的建構與識別碼交換政策等)、技術支援、註冊、維護等維運工作,目前 DOI 所訂定的 metadata 註錄規範已經註冊為 ISO 26324,做為網際網路中數位資料與後設資料的流通標準。

而 DOI 識別碼的發配與註冊則是透過「註冊代理機構」(Registration Agencies,簡稱 RA)的協助來進行。RA 的工作包含提供 DOI 的註冊、分配 DOI 的前綴、DOI 的永久定項服務、維護所提交的 metadata 以及所有相對應服務的基礎設施建構與維護。欲進行 DOI 配發的機構(可能是學術單位、學校以及出版機構等)需要向 RA 進行申請。,各 RA 在管理 DOI 的政策都略有不同,因此除前文提到的電子書、數位期刊以及數位學位論文可註冊 DOI 外,依於不同的RA政策,能註冊DOI的數位資源也不同,如:DataCite 所收錄的物件種類繁多,涵蓋有資料表、研究報告、簡報檔、影片、醫學臨床案例等多元的數位資源。

目前全球合計有 11 個 RA,專責進行正體中文文獻 DOI 申請的是於 2011 年 7 月通過申請的華藝(Airiti),目前在臺灣多數獲得 DOI 編碼配發的機構即是向華藝進行專屬編碼的註冊,並獲得機構配發 DOI 的權限。

這邊舉幾個以地域性或特定語言為主的 RA:

如前所述,各個 RA 能夠依照自己的收存政策,自行決定、規範欲收錄的數位資源類別,依據目前華藝的規範現在收錄的主要類別為:期刊、學位論文、書籍、研討會/會議論文、研究計畫報告以及資料集或資料庫;其他類別若欲被收錄可去諮詢各 DOI 配發機構。

DOI 的編碼

doi-sample
在文獻引註中所提供的 DOI 編碼,由於 DOI 的永久識別碼機制,也能透過 DOI 解析器或是網址直接訪問到相應的文獻。

 

DOI 編碼主要分為前綴與後綴,以「/」做為分隔符號,前綴固定,統一由 RA 配發前兩碼 10 作為識別,「.」後的數字編號則為 RA 所配發的註冊單位編號;後綴則是由 RA 與欲申請配發的單位共同討論規則,規則具有彈性,可使用流水號也可直接沿用既有 ISSN 或 ISBN 編號,只要不違反編碼政策即可。以華藝 DOI 政策為例,可允許的字元有:「a-z」、「A-Z」、「0-9」以及「-._;()/」,不分大小寫,並且不可以用半形句點「.」作為結尾。實際的編碼配發規則,會由 RA 與進行 DOI 配發的機構共同商議,並由二者共同維護 DOI 轉址服務的永久性;也就是說一份數位資源當他獲得 DOI 識別碼的配發時,該識別碼與其轉址指向的頁面會在 DOI 機制的運作下永久有效,不會因為網站改版等因素有所改變。

DOI 應用

目前已經獲得 DOI 的數位物件,在物件本身或其後設資料 (metadata) 上,可能都會記載 DOI 的識別碼。只要將識別碼的前面輸入 “http://dx.doi.org/” 並填入瀏覽器網址列,就能導向至該物件的數位位置。若不曉得物件位址或DOI,亦可透過華藝等 RA 提供的 DOI 解析器與查詢服務來快速查詢。

在文獻引用上,DOI 也能作為數位論文平台為論文編列的永久網址,做為文獻參考引用的依據,只需要在參考文獻中列明 DOI 識別碼,讀者就能透過對應的識別碼在網路上檢索到相對應的文獻。

DOI 在編碼配發的彈性與網址定向的特性,也能讓數位物件的傳播更加細緻。有別於傳統 ISBN 以書籍為單位,DOI 能提供更加細分的單一標的分享,不只是單篇文章,甚至是文章中的單張圖、圖表或是影片,同時包含尚未出版的學術文章也都是能夠做為單筆資料進行 DOI 的註冊,並透過對應的識別碼進行分享與傳播,提高學術資源再利用的可能性。

參考文獻