2014年3月25日 星期二

關聯的資料(Linked Data)

關聯的資料是在網路上透過間接引用URL進行發布、分享與連結的一種方法。圖書館目錄已經突破傳統圖書館的圍牆,圖書館更有能力利用整合檢索查詢到圖書館內以及館外相關的網路資料。圖書館的競爭者,Amazon利用關聯的資料突破傳統公用目錄連結到語意網,所以關聯的資料是語意網的展現,也是圖書館走向使用者的橋梁。(張慧銖,2011)

現今社會已從Web2.0朝向Web3.0Web3.0是一個以資料數據為主的網路。從文件間連結的網路提升至資料間連結的網路,讓電腦理解搜尋文本的內容,自動完成符合邏輯的語意搜尋工作,如此才利於電腦處理、利於搜尋與查檢。而圖書館的書目資料的處理也必需有新的作法。(張慧銖,2011)

關聯資料是透過RDF並使用URLs來形塑,再以HTTP作為傳輸管道。RDF是一種用於呈現網路資源的通用語法,可以視為是一種metadata,可用於描述網路資源的標題、作者、修改時間、版權及版本等屬性。以RDF(1)主詞或資源,無特殊定義,描述事或物都算;(2)敘述詞,描述資源的屬性和定義關係;(3)受詞,用以表示接受動作描述之對象,或是屬性的值,此三層概念為描述框架。

Time Berner-Lee指出關聯的資料實作方法上有四項標準(Library Congress, 2008):

1.      URL標籤任何事物的名稱
2.      HTTP URLs,讓任何人都可以檢索事物的名稱
3.      當有人搜尋到一個URL時,能提供有用的資訊並使用標準規範(RDF*,SPARQL)
4.      包含連結到其他相關的URL,讓使用者可以發現更多資訊

在網路上為了精確的找到資料,通常會使用自然語言。在自然語言中利用metadata定義所描述的辭彙外會加上Http://,這樣的機制除了提供資料的定址外還提供了資料的辨識碼。

在關聯的資料通常會隨附語意網定義的資料,以下是我們常看到的網路上五星級標章:

第1星.          在網路上資料即是開放使用權
第2星.          網路上的資料為機器可讀的資料
第3星.          非專有的一個格式
第4星.          資料要遵從RDF的標準
第5星.          連結到其他RDF

要達上以上所述,有一個比較容易達成的計畫便是採用”Guidelines for Dublin Core Application Profiles”之觀念,步驟包含(1)定義模組,定義將要描述的meradata以及物件關係,FRBR即是很好的例子;(2)選擇metadata所使用的辭彙,通常使用RDF為基礎進行物件描述;(3)選擇並控制所使用的辭彙,定義每個辭彙URL並且結合不同語言,增加使用彈性;(4)在所提供的資料和相關資料創造連結。利用這樣的計畫可以慢慢連結不同辭彙並建立出關聯式的世界。

未來的書目控制,圖書館伴隨著FRBR的概念以及RDA的標準,一旦圖書館的書目資料從書目紀錄中釋放,全世界將會得到非常豐富的關聯的資料。倘若圖書館進而成為網路的一部分,對人類知識來講會是非常重要的一大步。(翁竣霖)

參考文獻
張慧銖(2011)圖書館電子資源組織-從書架到網路。新北市:Airiti Press

Library Congress(2008).On the record: Report of the Library of Congress Working Group on the future of bibliographic control. Washington, DC.

1 則留言:

  1. Hi
    謝謝你的辛苦統整

    但想要糾正一下
    應該是: 用"URI"標籤任何事物的名稱
    在討論Linked Data的時候
    基本是不會強調是URL,而是URI

    http://en.wikipedia.org/wiki/Linked_data

    回覆刪除