2011年4月27日 星期三

語意網(Semantic Web)

1998 Web 的發明人暨 W3C 主席 Tim Berners Lee 提出語意網(Semantic Web)的概念之後,語意檢索的研究在國際上受到相當的重視。從已發表有關Semantic Web 的文獻看來,要能做到理解資訊資源中的邏輯語意並進行檢索,已不純然是檢索技術的問題,它還需要知識體系、詞彙體系、標記語言的配合,並以檢索推理機制來進行檢索、驗證及推理的工作。
語意網是現有網路架構的延伸,將資料內容的涵意定義得更明確,使人們能有效地使用網路所帶來的便利,且提供統一的資料描述框架,促使網路資源整合,並藉由連結到資訊本身的定義與背景,使資訊內容的語意能被表示,進而更有效率地作資訊存取與分析(Hjelm, 2001)
語意網的主要目的,是讓網際網路上的文件都能用標準的本體知識語言來表達,一方面達到知識分享的目的,另一方面也能達到可機讀性(machine readable),也就是讓電腦可以讀的懂本體知識語言所描述的文件敘述,了解其語意內涵,而能進一步自動替使用者作更精確的資料判斷與處理。


在語意網中資源及連結可以有類別屬性
Source: Marja-Riitta Koivunen and Eric Miller, “W3C Semantic Web Activity,”http://www.w3.org/2001/12/semweb-fin/w3csw
在傳統的網際網路中,文件與文件有超連結關係,但並未指出其關係為何,如上圖左,而上圖右中,則為語意網之示意圖,相關的文件不但有超連結,而且會標示出此連結關係為何。換言之,語意網中,資源連結會描述述該連結之類型屬性。



1.          UNICODE:處理當前世界上所有的語言。

2.          URI:標示單一資源,泛指任何可以識別出某項資源(某個東西、某個人、某個….)的項目,這又可區分為兩種,一是大家較不常用的 URNUniversal Resource Name),是指能夠識別出某項資源的名稱,比如說「Wikipedia」就是URN;另一種URI就是最常用的URLUniversal Resource Locator),除了能識別出某項資源外,還能指出資源所在的位置,比如說 http://www.wikipedia.com/ 就是URL

3.          Xml + NameSpace + Xmlschema:表現資料的內容與結構,無法表達機器可理解的語意。

4.          RDF + RDFschema:RDF:描述網路資源,其他條目會說明,RDF Schema使用一種機器可以理解的體系來定義描述資源的辭彙。

5.          Ontology vocabulary:本體論是將一個明顯和形式的規範概念化,後面定義部分會詳加說明。
(1)   Logic 用來進一步提升本體語言,容許應用特定的描述性知識撰寫。
(2)   Proof 包含用資訊網語言(低階)作真正推論程序來證明表徵。
(3)   Trust 經由數位認證和其他知識的使用而出現
語意網是建立在XML 可以自訂標籤架構 ( schemas ) ,及RDF 可以靈活描述資料的根基上。
在語義網使用RDF 之前,RDF 上頭還需有一層可以正式描述網站文件中的專門術語之意義的本體語言 ( ontology language ) 。此外,若期望機器可以對這些文件執行有效的推論 ( reasoning ) 工作,那麼這個語言就必須超越RDF Schema 的基本語意。Web Ontology Language (簡稱 OWL) 就是設計來標示該知識本體的語法,也是目前W3C 所公佈和語意網相關的眾多標準之一。(郭于嫙)

參考資料:
James Mayfield & Tim Finin.(2003). Information retrieval on the Semantic Web: Integrating inference and retrieval. Proceedings of the SIGIR Workshop on the Semantic Web.
黃居仁(2003)。語意網、詞網與知識本體:淺談未來網路上的知識運籌。佛教圖書館館訊33,頁6-21
Grigoris Antoniou, F. v. H. (2006). 語意網技術導論 (初版 ed.). 台北市: 碁峰資訊.
陳亞寧、陳淑君(2001)。以知識探索為本之知識組織方法論及研究分析。圖書與資訊學刊39 ,頁36-51

沒有留言:

張貼留言