顯示具有 知識組織系統 標籤的文章。 顯示所有文章
顯示具有 知識組織系統 標籤的文章。 顯示所有文章

2011年4月27日 星期三

語意檢索(Semantic Retrieval)

指利用語意網的互連及推理的特性提供語意查詢檢索,以及為了能使語意查詢檢索能應用於各個不同的學習領域,則需仰賴本體技術,以本體所架構出來的共同認知概念,在針對不同的領域時,即可以使用不同的本體來描述,若日後欲將此圖像內容的領域轉移到不同的領域時,只需將其本體架構置換成描述該領域之本體即可(Maedche et al., 2002)
為了得到有意義的檢索結果,首先須讓電腦處理理解的內容,故需進行有意義、電腦能夠理解的檢索,而語意網為解決此一問題,需讓知識具代表性且進行結構化。(郭于嫙)

參考資料:
Madalli, D. P. (2006). ONTOLOGIES AS KNOWLEDGE STRUCTURES FOR SEMANTIC RETRIEVAL.

語意網(Semantic Web)

1998 Web 的發明人暨 W3C 主席 Tim Berners Lee 提出語意網(Semantic Web)的概念之後,語意檢索的研究在國際上受到相當的重視。從已發表有關Semantic Web 的文獻看來,要能做到理解資訊資源中的邏輯語意並進行檢索,已不純然是檢索技術的問題,它還需要知識體系、詞彙體系、標記語言的配合,並以檢索推理機制來進行檢索、驗證及推理的工作。
語意網是現有網路架構的延伸,將資料內容的涵意定義得更明確,使人們能有效地使用網路所帶來的便利,且提供統一的資料描述框架,促使網路資源整合,並藉由連結到資訊本身的定義與背景,使資訊內容的語意能被表示,進而更有效率地作資訊存取與分析(Hjelm, 2001)
語意網的主要目的,是讓網際網路上的文件都能用標準的本體知識語言來表達,一方面達到知識分享的目的,另一方面也能達到可機讀性(machine readable),也就是讓電腦可以讀的懂本體知識語言所描述的文件敘述,了解其語意內涵,而能進一步自動替使用者作更精確的資料判斷與處理。


在語意網中資源及連結可以有類別屬性
Source: Marja-Riitta Koivunen and Eric Miller, “W3C Semantic Web Activity,”http://www.w3.org/2001/12/semweb-fin/w3csw
在傳統的網際網路中,文件與文件有超連結關係,但並未指出其關係為何,如上圖左,而上圖右中,則為語意網之示意圖,相關的文件不但有超連結,而且會標示出此連結關係為何。換言之,語意網中,資源連結會描述述該連結之類型屬性。



1.          UNICODE:處理當前世界上所有的語言。

2.          URI:標示單一資源,泛指任何可以識別出某項資源(某個東西、某個人、某個….)的項目,這又可區分為兩種,一是大家較不常用的 URNUniversal Resource Name),是指能夠識別出某項資源的名稱,比如說「Wikipedia」就是URN;另一種URI就是最常用的URLUniversal Resource Locator),除了能識別出某項資源外,還能指出資源所在的位置,比如說 http://www.wikipedia.com/ 就是URL

3.          Xml + NameSpace + Xmlschema:表現資料的內容與結構,無法表達機器可理解的語意。

4.          RDF + RDFschema:RDF:描述網路資源,其他條目會說明,RDF Schema使用一種機器可以理解的體系來定義描述資源的辭彙。

5.          Ontology vocabulary:本體論是將一個明顯和形式的規範概念化,後面定義部分會詳加說明。
(1)   Logic 用來進一步提升本體語言,容許應用特定的描述性知識撰寫。
(2)   Proof 包含用資訊網語言(低階)作真正推論程序來證明表徵。
(3)   Trust 經由數位認證和其他知識的使用而出現
語意網是建立在XML 可以自訂標籤架構 ( schemas ) ,及RDF 可以靈活描述資料的根基上。
在語義網使用RDF 之前,RDF 上頭還需有一層可以正式描述網站文件中的專門術語之意義的本體語言 ( ontology language ) 。此外,若期望機器可以對這些文件執行有效的推論 ( reasoning ) 工作,那麼這個語言就必須超越RDF Schema 的基本語意。Web Ontology Language (簡稱 OWL) 就是設計來標示該知識本體的語法,也是目前W3C 所公佈和語意網相關的眾多標準之一。(郭于嫙)

參考資料:
James Mayfield & Tim Finin.(2003). Information retrieval on the Semantic Web: Integrating inference and retrieval. Proceedings of the SIGIR Workshop on the Semantic Web.
黃居仁(2003)。語意網、詞網與知識本體:淺談未來網路上的知識運籌。佛教圖書館館訊33,頁6-21
Grigoris Antoniou, F. v. H. (2006). 語意網技術導論 (初版 ed.). 台北市: 碁峰資訊.
陳亞寧、陳淑君(2001)。以知識探索為本之知識組織方法論及研究分析。圖書與資訊學刊39 ,頁36-51

知識本體論(Ontology)

簡介
知識本體主要是用以定義在某特定的應用領域內,什麼種類的事情可以存在, 以及它們之間的交互關係(Interrelationship)(Sowa ,1995) 。較具體而言, 知識本體是對於某一特定領域中, 許多知識術語(Knowledge Term)所組成的集合,包含語彙(Vocabulary),語意上的相互連結(Semantic Interconnection), 以及在推論(Inference)和邏輯(Logic)上的簡單規則(Hendler , 2001)。
且用來描述與定義各種知識的語言,以便達到知識分享共用的目的。由於網路並不知道每個網頁資源用的詞屬於哪個領域。所以不但搜尋者必須要定義這個詞代表什麼意義,屬於哪個領域。在任一個網頁裡面,每一個詞的定義是什麼,代表的知識範圍與架構是什麼,就是這個網頁的知識本體告訴使用者的目的。
特性
Gruber (1993) 本體為建置特定領域的概念,統一詮釋對事物的認知,具有以下四點特性:
1. 概念化(Conceptualization)
本體將真實世界予以概念化,以提供結構性知識的描述,讓該領域的相關成員能相互溝通。
2. 正規化(Formal)
本體是一群正規化表示的概念集合,以清楚的語意定義及數學符號所形成的語言進行描述,可為人類所閱讀。
3. 明確(Explicit)
所使用的概念及使用這些概念的限制都有明確的定義,可供機器解讀(Interpret)
4. 可分享(Share)
知識本體表達的是共同認可的知識,反映的是領域中公認的概念集,可作為溝通的媒介。
(1)       知識本體能夠對特定領域進行概念及關係的定義,藉推論程序獲得隱性知識的建構,因此較能貼近對真實世界的認知。(Chandrasekaran et al.1999)
(2)       知識本體主要是以框架和邏輯為基礎,表達真實世界的知識脈絡。(Gomez-Perez et al. 2004)
而若組織內部員工或計畫部門有不同的背景、語言、工具與技術,可能會造成溝通上的障礙,故知識本體可被視為一個共同的認知(Shared Understanding), 用以減少與排除概念上與術語上的衝突。(郭于嫙)

參考資料:
Uschold M., and M. Gruniger (1996) “Ontolgoies: Principal, Methods and Applications”, Knowledge Engineering Review, 11(2).  
陳昭珍(2006)。以知識本體架構與知識組織發展新趨勢,數位時代圖書館館藏發展研討會論文集,頁318-338
黃居仁(2003)。語意網、詞網與知識本體:淺談未來網路上的知識運籌. 佛教圖書館館訊,33,頁6-21