2011年4月27日 星期三

主題分析(Subject Analysis)

主題分析有多種定義,廣義解釋為在圖書資料、資料庫控制與自然語言、資訊查詢與檢索策略中,對於主題事物之呈現、辨識與表示。從使用者角度來看,主題分析與主題檢索(Subject Access)關係密切。因此,凡是從各種資源將資訊中之某一主題檢索出來的方式皆可謂與主題分析相關。所以此派認為主題分析之範疇包含:(1)索引之理論與實務,如前組合索引、後組合索引、索引品質之研究;(2)控制詞彙,包括分類表、標題表、索引典等;(3)檢索策略與檢索方法,如線上圖書館目錄之檢索,資訊查詢;(4)自然語言檢索;(5)自動化索引與相關程序;(6)引文(Citation)關係應用於資訊檢索上等。
維克瑞(B.C. Vickery)則認為主題分析作業可分為4個步聚:(1)由文獻中選出能代表該資料內容之文字、片語、或句子;(2)必要時將這些文字轉成標準詞及標準型式;(3)必要時將文字轉成標準代碼;(4)選擇特定之文字、名詞、或代碼作為檢索點。
 亦有認為主題索引包括兩個步驟:主題分析與主題轉譯(Subject Translation)。主題分析係針對文獻內容分析其主題,研究文獻相關性(Aboutness)之問題:而主題轉譯即是將相關性轉成系統所接受的主題詞彙。主題分析所考慮的對象是文獻本身,而無關乎索引語言,索引者若拿到一本書或一篇文章,首先必須了解下列3個問題:(1)此資料為何?(2)此資料關乎什麼?(3)此資料為誰而寫?
就分析之範圍而言,主題分析可分為概要性分析(Summarization)及深入分析(Depth of Indexing)兩種。分析時以文獻整體為分析之單元者稱為概要性分析。分析一筆資料可由下列各項著手:題名、摘要、目次、序言、每章內文之首段、結論、插圖、圖表、標題等。作概要性分時必須注意下列資訊點:實體(Entities)、實體的部分(Parts)、實體或其部分之組合物及性質、過程、活動與作業、活動之設備、空間、時間等。
深入分析所分析的是一資料中之各部分內容,而不是以整體為分析單位。由於分析之深淺程度不一,所以在程度上深入分析並無明確的定義,完全視目的與實際狀況而定。深入分析依索引分成詳盡性(Exhaustivity)與專精性(Specificity)。詳盡性是指以足夠的名詞來描述一文獻之主題,描述詞越多越詳盡,一文獻被檢索到的機率愈大。主題索引主要原則在於以較專精之名詞而非一般性之名詞來描述資料。
主題分析的方法分人工分析與電腦自動分析兩種。人工分析主要倚賴索引者的學識與經驗作主題分析。自動分析又可稱為內容分析(Contents Analysis),它所需用的技術可分為兩大類:(1)元素分析、(Elemental Analysis),為分析文章之基本元素,如辨識字,字群、字順等。其分析技巧包括計算文字出現的頻率、相對頻率、索引典的使用、用字分析(Concordance)、字根法(Stemming)、停用字表(Stoplist)、及詞類分類(Part-of-Speech Determination)、詞彙分析、語法分析等。(2)結構分析(Structure Analysis),也是語意分析,在將文獻轉成結構性表達,以推論文獻之內涵。電腦語意分析系統的主要工作在將輸入句子的語法結構以及句中各詞類提供其語意訊息,即將充分表達句意的邏輯結構建置出來,對於不合乎語意的句子加以排除。(沈東玫)

參考資料:
王梅玲(無年代)。主題分析。網址: http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary。上網日期: 200946日。

沒有留言:

張貼留言