2015年1月14日 星期三

資料探勘(Data Minding)

Tag: 資料庫知識發掘(Knowledge Discovery in Databases,簡稱KDD)、資料庫探勘(Database Mining)

資料探勘(Data minding)目的從儲存於資料庫、資料倉儲或其他資訊儲存器的大量資料中,發掘出具有價值的知識之過程 ,其近年來廣泛應用在行銷、財務、銀行、製造、通訊、保險等,用以發掘潛在客戶、管理異常狀況、管理客戶關係、或作為企業決策的參考例如超級市場能將資料探勘運用於發掘顧客的消費模式,並利用所發掘的消費模式研擬促銷或貨物排架策略,以提昇超級市場的業績。

資料探勘(Data minding)是指從大型資料庫裡頭所儲存的資料當中去萃取出一些有趣的知識。「知識」指的就是一些規則大型資料庫包括線上作業的資料庫 (On-line Database) 及資料倉儲 (Data Warehouse)

1.          知識範例
「如果顧客的年齡是在三十歲到四十歲之間,而且年收入是在四十萬到六十萬之間,那麼此顧客很有可能會購買筆記型電腦。」學者曾對資料探勘做過的定義如下:

Frawley :「資料庫中挖掘潛在、明確、而且非常有用資訊的過程」
Grupe & Owrang :「從已存在的資料庫當中挖掘出專家仍未知的新事實」
Fayyad :「定義知識發掘 (Knowledge Discovery) 為從大量資料中選取合適的資料,進行資料處理、轉換等工作,再進行資料探勘與結果評估的一系列過程」

Berry & Linoff :「使用自動或半自動的方法,對大量資料分析,找出有意義的關係或法則」。

2.          資料探勘的功能如下:

1.      分類演算(Classification) – 按照分析對象的屬性分門別類加以定義,建立類組。
(1)        例子:信用卡申請者的風險屬性
(2)        技巧:Decision Tree, Memory-Based Reasoning
2.          推估分析(Estimation) – 根據既有數值的相關屬性資料,以獲取某一屬性未知的值。
(1)        例子: 按照信用卡申請者的教育程度、行為別來推估消費量
(2)        技巧:統計方法之相關分析、迴歸分析、類神經網路
3.          預測分析(Prediction) –根據屬性過去的觀察值來推估未來的值
(1)        例子:由顧客過去的刷卡消費量預測其未來的刷卡消費量
(2)        技巧:迴歸分析、時間數列分析、類神經網路
4.          關聯分組(Affinity Grouping, Association Mining):從所有物件決定哪些相關物件應該放在一起
(1)       例子:牙刷、牙膏、牙線放在一起
5.          同質分組(Clustering):將異質母體中區隔為較具同質性的群組(張薏婷)

參考文獻
王梅玲等編(2004)。圖書資訊選擇與採訪。台北﹕空中大學。
陳和琴、張慧銖、江琇瑛、陳昭珍(2003)。資訊組織。台北﹕空大。
曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2004)。資料探勘。旗標出版社。
詹麗萍(2005)。電子資源與圖書館館藏發展。臺北市:麥田。
Caplan, Priscilla.METADATA FUNDAMENTALS FOR ALL LIBRARIANS.Chicago [Ill.] : American Library Association, 2002.
Taylor, Arlene G., ORGANIZATION OF INFORMATION. 2ND ED .Westport, Conn. : Libraries Unlimited, 2004 .
Cabena, P., Hadjinian, R., Stadl仗, J. v., & Zanasi, A. (1998). Qiscovering Data Mining

沒有留言:

張貼留言