Tag:巨量數據(Big
Data)、海量數據(Big Data)、數據探勘(Data
Mining)、數據挖掘(Data
Mining)
一、定義
大數據(Big
Data)一詞最早出現在未來學家阿爾文•托夫勒《第三次浪潮》一書中,他在書中將“大數據”熱情地讚頌為“第三次浪潮的華彩樂章”。約從2009年開始,“大數據”成為網路資訊技術行業的流行詞彙。
大數據,或稱巨量數據、海量數據,是由數量巨大、結構複雜、類型眾多數據構成的數據集合,是基於雲計算的數據處理與應用模式,通過數據的集成共用,交叉複用形成的智力資源和知識服務能力。Viktor
Mayer-Schönberger在其所著的《Big Data》一書中,他將“大數據”定義為不使用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的一種分析方法。
此外,也有研究機構認為“大數據”是一種新的數據處理模式,具有更強的決策力、洞察發現力和流程優化能力,是一種海量、高增長率和多樣化的資訊資產。從某種程度上說,大數據是數據分析的前沿技術,具有從各種各樣類型的數據中,快速獲得有價值資訊的能力。
二、「大數據」的特質
對於大數據,目前通常認為有下述四大特質,稱為“四V”特質:
1.巨量(Volume
Big)
數據量級已從TB發展至PB乃至ZB,可稱海量、巨量乃至超量。
2.
多樣(Variable
Type)
數據類型繁多,愈來愈多為網頁、圖片、視頻、圖像與位置資訊等半結構化和非結構化數據資訊。
3.快速(Velocity
Fast)
數據流程往往為高速即時數據流,而且往往需要快速、持續的即時處理;處理工具亦在快速演進,軟體工程及人工智慧等均可能介入。
4.高價值和低密度(High
Value and Low Density)
以視頻安全監控為例,連續不斷的監控流中,有重大價值者可能僅為一兩秒的數據流程。
三、「大數據」的價值
參考文獻
《電視工程》編輯部(2013)。大數據。電視工程,4,57。
陳如明(2012)。大數據時代的挑戰、價值與應對策略。2012中國國際資訊通信展專刊,17,14-15。
百度百科(2014年5月)。大數據。檢自:http://baike.baidu.com/link?url=0A73afAkYrTiTriww8YYFQUwVgnOciip9UcGojG0Fc9cRtjuFK5VFYc6JUrKw_xc2LuZ3XO733QejddbIomzmq#15_1
。
Alvin
Toffler(1980).The Third Wave.New York:Morrow.
Cukier,
Kenneth & Mayer-Schonberger, Viktor(2013).Big Data.London: John Murray
沒有留言:
張貼留言