2015年1月14日 星期三

大數據(Big Data)

Tag:巨量數據(Big Data)、海量數據(Big Data)、數據探勘(Data Mining)、數據挖掘(Data Mining

一、定義

大數據(Big Data)一詞最早出現在未來學家阿爾文托夫勒《第三次浪潮》一書中,他在書中將大數據熱情地讚頌為第三次浪潮的華彩樂章。約從2009年開始,大數據成為網路資訊技術行業的流行詞彙。

大數據,或稱巨量數據、海量數據,是由數量巨大、結構複雜、類型眾多數據構成的數據集合,是基於雲計算的數據處理與應用模式,通過數據的集成共用,交叉複用形成的智力資源和知識服務能力。Viktor Mayer-Schönberger在其所著的《Big Data》一書中,他將大數據定義為不使用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的一種分析方法。
此外,也有研究機構認為大數據是一種新的數據處理模式,具有更強的決策力、洞察發現力和流程優化能力,是一種海量、高增長率和多樣化的資訊資產。從某種程度上說,大數據是數據分析的前沿技術,具有從各種各樣類型的數據中,快速獲得有價值資訊的能力。

二、「大數據」的特質

對於大數據,目前通常認為有下述四大特質,稱為V”特質:
1.巨量(Volume Big
數據量級已從TB發展至PB乃至ZB,可稱海量、巨量乃至超量。
2. 多樣(Variable Type
數據類型繁多,愈來愈多為網頁、圖片、視頻、圖像與位置資訊等半結構化和非結構化數據資訊。
3.快速(Velocity Fast
數據流程往往為高速即時數據流,而且往往需要快速、持續的即時處理;處理工具亦在快速演進,軟體工程及人工智慧等均可能介入。
4.高價值和低密度(High Value and Low Density
以視頻安全監控為例,連續不斷的監控流中,有重大價值者可能僅為一兩秒的數據流程。

三、「大數據」的價值

       社群網站的興起,大量的UGCUser Generated Content,使用者生成內容)內容、音訊、文本資訊、影像、圖片等非結構化數據出現;穀歌搜索、Facebook的發文和微博消息等。另外,物聯網的數據量更大,加上移動互聯網能更準確、更快地收集使用者資訊,比如位置、生活資訊等數據等。這些都使得預測使用者行為和情緒成為可能。挖掘使用者的行為習慣和愛好,在冗雜的數據背後找到更符合使用者興趣和習慣的產品和服務,並對產品和服務進行針對性地調整和優化,這就是大數據的價值(劉志偉)

參考文獻
《電視工程》編輯部(2013)。大數據。電視工程,457
陳如明(2012)。大數據時代的挑戰、價值與應對策略。2012中國國際資訊通信展專刊,1714-15
Alvin Toffler(1980).The Third Wave.New York:Morrow.

Cukier, Kenneth & Mayer-Schonberger, Viktor(2013).Big Data.London: John Murray

沒有留言:

張貼留言