Tag:資料保存與數位保存
技術服務小百科
技術服務係關於圖書資訊的徵集、組織與準備工作,以提供讀者利用﹐支援讀者服務的圖書館服務。其範圍涵蓋館藏發展、採訪、編目、分類、資料加工處理、典藏、資料維護保存、圖書館自動化、數位典藏等。近年來受到資訊科技、網路科技、與檢索引擎技術的影響而出現許多新的技術與服務,在學習技術服務時首要辨別那些是重要的技術服務與相關技術,並瞭解其變遷與關連。本百科即在整理技術服務重要服務與技術,並加以解釋。
2015年1月14日 星期三
預防性文物保存(Preservation)
金鑲玉
Tag:資料保存與數位保存
資料維護(Preservation)
Tag:資料保存與數位保存
資料保存(Conservation)
Tag:資料保存與數位保存
資料保存(conservation),依據我國的〈文化資產保護法〉,其目的在於「保存」,而其目標則在於充實國民精神生活和發揚中華文化。文獻資料是人類在其發展過程中所創造出來的用以認識世界和改造世界的重要工具,
是人類重要的精神財富和物質財富。我國有〈文化資產保護法〉,其目的在於「保存」,而其目標則在於充實國民精神生活和發揚中華文化,我們具有悠久文化歷史,
珍藏有大量的古籍珍本。同時, 現代藏書的數量也在以驚人的速度增加。這些文獻材料同一切物質一樣,
每時每刻都在發生著變化。這種變化主要是在內因材料本身和外內環境因素的綜合作用下的老化變質,
使其逐漸喪失使用價值而最終報廢。為了保證這些資料長久、甚至永久地為人類服務,
就需要延長其保存和使用壽命, 為此就必須開展資料保存工作。
研究數據管理服務(Research Data Management Services)
Tag:資訊組織(Information
Organization)、數位典藏(Digtal
Archives)、資訊服務(Information
Services)、研究數據(Research
Data)
一、產生背景
2009年10月,微軟公司發佈了《e-Science:科學研究的第四種範式》論文集,首次全面的描述了快速興起的數據密集型科學研究,數據已經成為科學研究的重要組成部分。從研究生命週期來看,數據處於研究的核心位置,通常由研究專案過程創建,但是擁有比研究專案更長的壽命。有效的進行研究數據管理,不僅能大大的減少相關的科學研究成本,而且能有效的提高科學研究效率,還能保證科學研究過程的可回溯性和驗證。2011年早期,NSF(美國國家科學基金會)發佈通知,要求被提交到NSF的提案,必須包括一項“研究數據管理規劃”的補充文檔。自此,研究數據管理開始成為各種基金專案申請的基本要求。
二、定義
《SPEC
Kit 334:Research
Data Management Services》中對研究數據管理服務(RDMS)的定義是:一種提供資訊、諮詢、培訓服務,或積極參與數據管理計劃、研究過程中的數據管理指導、研究文檔與後設數據的建制、對已完成的研究專案及出版數據的共用與庋用等相關的服務。
中國國家圖書館研究員李丹丹與吳振新認為:研究資料管理貫穿於整個研究資料生命週期。主要是為提高各種格式的研究資料創建、組織、存儲和分發的方式,實現研究資料的訪問、整合、發現、共用、長期保存和重用。機構為順利進行研究資料管理專案,通常會首先提出或構建研究資料管理框架,然後在管理框架下開展研究和實踐活動。
三、研究數據管理服務的主要服務內容
(一) 研究數據管理規劃服務
NSF提出的資料管理計畫的內容包括:(1)研究產品:各類資料、樣品、實體館藏、軟體、課程教材,並在該專案的實施過程中產生的其他材料。(2)資料格式:將用於資料以及中繼資料格式和內容的標準。(3)訪問資料和資料共用的實踐和政策:包括適當的隱私保護、保密、安全、智慧財產權、其他權利或其他要求的規定。(4)再利用政策,重新分配,創建衍生產品。(5)資料歸檔:歸檔資料、樣品和其他產品計畫以及長期保存。
(二) 資料描述和存檔服務
數據格式、元數據、倉儲服務。
(三) 關聯環境服務
根據康奈爾大學圖書館的研究資料管理服務和ANDS(澳大利亞國家資料服務)的研究資料管理活動,總結目前常用的兩種關聯環境:研究資料敘事性上下文關聯環境(包括:研究人員、研究資源、研究經費等);論文出版物關聯環境。
(四) 研究資料管理能力教育與培訓
研究資料整個生命週期管理所涉及的物件包括研究人員、圖書館員以及各自的機構,相關的教育與培訓主要涉及提升研究資料管理的意識,以及對特定領域的科學工作流、IT和電腦知識、資訊系統工具使用、交流合作等方面能力的培訓(劉志偉)。
參考文獻
李丹丹,吳振新(2012)。研究資料管理服務綜析。圖書館學研究,9,54-69。
Microsoft
Corporation (2009.10).e-Infrastructure for the research lifecycle. Retrieved
from http://epubs.cclrc.ac.uk/bitstream/3857/science_lifecycle_STFC_poster1.PDF
NSF(2011).NSF
Data Management Plan Requirements. Retrieved from http://www.nsf.gov/eng/general/dmp.jsp
ARL(2013).SPEC Kit
334:Research Data
Management Services. Retrieved from http://publications.arl.org/Research-Data-Management-Services-SPEC-Kit-334/
數位資源無縫鏈接整合系統(Special Effects Cinematography,SFX)
Tag:資訊組織(Information
Organization)、圖書館自動化(Library
Automation)、關聯數據(Linked
Data)
數位資源無縫鏈接整合系統(Special
Effects cinematography , 簡稱SFX),是新的網路電子資源無縫連結整合軟體系統,也可以稱為上下文敏感參考文獻連結解決方案。SFX可以把不同來源和不同通信協定的資訊完全融合,使不嗣類型、不同格式的數位資源實現無縫連結,其技術為機構提供特製的連接,實現在異構的分散式資訊系統之間無阻礙導航。它允許使用者在資料庫中點擊一篇文章的記錄,然後顯示所有能夠得到的與這篇文章相關的服務選項清單。該清單可以包括這篇文章在其它資料庫的網上全文。該系統最初是由比利時Ghent大學Herbert
van de sompel研發。2001年由ExLibris公司推出。SFX的核心是OPEN
URL框架。Open URL框架是一個開放的、上下文相關的連結框架,它提供了一種在資訊服務之間傳遞物件中繼數據的格式,是美國資訊標準組織(NIOS)認可的標準。
SFX特有的動態連結在系統與各種類型資料庫之間提供一個智慧仲介,只要資訊來源網址有任何改變,智慧型仲介馬上反應至SFX的系統中,及時更新。在浩瀚的數據源中,通過搜尋引擎鎖定相關數據後,SFX運用Open
URL,語法描述數據上相關欄位如:作者、書名等不同Metadata數據,使用者若經授權可以取得全文數據、電子期刊或是作者開放的E-mail地址,也可從書目欄位直接連結到提供線上列印的網站去列印檔案,甚至直接連結網路書店書籍直接線上訂購,也可以連結到提供書本比價的網站取得價格資訊。SFX的特殊連結功能,讓使用者不用再查詢無數次就可以獲得完整資訊,幫使用者節省時間也提升圖書館的網路效益。
圖書館員還可以自行定義使用者與資料庫之間的連結服務關係,當使用者連結數據後就會出現已被定義的各種服務專案連結(劉志偉)。
參考文獻
李富玲,盧振波(2002)。SFX—資訊資源整合新工具。現代圖書館情報技術,6,69-71。
李愛國,汪社教(2003)。學術資訊資源整合工具—SFX及其啟示。現代圖書情報技術,1,48-50。
李欣榮(2005)。SFX技術在資源整合利用中的應用。情報科學,23(3),371-373。
黃鏑(2002)。SFX
context—sensitive電子資訊資源整合的利器。圖書館雜誌,21(3),49-50。
陳芷瑛(2004)。SFX--新一代的電子資源整合技術。國立中央大學圖書館通訊,39,2-7。
大數據(Big Data)
Tag:巨量數據(Big
Data)、海量數據(Big Data)、數據探勘(Data
Mining)、數據挖掘(Data
Mining)
一、定義
大數據(Big
Data)一詞最早出現在未來學家阿爾文•托夫勒《第三次浪潮》一書中,他在書中將“大數據”熱情地讚頌為“第三次浪潮的華彩樂章”。約從2009年開始,“大數據”成為網路資訊技術行業的流行詞彙。
大數據,或稱巨量數據、海量數據,是由數量巨大、結構複雜、類型眾多數據構成的數據集合,是基於雲計算的數據處理與應用模式,通過數據的集成共用,交叉複用形成的智力資源和知識服務能力。Viktor
Mayer-Schönberger在其所著的《Big Data》一書中,他將“大數據”定義為不使用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的一種分析方法。
此外,也有研究機構認為“大數據”是一種新的數據處理模式,具有更強的決策力、洞察發現力和流程優化能力,是一種海量、高增長率和多樣化的資訊資產。從某種程度上說,大數據是數據分析的前沿技術,具有從各種各樣類型的數據中,快速獲得有價值資訊的能力。
二、「大數據」的特質
對於大數據,目前通常認為有下述四大特質,稱為“四V”特質:
1.巨量(Volume
Big)
數據量級已從TB發展至PB乃至ZB,可稱海量、巨量乃至超量。
2.
多樣(Variable
Type)
數據類型繁多,愈來愈多為網頁、圖片、視頻、圖像與位置資訊等半結構化和非結構化數據資訊。
3.快速(Velocity
Fast)
數據流程往往為高速即時數據流,而且往往需要快速、持續的即時處理;處理工具亦在快速演進,軟體工程及人工智慧等均可能介入。
4.高價值和低密度(High
Value and Low Density)
以視頻安全監控為例,連續不斷的監控流中,有重大價值者可能僅為一兩秒的數據流程。
三、「大數據」的價值
參考文獻
《電視工程》編輯部(2013)。大數據。電視工程,4,57。
陳如明(2012)。大數據時代的挑戰、價值與應對策略。2012中國國際資訊通信展專刊,17,14-15。
百度百科(2014年5月)。大數據。檢自:http://baike.baidu.com/link?url=0A73afAkYrTiTriww8YYFQUwVgnOciip9UcGojG0Fc9cRtjuFK5VFYc6JUrKw_xc2LuZ3XO733QejddbIomzmq#15_1
。
Alvin
Toffler(1980).The Third Wave.New York:Morrow.
Cukier,
Kenneth & Mayer-Schonberger, Viktor(2013).Big Data.London: John Murray
訂閱:
文章 (Atom)