編者按:
在進入數(shù)字化時代后,各種新技術(shù)使信息的的傳遞和存儲變得迅速而快捷,但隨之也帶來了新的問題。由于技術(shù)的更新,一些過去產(chǎn)生的電子信息往往由于技術(shù)淘汰而丟失,因此做好重要信息的數(shù)字化存檔是一個重要任務(wù)。本文正是針對這一問題展開的,以ICSTI(國際科技信息協(xié)會)的有關(guān)研究為對象,以信息循環(huán)的各個階段為線索,通過對十八個重點實例的深入研究,分析并總結(jié)了數(shù)字化存檔現(xiàn)存的一些問題及解決之道。
一、 數(shù)字化存檔簡介
顧名思義,數(shù)字化存檔就是將信息以數(shù)字化形式實現(xiàn)電子存儲以供日后使用。但從實際運用的目的來看,很大一個目的就是為了防止信息,因技術(shù)更新而丟失,所以本文對數(shù)字化存檔的周期作了一個界定,研究的是數(shù)字化信息的長期存檔問題。
近幾十年電子技術(shù)的發(fā)展可謂突飛猛進,作者、出版商,甚至圖書館員,博物館員都已經(jīng)淘汰了紙與筆,而習(xí)慣運用電子手段來生成信息內(nèi)容。但作為技術(shù)的使用者他們往往無法認識到技術(shù)深層次的問題,因為他們關(guān)注的是信息生成和傳遞的速度,難易程度這樣一些眼前問題,而忽略了信息能否長期保存。事實上,這一問題非常關(guān)鍵,因為在電子模式下,信息的存儲不同于在紙或微縮膠片上那樣穩(wěn)定,信息內(nèi)容極易被損壞或更改。另外數(shù)字化存儲媒體周期短,與這一媒體密切聯(lián)系的各種硬件,軟件技術(shù)處于時刻更新狀態(tài),而且每一種數(shù)字化存儲模式都有相應(yīng)的硬、軟件技術(shù)支持,出了這一專有環(huán)境就無法使用??梢?,從長遠和實用的角度來看,都需要找到一種能夠長期存儲信息,并能廣泛使用這些信息的方式,這正是數(shù)字化存檔要解決的問題。
數(shù)字化這種新模式的出現(xiàn),也必然帶來產(chǎn)業(yè)結(jié)構(gòu)、工作分工的變化。以出版業(yè)為例,在傳統(tǒng)的印刷環(huán)境下,信息的生成、傳遞、存儲往往可以由出版商獨立完成。但現(xiàn)在就不同了,當技術(shù)在出版中充當越來越重要的角色時,出版商恐怕就無法獨立承擔(dān)這一責(zé)任了,尤其是數(shù)字化存檔,需要的不僅是昂貴的系統(tǒng)配置,還需要培養(yǎng)技術(shù)熟練的操作人員,這一切即使出版商有能力支付,恐怕也不會運作順當,何況從投資學(xué)原理上講這也不是明智的選擇。所以在新的數(shù)字化模式下,出版商往往會尋求新的技術(shù)合作伙伴,來進行數(shù)字化信息的生成、傳遞和存檔工作,這種角色轉(zhuǎn)換不僅可以減少出版商投資,而且還可能提高產(chǎn)品質(zhì)量。
二、ICSTI研究的背景及其方法
ICSTI,(國際科技信息協(xié)會,the International Council for Science and Technical Information),是加拿大一個科技信息組織,其成員包括國家圖書館、研究機構(gòu)、出版商和書目數(shù)據(jù)庫編寫者。ICSTI于1999年三月開始了一項有關(guān)數(shù)字化存檔的調(diào)研,其目的在于促進數(shù)字化存檔技術(shù)和實踐的發(fā)展,并讓更多的人意識到數(shù)字化存檔的重要性?;谕瑯拥淖谥?,CENDI工作組(CENDI,美國聯(lián)邦政府的一個科技信息管理工作組)的成員隨后也加入了這一研究。
在ICSTI和CENDI的領(lǐng)導(dǎo)下,研究圍繞一些有代表性的項目展開,通過和專家的接觸來調(diào)研這些項目。在接觸的超過30個項目中,有18個作為有代表意義的項目被送了出來,它們分別來自6個國家,其中9個來自美國,2個來自英國,加拿大、澳大利亞、瑞典和芬蘭各有一個,另外四個則來自國際組織。這18個項目性質(zhì)各有不同,有政府科技項目,有國家存檔,還有一些是國家圖書館,出版商及研究機構(gòu)開展的項目。
在調(diào)研這些項目過程中,項目工作人員們提出了各種問題,包括當前出現(xiàn)的存檔模式和一些不錯的嘗試。在探討中,研究人員關(guān)注點第一放在對實踐策略上,其次才是技術(shù)本身。
為了研究目的,研究人員將數(shù)字化存檔定位于長期存檔,而目其本是針對那些主要以電子形式生成與傳遞的信息,對于這些信息數(shù)字化版本才被當作是基本存檔。另外這次研究中不包括那些從其它媒體轉(zhuǎn)換過來的數(shù)字化材料,除非轉(zhuǎn)換后數(shù)字化版本成為基本版本。
三、信息循環(huán)各個階段的數(shù)字化存檔
信息循環(huán)的各個階段無非就是信息的生成、存檔信息的選取等,在各個階段性工作中,數(shù)字化存檔的特點、偏重都有所不同,下文將分別闡述。
(一)信息生成
信息生成就是生產(chǎn)信息產(chǎn)品的過程。所有項目的負責(zé)人都一致認為這過程實現(xiàn)長期存檔的初始階段,也就是說在這一階段就要意識到存檔的重要性,因為即使控制得再細心,如果沒考慮到存檔數(shù)字化信息也可能丟失。而且在信息生成階段的操作直接影響著最后的數(shù)字化存檔和保存,決定了這些工作的難易程度和可靠性。
另外,從調(diào)研項目的經(jīng)驗來看,創(chuàng)作人員也應(yīng)該參與到數(shù)字化存檔工作中,強化幾點認識對創(chuàng)作人員是極重要的。首先,創(chuàng)作人員要明白數(shù)字化存檔對數(shù)字化信息,保存和使用的重要性。因為創(chuàng)作人員更了解信息內(nèi)容本身,哪些最重要,哪些次之,創(chuàng)作人員的這些認識和估計對存檔選擇是一個很大的指示,所以建議創(chuàng)作人員提供這樣的保存指導(dǎo)。雖然這種指導(dǎo)無法取代具體的存檔選擇標準,但它會是一個很好的補充。
第二點就是要認識到如果在信息生成階段就充分考慮到格式、標準、對metadata的描述問題,其后存檔工作的效率會提高不少。以美國ORNL(Oak Ridge國家圖書館)項目為例,它們?yōu)閿?shù)字文件提供生成向?qū)?,對軟件及文件格式都作了特定限制,這樣長期,短期的信息管理都方便多了。
另外大多數(shù)項目負責(zé)人都認為最好在信息生成階段就生成metadata,或在編目階段進行,然而只有對于那些數(shù)字項目才能在生成階段就完成metadata,大多數(shù)項目中的metadata必須隨著數(shù)據(jù)流,通過測量和追蹤來產(chǎn)生。這些產(chǎn)生的metadata包括位置、儀器類型、和其它有關(guān)內(nèi)容。
對于小一些的數(shù)據(jù)組或圖像這樣的文件,它們的metadata則主要是隨后人工完成的,顯然只靠在信息生成階段產(chǎn)生metadata是不夠的,也有一些供應(yīng)商在文字處理器和數(shù)據(jù)庫產(chǎn)品中加入了XML和RDF結(jié)構(gòu),這使metadata作為項目原始生成一部分簡單多了。
相關(guān)資訊
-
近日,意大利全國性報紙《福利奧日報》稱其出版發(fā)行了全球首份、完全由生成式人工智能技術(shù)撰寫的報紙。 人工智能生成的報紙,以紙質(zhì)插頁的形式,夾在同一天發(fā)售的主報當中。在報頭上標有人工智能AI字樣。報紙文章的標題、摘要、內(nèi)容等均由人工智能生成。報社工作人員…
2025/3/27 8:04:12
共有 網(wǎng)友評論