国产91丝袜在线播放_偷拍亚洲色图_欧美精品久久一区二区_不卡日本视频

學(xué)術(shù)咨詢(xún)服務(wù),正當(dāng)時(shí)......期刊天空網(wǎng)是可靠的職稱(chēng)論文與著作咨詢(xún)指導(dǎo)平臺(tái)!!!

大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)化的前景展望:意義與困境

發(fā)布時(shí)間:所屬分類(lèi):管理論文瀏覽:1

摘 要: 摘 要 大數(shù)據(jù)時(shí)代興起的數(shù)據(jù)化浪潮引發(fā)檔案界對(duì)檔案數(shù)據(jù)化趨勢(shì)的關(guān)注。檔案數(shù)據(jù)化被認(rèn)為是檔案數(shù)字化發(fā)展的新階段,它是指檔案部門(mén)以用戶(hù)需求和業(yè)務(wù)需要為導(dǎo)向,將數(shù)字檔案資源轉(zhuǎn)換為可供閱讀、分析和處理的檔案數(shù)據(jù)資源的過(guò)程。檔案數(shù)據(jù)化對(duì)大數(shù)據(jù)時(shí)代檔案工作的數(shù)據(jù)

  摘  要  大數(shù)據(jù)時(shí)代興起的數(shù)據(jù)化浪潮引發(fā)檔案界對(duì)檔案數(shù)據(jù)化趨勢(shì)的關(guān)注。檔案數(shù)據(jù)化被認(rèn)為是檔案數(shù)字化發(fā)展的新階段,它是指檔案部門(mén)以用戶(hù)需求和業(yè)務(wù)需要為導(dǎo)向,將數(shù)字檔案資源轉(zhuǎn)換為可供閱讀、分析和處理的檔案數(shù)據(jù)資源的過(guò)程。檔案數(shù)據(jù)化對(duì)大數(shù)據(jù)時(shí)代檔案工作的數(shù)據(jù)轉(zhuǎn)型與縱深發(fā)展具有重要現(xiàn)實(shí)意義,它有助于突破檔案信息資源深度開(kāi)發(fā)瓶頸、創(chuàng)新以需求為導(dǎo)向的檔案服務(wù)模式以及推動(dòng)檔案管理業(yè)務(wù)流程實(shí)現(xiàn)智慧化。但由于諸多不確定性因素的存在,檔案數(shù)據(jù)化工作同樣面臨困境,主要體現(xiàn)為政策與動(dòng)力層面的困境、人才與技術(shù)層面的困境。

大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)化的前景展望:意義與困境

  關(guān)鍵詞  大數(shù)據(jù)  檔案數(shù)據(jù)化  檔案數(shù)字化  檔案信息資源開(kāi)發(fā)  智慧檔案館  檔案服務(wù)

  0 引 言

  計(jì)算機(jī)技術(shù)尤其是互聯(lián)網(wǎng)技術(shù)的出現(xiàn),推動(dòng)數(shù)字化的興起,帶來(lái)數(shù)字記憶儲(chǔ)存的革命;大數(shù)據(jù)技術(shù)的出現(xiàn),推動(dòng)數(shù)據(jù)化的興起,帶來(lái)的則是數(shù)據(jù)處理能力的革命。近年來(lái),大數(shù)據(jù)及隨之而來(lái)的數(shù)據(jù)化浪潮對(duì)檔案行業(yè)的沖擊已經(jīng)顯現(xiàn)。2016年印發(fā)的《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》認(rèn)識(shí)到國(guó)家大數(shù)據(jù)戰(zhàn)略對(duì)檔案工作理念、技術(shù)、方法及模式的深刻影響,并提出要采用大數(shù)據(jù)、智慧管理等技術(shù),提高檔案館業(yè)務(wù)信息化和檔案信息資源深度開(kāi)發(fā)與服務(wù)水平[1]。檔案數(shù)據(jù)化成為檔案界新的研究關(guān)注點(diǎn),有學(xué)者試圖強(qiáng)調(diào)檔案的“數(shù)據(jù)”價(jià)值,認(rèn)為在數(shù)據(jù)時(shí)代要把檔案看作需要挖掘的數(shù)據(jù)集合[2],要通過(guò)數(shù)據(jù)化使檔案成為有價(jià)值的數(shù)據(jù)[3];也有學(xué)者以檔案信息資源的挖掘或深度開(kāi)發(fā)為切入點(diǎn),強(qiáng)調(diào)對(duì)檔案數(shù)字化成果進(jìn)行進(jìn)一步的數(shù)據(jù)化開(kāi)發(fā)[4][5][6],認(rèn)為只有轉(zhuǎn)化為“數(shù)據(jù)態(tài)”,才能進(jìn)行檔案數(shù)據(jù)的關(guān)聯(lián)、挖掘和分析,實(shí)現(xiàn)檔案的數(shù)據(jù)價(jià)值[7];還有學(xué)者基于創(chuàng)新檔案服務(wù)模式的需求提出要推動(dòng)檔案數(shù)字化向數(shù)據(jù)化的轉(zhuǎn)變[8]。這些研究成果共同揭示了檔案數(shù)據(jù)化趨勢(shì)的到來(lái),但未深入剖析檔案數(shù)據(jù)化的內(nèi)涵與發(fā)展前景。基于此,本文將闡釋檔案數(shù)據(jù)化的內(nèi)涵,并展望大數(shù)據(jù)時(shí)代推進(jìn)檔案數(shù)據(jù)化的意義與困境,以期對(duì)數(shù)據(jù)轉(zhuǎn)型時(shí)期的檔案工作和檔案學(xué)研究有所啟示。

  1 數(shù)據(jù)化趨勢(shì)與檔案數(shù)據(jù)化內(nèi)涵

  1.1  數(shù)據(jù)化趨勢(shì)

  2 0世紀(jì)9 0年代至21世紀(jì)的前10年,數(shù)字化(digitization)代表了信息化發(fā)展趨勢(shì)。數(shù)字化實(shí)現(xiàn)了模擬態(tài)向數(shù)字態(tài)的轉(zhuǎn)換,進(jìn)而推動(dòng)著社會(huì)的數(shù)字(化)轉(zhuǎn)型[9]。誠(chéng)然,數(shù)字化將模擬世界帶入了數(shù)字環(huán)境,它使人類(lèi)社會(huì)能夠存儲(chǔ)更多的信息,并進(jìn)行更快地處理。但在數(shù)字時(shí)代,數(shù)字信息仍被當(dāng)作模擬物對(duì)待,常被用于相同的“單一目的”,且收集這些信息的目的與其價(jià)值捆綁在一起。[10]大數(shù)據(jù)引發(fā)廣泛關(guān)注后,數(shù)據(jù)化成為一個(gè)頗為流行的術(shù)語(yǔ)和趨勢(shì)。2013年,維克托·邁爾-舍恩伯格(Viktor MayerSchonberger)和肯尼思·庫(kù)克耶(Kenneth Cukier)將 “數(shù)據(jù)化”(datafication)作為一個(gè)有特定內(nèi)涵的專(zhuān)業(yè)術(shù)語(yǔ)引入大眾的視野。當(dāng)前,學(xué)界通常從三個(gè)角度來(lái)解讀數(shù)據(jù)化:

  首先,數(shù)據(jù)化代表一種技術(shù)趨勢(shì),它將我們生活的許多方面轉(zhuǎn)化為計(jì)算機(jī)化的數(shù)據(jù)。邁爾-舍恩伯格和庫(kù)克耶認(rèn)為數(shù)據(jù)化將社會(huì)行為轉(zhuǎn)化為在線(xiàn)量化數(shù)據(jù),以實(shí)現(xiàn)實(shí)時(shí)跟蹤和預(yù)測(cè)分析[10]。也有學(xué)者認(rèn)為數(shù)據(jù)化是將均勻、連續(xù)的數(shù)字比特結(jié)構(gòu)化和顆粒化,形成標(biāo)準(zhǔn)化的、開(kāi)放的、非線(xiàn)性的、通用的數(shù)據(jù)對(duì)象,并基于不同形態(tài)與類(lèi)別的數(shù)據(jù)對(duì)象,實(shí)現(xiàn)相關(guān)應(yīng)用,開(kāi)展相關(guān)活動(dòng)[11]。其次,數(shù)據(jù)化描述了一種組織趨勢(shì),它將組織轉(zhuǎn)化為數(shù)據(jù)驅(qū)動(dòng)型組織,形成新的價(jià)值創(chuàng)造形式。馬克·萊西特(Mark Lycett)將“數(shù)據(jù)化”理解為一種由I T驅(qū)動(dòng)的價(jià)值創(chuàng)造過(guò)程。[12]也有學(xué)者指出數(shù)據(jù)化是指將組織轉(zhuǎn)換為數(shù)據(jù)驅(qū)動(dòng)企業(yè)所使用的集體工具、技術(shù)和流程[13]。此外,數(shù)據(jù)化是一種社會(huì)變革趨勢(shì)。有學(xué)者表示,數(shù)據(jù)化是全球化背景下,人類(lèi)社會(huì)在數(shù)字時(shí)代的發(fā)展趨勢(shì)。它是人類(lèi)在信息傳播、人際交往乃至日常生活過(guò)程中,為了便于溝通、傳播和保存,將一切客觀存在處理為數(shù)據(jù),進(jìn)而使得整個(gè)人類(lèi)社會(huì)成為一個(gè)龐大的數(shù)據(jù)庫(kù)。[14]在大數(shù)據(jù)時(shí)代,萬(wàn)物皆數(shù)據(jù),一切皆可量化,世界的本質(zhì)是數(shù)據(jù),數(shù)據(jù)與物質(zhì)、能量一起成為構(gòu)成世界的三要素。[15]

  上述從技術(shù)、組織和社會(huì)角度對(duì)數(shù)據(jù)化的解讀,揭示出數(shù)據(jù)(化)轉(zhuǎn)型的發(fā)展趨勢(shì)。這種廣義上的數(shù)據(jù)化趨勢(shì),主要描繪的是網(wǎng)絡(luò)空間中新的數(shù)據(jù)形成與處理方式,例如環(huán)境感知數(shù)據(jù)、科學(xué)觀測(cè)數(shù)據(jù)、物聯(lián)網(wǎng)大數(shù)據(jù)、用戶(hù)生成數(shù)據(jù)、網(wǎng)絡(luò)和社交媒體數(shù)據(jù)以及對(duì)這些數(shù)據(jù)的收集、聚合、量化與分析。而數(shù)據(jù)(化)轉(zhuǎn)型趨勢(shì)無(wú)疑會(huì)對(duì)檔案館、圖書(shū)館等傳統(tǒng)的館藏機(jī)構(gòu)以及企業(yè)文檔信息部門(mén)帶來(lái)影響和沖擊。近幾年,我國(guó)檔案界已經(jīng)認(rèn)識(shí)到大數(shù)據(jù)與數(shù)據(jù)化趨勢(shì)給檔案工作帶來(lái)的影響。2016年,國(guó)家檔案局印發(fā)的《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中表明了檔案行業(yè)應(yīng)對(duì)大數(shù)據(jù)挑戰(zhàn)的國(guó)家態(tài)度。 2018年,國(guó)家檔案局局長(zhǎng)李明華對(duì)我國(guó)檔案工作趨勢(shì)的闡述也從側(cè)面揭示出檔案數(shù)據(jù)化的趨勢(shì),他指出:“我國(guó)檔案工作正經(jīng)歷一個(gè)從接收保管紙質(zhì)檔案到接收保管電子檔案,從管檔案實(shí)體到管檔案數(shù)據(jù),從手工操作到信息化智能化操作,從檔案資源分散利用到聯(lián)網(wǎng)共享的變革過(guò)程”。[16]

  受數(shù)據(jù)化趨勢(shì)的影響,越來(lái)越多的檔案界人士認(rèn)識(shí)到檔案數(shù)據(jù)化將成為檔案數(shù)字化的新方向或新階段[8]。湖南省檔案局局長(zhǎng)胡振榮將我國(guó)檔案數(shù)字化的發(fā)展歷程劃分為三個(gè)階段:第一個(gè)階段是檔案目錄數(shù)字化,致力于建立目錄數(shù)據(jù)庫(kù);第二個(gè)階段是全文數(shù)字化,即將檔案全文掃描成數(shù)字圖像;第三個(gè)階段是全文數(shù)據(jù)化,即將所有的圖像轉(zhuǎn)換成文本數(shù)據(jù),形成可全文檢索的文本數(shù)據(jù)庫(kù)[17]。而他所稱(chēng)的檔案數(shù)字化的第三階段,實(shí)質(zhì)上就是檔案數(shù)據(jù)化的初級(jí)階段。錢(qián)毅站在館藏機(jī)構(gòu)視角,認(rèn)為狹義的數(shù)據(jù)化指的是針對(duì)數(shù)字化成果進(jìn)行的數(shù)據(jù)著錄、抽取與掛接工作,工作成果表現(xiàn)為積累形成大量的二次文獻(xiàn)數(shù)據(jù)庫(kù)。[9]這種狹義的數(shù)據(jù)化實(shí)際上就是從數(shù)字態(tài)轉(zhuǎn)化到數(shù)據(jù)態(tài)的過(guò)程。參考錢(qián)毅對(duì)數(shù)據(jù)化的解讀,筆者認(rèn)為,數(shù)據(jù)化趨勢(shì)對(duì)檔案工作的直接影響體現(xiàn)在數(shù)字態(tài)的數(shù)字檔案資源進(jìn)一步向數(shù)據(jù)態(tài)的檔案數(shù)據(jù)資源的轉(zhuǎn)換中。因此,從狹義上理解檔案數(shù)據(jù)化更切合我國(guó)檔案工作的實(shí)際。

  1.2  檔案數(shù)據(jù)化內(nèi)涵

  “數(shù)字化”是數(shù)字時(shí)代的高頻詞匯,它是指“將模擬信息轉(zhuǎn)換成電腦可以處理的用0和1表示的二進(jìn)制代碼”[18],其對(duì)應(yīng)的基本單元是比特(bit),而數(shù)據(jù)化對(duì)應(yīng)的典型對(duì)象則是字節(jié)(byte)和字(word)。可見(jiàn),數(shù)據(jù)化內(nèi)生于數(shù)字化,又區(qū)別于數(shù)字化。近幾年,在數(shù)據(jù)化趨勢(shì)的沖擊下,檔案數(shù)據(jù)化也逐漸成為檔案界關(guān)注的新詞匯。很多學(xué)者從數(shù)字化檔案的數(shù)據(jù)化加工角度對(duì)檔案數(shù)據(jù)化概念進(jìn)行了狹義上的理解,認(rèn)為檔案數(shù)據(jù)化是在數(shù)字化的基礎(chǔ)上,用光學(xué)識(shí)別(OCR)、語(yǔ)音識(shí)別(ASR)等技術(shù)對(duì)圖像、音視頻中的數(shù)字內(nèi)容進(jìn)行全文識(shí)別、分類(lèi)、著錄、標(biāo)引等工作,形成結(jié)構(gòu)化數(shù)據(jù),并建立目錄數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)和媒體資源庫(kù),使檔案資源內(nèi)容為計(jì)算機(jī)所掛接、存取、調(diào)用、更新、分析和處理,使其能用檢索詞進(jìn)行檢索的過(guò)程。[3][6][8]也有學(xué)者認(rèn)為檔案數(shù)據(jù)化不僅是數(shù)字化檔案的數(shù)據(jù)化加工范疇,還包括數(shù)據(jù)的結(jié)構(gòu)化解析、應(yīng)用級(jí)封裝、媒體化組織和全鏈?zhǔn)焦芾磉^(guò)程[19]。

  青島市檔案局承擔(dān)的國(guó)家檔案局科技項(xiàng)目“大數(shù)據(jù)背景下檔案信息資源挖掘策略與方法研究”對(duì)檔案數(shù)字化與檔案數(shù)據(jù)化進(jìn)行了比較,指出早期檔案數(shù)字化的主要目的是獲取圖像格式的檔案數(shù)字化成果,對(duì)檔案內(nèi)容的控制和利用主要通過(guò)檔案目錄數(shù)據(jù)庫(kù)加以實(shí)現(xiàn),形成典型的“數(shù)字圖像+檔案目錄數(shù)據(jù)庫(kù)”檔案數(shù)字化模式。這種模式滿(mǎn)足了傳統(tǒng)載體檔案計(jì)算機(jī)閱讀的需要,并沒(méi)有直接解決檔案內(nèi)容的控制與開(kāi)發(fā)利用問(wèn)題。檔案數(shù)據(jù)化則是指將檔案信息轉(zhuǎn)化為計(jì)算機(jī)可以閱讀和理解的檔案信息資源的過(guò)程。其目的是實(shí)現(xiàn)計(jì)算機(jī)自動(dòng)分析、理解和處置檔案信息,將利用檔案的途徑由“頁(yè)面閱讀”轉(zhuǎn)變?yōu)?ldquo;內(nèi)容控制”“信息開(kāi)發(fā)”。其實(shí)現(xiàn)的途徑是由計(jì)算機(jī)識(shí)讀檔案文字,進(jìn)而借助智慧化的工具轉(zhuǎn)換成計(jì)算機(jī)可以理解的內(nèi)容,實(shí)現(xiàn)檔案利用價(jià)值的深度開(kāi)發(fā)。[4]

  當(dāng)然,相關(guān)領(lǐng)域?qū)W者也已認(rèn)識(shí)到數(shù)字化與數(shù)據(jù)化的聯(lián)系與區(qū)別。有學(xué)者對(duì)圖書(shū)館館藏資源數(shù)字化與數(shù)據(jù)化的內(nèi)涵進(jìn)行了比較分析,指出館藏資源數(shù)字化是把紙質(zhì)文獻(xiàn)變成計(jì)算機(jī)可讀取的比特流數(shù)據(jù),簡(jiǎn)言之就是把書(shū)籍內(nèi)容整體數(shù)字化,把紙上的東西搬到計(jì)算機(jī)顯示器上閱讀和編輯。館藏資源數(shù)據(jù)化則是把計(jì)算機(jī)可識(shí)別文本內(nèi)容中的字、詞、句、段落、圖像以及各種概念、公式、數(shù)據(jù)等知識(shí)單元進(jìn)行分割和提取,并建立知識(shí)單元之間的各種關(guān)聯(lián),從而進(jìn)行無(wú)窮無(wú)盡的檢索、分析與挖掘。數(shù)字化是館藏資源描述方式的電子化,資源的載體形態(tài)發(fā)生了轉(zhuǎn)變;而數(shù)據(jù)化則是對(duì)館藏資源內(nèi)容的重新拆分與組合,資源內(nèi)容的組織粒度發(fā)生了根本轉(zhuǎn)變。[20] 也有學(xué)者指出數(shù)字化、數(shù)據(jù)化、文本挖掘是歷史文獻(xiàn)數(shù)據(jù)庫(kù)的三種不同形態(tài)。數(shù)字化是將文獻(xiàn)從物理形態(tài)轉(zhuǎn)化為電子形態(tài),數(shù)據(jù)化是將電子形態(tài)進(jìn)一步轉(zhuǎn)換為可識(shí)別的文本與可分析的數(shù)據(jù),文本挖掘則是針對(duì)文本、數(shù)據(jù)做進(jìn)一步的計(jì)量分析、相關(guān)性分析和GIS分析。數(shù)據(jù)化的意義是將利用文獻(xiàn)的方式從“讀”轉(zhuǎn)變?yōu)?ldquo;分析”,其核心方法是重組文獻(xiàn)內(nèi)容,置入使用者所建立的新的文本或數(shù)據(jù)結(jié)構(gòu)中,也即文獻(xiàn)的結(jié)構(gòu)化。[21]例如,谷歌掃描圖書(shū)的方式允許全文搜索,存儲(chǔ)文本的方式允許人們?cè)趲酌腌妰?nèi)在數(shù)百萬(wàn)本書(shū)中搜索特定的單詞或短語(yǔ)。它對(duì)圖書(shū)的內(nèi)容進(jìn)行了數(shù)據(jù)支持的分析,而這就超越了單純的文獻(xiàn)數(shù)字化[22];日本對(duì)馬克思、恩格斯文獻(xiàn)的數(shù)據(jù)化處理不僅僅停留在數(shù)字化、文本化方面,而是將批注與其所解讀的文本相鏈接,以實(shí)現(xiàn)視覺(jué)化展示和理解為目的。[23]

  通過(guò)上述界定和比較分析可以看出,檔案數(shù)據(jù)化將數(shù)字化檔案的加工推向“數(shù)據(jù)開(kāi)發(fā)”階段。筆者認(rèn)為需要從“開(kāi)發(fā)”的視角對(duì)檔案數(shù)據(jù)化進(jìn)行狹義上的理解。它主要是指檔案部門(mén)以用戶(hù)需求和業(yè)務(wù)需要為導(dǎo)向,將數(shù)字檔案資源(包括數(shù)字化轉(zhuǎn)換形成的數(shù)字檔案資源和歸檔電子文件)轉(zhuǎn)換為可供閱讀、分析和處理的檔案數(shù)據(jù)資源的過(guò)程。“檔案數(shù)據(jù)化”與“檔案數(shù)字化”不同,如果說(shuō)檔案數(shù)字化是將處于模擬態(tài)的檔案對(duì)象轉(zhuǎn)換成用0和1表示、以二進(jìn)制碼表示的數(shù)字態(tài)檔案,以供計(jì)算機(jī)識(shí)別和讀取,那么檔案數(shù)據(jù)化則是將數(shù)字態(tài)檔案進(jìn)一步轉(zhuǎn)變?yōu)榭芍票矸治龅臄?shù)據(jù)態(tài)檔案,實(shí)現(xiàn)計(jì)算機(jī)可理解可分析的過(guò)程。檔案數(shù)字化是數(shù)據(jù)化的基礎(chǔ),但是數(shù)據(jù)化在對(duì)數(shù)據(jù)信息的識(shí)別和處理上的功能之強(qiáng)大,是數(shù)字化所不能替代的。因此,筆者同樣認(rèn)為檔案數(shù)據(jù)化將是檔案數(shù)字化發(fā)展的新階段。盡管當(dāng)前檔案工作的主流認(rèn)識(shí)和工作重點(diǎn)還停留在數(shù)字化階段,但檔案數(shù)據(jù)化已經(jīng)引起檔案界的關(guān)注。檔案部門(mén)要突破檔案數(shù)字化階段對(duì)檔案信息開(kāi)發(fā)利用不完全的瓶頸,就需要在檔案數(shù)字化的基礎(chǔ)上實(shí)現(xiàn)檔案數(shù)據(jù)化。所以檔案數(shù)據(jù)化和數(shù)字化并不是對(duì)立的,而是承接與完善的發(fā)展過(guò)程。

  2 推進(jìn)檔案數(shù)據(jù)化進(jìn)程的意義

  在數(shù)據(jù)時(shí)代,通過(guò)數(shù)據(jù)來(lái)實(shí)現(xiàn)決策和改善業(yè)務(wù)、通過(guò)數(shù)據(jù)來(lái)揭示歷史和文化“現(xiàn)象”都會(huì)給檔案工作帶來(lái)一定的影響。首先,大數(shù)據(jù)分析能實(shí)現(xiàn)對(duì)多源異構(gòu)的低密度價(jià)值數(shù)據(jù)資源的深層次開(kāi)發(fā)。相較于社交媒體大數(shù)據(jù)等來(lái)自外部的大數(shù)據(jù),作為企業(yè)內(nèi)部資產(chǎn)且具有高密度價(jià)值的檔案資源由于缺乏數(shù)據(jù)化,而長(zhǎng)時(shí)間被置于無(wú)用的暗數(shù)據(jù)行列。要實(shí)現(xiàn)檔案數(shù)據(jù)資源的價(jià)值,就要實(shí)現(xiàn)檔案數(shù)據(jù)化處理。其次,隨著智慧檔案館從理念走向?qū)嵺`,智慧鑒定、智慧標(biāo)引、智慧檢索、智慧編研等檔案業(yè)務(wù)智慧化的實(shí)現(xiàn)也對(duì)檔案數(shù)據(jù)化提出了要求。此外,數(shù)字人文學(xué)科對(duì)大量歷史和文化數(shù)據(jù)集的需求同樣是促成檔案數(shù)據(jù)化的動(dòng)力因素。

  近年來(lái),檔案界已經(jīng)注意到檔案數(shù)據(jù)化的機(jī)遇,有學(xué)者提出“為大數(shù)據(jù)分析提供基礎(chǔ)數(shù)據(jù)是檔案工作在信息時(shí)代的價(jià)值所在”[24],而只有檔案數(shù)據(jù)化之后,檔案大數(shù)據(jù)的數(shù)據(jù)基礎(chǔ)才奠定起來(lái),才有可能去討論檔案的數(shù)據(jù)挖掘與數(shù)據(jù)的深度整合[8];也有學(xué)者強(qiáng)調(diào)要通過(guò)“檔案數(shù)據(jù)化引領(lǐng)服務(wù)模式創(chuàng)新”,檔案部門(mén)的傳統(tǒng)業(yè)務(wù)將向檔案資源的數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉(zhuǎn)移,對(duì)大量數(shù)據(jù)的分析與處理將成為檔案部門(mén)的主要業(yè)務(wù)[25]。筆者認(rèn)為,對(duì)檔案部門(mén)(包括企事業(yè)單位檔案部門(mén)以及國(guó)家綜合檔案館)而言,需要明確自身在數(shù)據(jù)時(shí)代的職能定位,既要提供高質(zhì)量的檔案數(shù)據(jù)資源、數(shù)據(jù)服務(wù)和知識(shí)服務(wù),也要探索數(shù)據(jù)時(shí)代改善業(yè)務(wù)能力、服務(wù)水平,提升檔案利用率、提高工作效率的技術(shù)方法。因此,在數(shù)據(jù)時(shí)代,檔案部門(mén)需要以開(kāi)發(fā)為導(dǎo)向重新認(rèn)識(shí)檔案數(shù)據(jù)資源的價(jià)值,通過(guò)深層次的檔案數(shù)據(jù)化開(kāi)發(fā),實(shí)現(xiàn)數(shù)字檔案資源從機(jī)器讀取到機(jī)器理解的轉(zhuǎn)變,為企業(yè)或政府基于數(shù)據(jù)分析的決策提供有價(jià)值的檔案數(shù)據(jù)資源;為檔案部門(mén)業(yè)務(wù)工作智慧化轉(zhuǎn)型(智能鑒定、智慧編研等)奠定基礎(chǔ);并面向數(shù)字人文、政府決策、社會(huì)治理提供數(shù)據(jù)服務(wù)、知識(shí)服務(wù)和智庫(kù)服務(wù)。因此,大數(shù)據(jù)時(shí)代推進(jìn)檔案數(shù)據(jù)化進(jìn)程具有重要現(xiàn)實(shí)意義。

  2.1  有助于突破檔案信息資源深度開(kāi)發(fā)的瓶頸

  檔案信息資源的深度開(kāi)發(fā)一直以來(lái)都是困擾檔案部門(mén)的瓶頸問(wèn)題。從開(kāi)發(fā)方式上看,圖書(shū)情報(bào)界所言信息資源開(kāi)發(fā)利用的方式一般包括“分類(lèi)序化、數(shù)字化、網(wǎng)絡(luò)化、分析研究、知識(shí)挖掘、提供服務(wù)與進(jìn)入決策”[26]。相比之下,檔案信息資源開(kāi)發(fā)利用主要強(qiáng)調(diào)的是檔案檢索和檔案編研兩個(gè)環(huán)節(jié),其中前者是對(duì)檔案信息的淺加工,后者是對(duì)檔案信息的深加工。[27]然而,當(dāng)前以檢索、編研為核心的檔案信息資源開(kāi)發(fā)深度明顯不足。檔案部門(mén)擁有大量有價(jià)值的 “一手資料”,且檔案編研工作早已成為檔案部門(mén)的常規(guī)性工作,但始終難以突破“有編無(wú)研”的瓶頸。檔案數(shù)字化曾為檔案信息資源開(kāi)發(fā)帶來(lái)曙光,因?yàn)樗纫獜?qiáng)調(diào)將檔案信息從檔案實(shí)體剝離并存儲(chǔ)在數(shù)字載體上,也要強(qiáng)調(diào)對(duì)數(shù)字化檔案的重新組織并實(shí)現(xiàn)序化與內(nèi)容的開(kāi)發(fā)。但當(dāng)前我國(guó)檔案數(shù)字化實(shí)踐往往只強(qiáng)調(diào)前者,也就是實(shí)現(xiàn)“模數(shù)轉(zhuǎn)換”的數(shù)字化加工。伴隨著檔案數(shù)字化工作的不斷推進(jìn),不少檔案機(jī)構(gòu)已進(jìn)入“后數(shù)字化”階段,管控著大量以PDF、圖片格式保存的數(shù)字檔案資源,但這些資源大多停留在簡(jiǎn)單的組織、檢索、利用層面,內(nèi)容層面的開(kāi)發(fā)與挖掘還未引起足夠重視。[28]可見(jiàn),檔案數(shù)字化雖大大提升了檔案部門(mén)的存取能力,但未能突破檔案編研的困境。

  如果進(jìn)一步從開(kāi)發(fā)層次來(lái)審視,可知檔案數(shù)字化開(kāi)發(fā)層次與檔案數(shù)字化加工深度密切相關(guān)。參考古籍?dāng)?shù)字化領(lǐng)域?qū)偶當(dāng)?shù)字化開(kāi)發(fā)層次的劃分方式[29],本文以紙質(zhì)檔案為例,將檔案數(shù)字化開(kāi)發(fā)深度分為四個(gè)層次(見(jiàn)表1)。其中,第一層是解決紙質(zhì)檔案的掃描錄入和數(shù)字化存儲(chǔ)問(wèn)題;第二層是基本上解決數(shù)字化檔案資源的網(wǎng)絡(luò)發(fā)布和檢索問(wèn)題;第三層是檔案內(nèi)容的淺層標(biāo)注與數(shù)據(jù)化處理;第四層是檔案智能檢索和智慧編研。數(shù)字化后的檔案雖然改變了檔案的存在形式、拓寬了檔案信息獲取渠道,但是究其本質(zhì),“存”的是檔案本身、“取”的是檔案內(nèi)容,并沒(méi)有實(shí)現(xiàn)對(duì)檔案信息資源的進(jìn)一步開(kāi)發(fā)。當(dāng)前,我國(guó)大部分機(jī)構(gòu)的檔案數(shù)字化開(kāi)發(fā)層次仍停留在“表層”,檔案數(shù)字化為計(jì)算機(jī)檢索提供了基礎(chǔ),但由于數(shù)字化技術(shù)的限制,無(wú)法對(duì)檔案信息進(jìn)行計(jì)算機(jī)識(shí)別和處理,使檔案數(shù)字化停滯于數(shù)據(jù)領(lǐng)域之外。

  以國(guó)家綜合檔案館為例,為推動(dòng)國(guó)家重點(diǎn)檔案工作的重心向“保護(hù)與開(kāi)發(fā)”轉(zhuǎn)變,國(guó)家檔案局于 2016年先后發(fā)布《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》《“十三五”時(shí)期國(guó)家重點(diǎn)檔案保護(hù)與開(kāi)發(fā)工作總體規(guī)劃》,對(duì)國(guó)家重點(diǎn)檔案的開(kāi)發(fā)工作進(jìn)行規(guī)劃和統(tǒng)籌。要求加強(qiáng)國(guó)家重點(diǎn)檔案開(kāi)發(fā)力度,每年安排若干重大專(zhuān)題進(jìn)行檔案開(kāi)發(fā),開(kāi)展國(guó)家重點(diǎn)檔案目錄資源基礎(chǔ)體系建設(shè)。但目前看來(lái),國(guó)家重點(diǎn)檔案信息資源開(kāi)發(fā)的主要任務(wù),還是對(duì)國(guó)家重點(diǎn)檔案進(jìn)行信息采集、著錄并建設(shè)目錄數(shù)據(jù)庫(kù)、專(zhuān)題數(shù)據(jù)庫(kù)等,側(cè)重點(diǎn)仍在信息資源的采集、加工、組織和信息化管理方面,而利用國(guó)家重點(diǎn)檔案信息資源發(fā)現(xiàn)新信息、新知識(shí)等高級(jí)形式的開(kāi)發(fā)尚未充分開(kāi)展。[30]基于此,有學(xué)者提出“國(guó)家重點(diǎn)檔案信息資源融合”理念,強(qiáng)調(diào)借助信息融合技術(shù)對(duì)國(guó)家重點(diǎn)檔案信息資源進(jìn)行綜合處理與協(xié)同利用,從而生成新的信息空間和知識(shí)架構(gòu)。[31]

  總之,按照馬費(fèi)成教授和靖繼鵬教授對(duì)信息資源開(kāi)發(fā)步驟的闡述[26],當(dāng)前檔案數(shù)字化開(kāi)發(fā)仍處于 “載體開(kāi)發(fā)”階段,屬于基礎(chǔ)性開(kāi)發(fā),而下一步將進(jìn)入“內(nèi)容開(kāi)發(fā)”階段,要將數(shù)據(jù)挖掘、知識(shí)組織等技術(shù)引入開(kāi)發(fā)當(dāng)中。因此,部署實(shí)施檔案數(shù)據(jù)化工作,有助于在數(shù)字化基礎(chǔ)上進(jìn)一步推進(jìn)檔案信息資源在數(shù)據(jù)層級(jí)的深度開(kāi)發(fā),實(shí)現(xiàn)檔案數(shù)據(jù)資源的融合、關(guān)聯(lián)、挖掘與分析,推動(dòng)檔案知識(shí)發(fā)現(xiàn)和知識(shí)服務(wù)的開(kāi)展,而這也將為國(guó)家重點(diǎn)檔案信息資源的深度開(kāi)發(fā)提供一條可行路徑。[32]

  2.2  有助于創(chuàng)新以需求為導(dǎo)向的檔案服務(wù)模式

  不斷滿(mǎn)足社會(huì)需求是檔案服務(wù)的永恒主題。長(zhǎng)期以來(lái)檔案部門(mén)雖然開(kāi)發(fā)出檔案查閱、檔案編研、檔案展覽、跨館出證、信息推送、參考咨詢(xún)等多種服務(wù)方式,但這些服務(wù)方式很難滿(mǎn)足新時(shí)期檔案用戶(hù)對(duì)網(wǎng)絡(luò)化、便捷化、高效化、知識(shí)化和個(gè)性化服務(wù)的需求。大數(shù)據(jù)時(shí)代的到來(lái),有學(xué)者認(rèn)為要利用大數(shù)據(jù)技術(shù),對(duì)用戶(hù)身份、借閱內(nèi)容、存儲(chǔ)行為、搜索方式、言行記錄等結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,挖掘預(yù)測(cè)用戶(hù)隱性訴求,改善服務(wù)方式,使得關(guān)聯(lián)服務(wù)、精準(zhǔn)服務(wù)、跟蹤服務(wù)、知識(shí)服務(wù)成為可能,從而提升服務(wù)能級(jí),實(shí)現(xiàn)檔案服務(wù)的人性化和知識(shí)化,從“供給導(dǎo)向”服務(wù)模式向以用戶(hù)為中心的 “需求導(dǎo)向”服務(wù)模式轉(zhuǎn)變。[33]誠(chéng)然,以需求為導(dǎo)向的檔案服務(wù)模式寄予了檔案學(xué)界對(duì)大數(shù)據(jù)時(shí)代檔案服務(wù)創(chuàng)新的厚望,但檔案服務(wù)的創(chuàng)新離不開(kāi)檔案資源開(kāi)發(fā)端的努力,檔案資源開(kāi)發(fā)的程度將直接影響檔案服務(wù)的能力和質(zhì)量。

  黨躍武教授指出檔案資源開(kāi)發(fā)是指為了滿(mǎn)足不同的檔案需求,對(duì)各種載體和形式的檔案和檔案集合進(jìn)行加工處理,以形成各種檔案產(chǎn)品或服務(wù)的過(guò)程。其根本目的在于,深入發(fā)掘檔案資源中蘊(yùn)藏的有利用價(jià)值的檔案信息,尋找和獲取更為系統(tǒng)或特定價(jià)值的知識(shí)和智慧,有效提供給社會(huì)各領(lǐng)域的具有特定需求的檔案用戶(hù),從而實(shí)現(xiàn)檔案資源和檔案用戶(hù)的需求對(duì)接、資源關(guān)聯(lián)和服務(wù)匹配。[34]傳統(tǒng)的檔案服務(wù)在很大程度上依賴(lài)于著錄標(biāo)引深度以及文件目錄、案卷目錄、專(zhuān)題目錄、專(zhuān)題指南、全宗指南等檢索工具的編制。隨著檔案數(shù)字化工作的推進(jìn),基于元數(shù)據(jù)的數(shù)字檔案資源的標(biāo)引成為一種成熟的技術(shù),它對(duì)于數(shù)字檔案資源的著錄描述、檢索、管理和長(zhǎng)期保存具有重要意義。當(dāng)前,不僅可以通過(guò)對(duì)檔案案卷級(jí)和文件級(jí)目錄著錄項(xiàng)進(jìn)行基本檢索,也可以關(guān)鍵詞檢索、主題檢索、元數(shù)據(jù)檢索、全文檢索等。盡管如此,仍無(wú)法對(duì)信息單元的復(fù)雜特征及信息單元間的復(fù)雜語(yǔ)義關(guān)系進(jìn)行定義、分析和識(shí)別。有學(xué)者提出在大數(shù)據(jù)時(shí)代,檔案工作要善于運(yùn)用數(shù)據(jù)挖掘技術(shù)分析檔案數(shù)據(jù),從海量數(shù)據(jù)中揭示出隱含潛在價(jià)值的信息,實(shí)現(xiàn)檔案信息智能檢索服務(wù)、檔案信息決策服務(wù)。[35]數(shù)據(jù)分析和數(shù)據(jù)挖掘確實(shí)可以作為檔案業(yè)務(wù)的拓展,也是檔案服務(wù)創(chuàng)新的重要內(nèi)容[8]。以企業(yè)檔案為例,利用大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)進(jìn)行聚類(lèi)、分類(lèi)和相關(guān)性分析,找到數(shù)據(jù)間的關(guān)系,建立數(shù)據(jù)模型,可為企業(yè)生產(chǎn)經(jīng)營(yíng)提供多角度和全方位的服務(wù)[36]。

  然而,值得注意的是檔案數(shù)字化雖實(shí)現(xiàn)了為檔案制作數(shù)字化副本和網(wǎng)絡(luò)環(huán)境下的檔案獲取,但檔案數(shù)字化并沒(méi)有從根本上改變檔案服務(wù)被動(dòng)性。數(shù)字化后的檔案文本存在兩方面缺陷:一是數(shù)字化文本仍然需要用戶(hù)有意識(shí)地進(jìn)行檢索,沒(méi)有建立檔案信息間完整的聯(lián)系;二是數(shù)字化文本中信息依然只能依靠人的閱讀,才能轉(zhuǎn)化為有用的信息。檔案數(shù)據(jù)化能通過(guò)計(jì)算機(jī)識(shí)別數(shù)字圖像的光學(xué)字符,將數(shù)字化檔案轉(zhuǎn)化成數(shù)據(jù),進(jìn)而分析檔案數(shù)據(jù)的信息。——論文作者:趙  躍

熱門(mén)核心期刊

sci|ssci服務(wù)

EI|SCOPUS服務(wù)

翻譯潤(rùn)色解答

論文發(fā)表指導(dǎo)

學(xué)術(shù)成果常識(shí)

最新分區(qū)查詢(xún)?nèi)肟?/a>
国产91丝袜在线播放_偷拍亚洲色图_欧美精品久久一区二区_不卡日本视频
日韩图片一区| 久久se精品一区精品二区| 亚洲黄色天堂| 性8sex亚洲区入口| 国产精品日韩在线观看| 日韩一级二级三级| 国产精品magnet| 午夜在线成人av| 亚洲国产精品成人综合| 欧美日韩国产成人精品| 午夜精品久久久久久久久久久久 | 欧美另类变人与禽xxxxx| 亚洲电影免费观看高清完整版| av成人免费在线| 亚洲欧美亚洲| 欧美在线观看视频一区二区三区| 国产麻豆9l精品三级站| 狂野欧美一区| 亚洲免费在线观看| 99re成人精品视频| 在线免费不卡视频| 国产精品久久7| 欧美日韩一区自拍| 欧美二区不卡| 久久久久国产精品午夜一区| 一区二区三欧美| 一本色道久久综合亚洲精品不 | 狼人天天伊人久久| 亚洲免费小视频| 亚洲一区一卡| 亚洲午夜未删减在线观看| 日韩亚洲一区在线播放| 亚洲精品视频在线看| 日韩视频在线观看免费| 一区二区三区四区五区在线| 亚洲精选视频在线| 一区二区电影免费观看| 在线亚洲一区| 欧美一区二区| 91久久久亚洲精品| 99精品欧美一区二区三区| 亚洲深夜福利网站| 欧美专区在线| 欧美成人免费小视频| 欧美日韩精品综合| 国产精品一区一区三区| 狠狠色丁香久久婷婷综合丁香| 亚洲第一狼人社区| 亚洲天堂免费观看| 久久亚洲一区二区三区四区| 欧美日韩一区自拍| 伊人激情综合| 香蕉久久夜色精品国产使用方法| 久久综合成人精品亚洲另类欧美| 欧美视频一区在线观看| 激情五月综合色婷婷一区二区| 亚洲精品国产精品乱码不99按摩| 亚洲小说欧美另类社区| 久久久福利视频| 国产农村妇女精品| 亚洲一区二区在线视频| 欧美午夜电影完整版| 一区二区三区精品在线| 亚洲欧洲一区二区在线观看| 亚洲男女自偷自拍| 欧美va天堂va视频va在线| 国内精品福利| 久久精品亚洲精品| 国产乱码精品一区二区三区不卡 | 国产精品一区二区久久久| 亚洲日本久久| 欧美成人综合一区| 亚洲精品小视频| 欧美日韩国产a| 亚洲欧美日韩精品一区二区| 欧美日韩一区二| 欧美亚洲一级片| 国产一区二区三区在线观看网站 | 免费的成人av| 亚洲精品网站在线播放gif| 麻豆久久久9性大片| 欧美天堂在线观看| 久久精品99久久香蕉国产色戒| 黑人巨大精品欧美一区二区 | 欧美大片免费观看在线观看网站推荐| 伊人狠狠色j香婷婷综合| 欧美激情在线狂野欧美精品| 99国内精品久久久久久久软件| 欧美天天视频| 欧美国产高清| 久久久xxx| 午夜欧美大尺度福利影院在线看| 黄色工厂这里只有精品| 欧美日韩国产综合久久| 久久精品女人的天堂av| 99riav久久精品riav| 国产主播在线一区| 欧美视频中文一区二区三区在线观看| 欧美一区二区精美| 亚洲网站视频福利| 亚洲精品影院| 亚洲精品久久久蜜桃| 一区二区三区在线观看视频| 国产精品成人免费| 欧美老女人xx| 欧美久久久久久久久久| 欧美r片在线| 欧美精品亚洲精品| 欧美激情成人在线视频| 欧美国产日韩在线| 国产亚洲精品久久飘花| 午夜精品一区二区三区在线视| 91久久久久久久久| 亚洲黄色免费电影| 亚洲精品国产拍免费91在线| 亚洲精品一区久久久久久| 99re成人精品视频| 亚洲永久免费视频| 久久国产主播| 欧美精品久久久久久久久老牛影院| 麻豆av一区二区三区| 欧美在线视频不卡| 欧美chengren| 国产精品久久久久国产a级| 国产精品美女久久久久av超清| 国产精品一区久久| 亚洲国产另类精品专区 | 国语自产偷拍精品视频偷| 韩国av一区二区三区| 日韩午夜激情| 久久免费偷拍视频| 国产精品视频一区二区高潮| 欧美视频日韩视频在线观看| 欧美精彩视频一区二区三区| 国产精品婷婷| 亚洲美女少妇无套啪啪呻吟| 午夜在线一区二区| 欧美日韩网址| 亚洲成人在线网站| 欧美激情1区2区3区| 男人的天堂成人在线| 欧美视频一区二区三区在线观看| 国产性做久久久久久| 亚洲视频网站在线观看| 欧美精品一区二区三区久久久竹菊| 国产精品久久久久久久久久直播| 国产欧美一区二区精品仙草咪| 一本色道综合亚洲| 欧美日韩在线播| 99精品视频一区| 欧美性片在线观看| 制服丝袜激情欧洲亚洲| 欧美午夜电影完整版| 一区二区三区日韩欧美| 国产精品每日更新| 久久国产精品黑丝| 极品尤物久久久av免费看| 免费的成人av| 亚洲欧美中文日韩v在线观看| 国产精品免费视频观看| 亚洲欧美亚洲| 一区二区视频免费完整版观看| 久久九九免费视频| 亚洲精品影视在线观看| 国产精品一二一区| 久久一区二区三区国产精品 | 欧美日本高清| 欧美大片在线观看一区| 亚洲精品在线免费| 国产精品乱人伦一区二区| 看欧美日韩国产| 亚洲视频一区| 亚洲精品久久久蜜桃| 国产一区二区三区在线观看免费视频 | 久久精品91| 亚洲一区二区三| 夜夜嗨av色一区二区不卡| 伊伊综合在线| 激情婷婷亚洲| 国产主播精品在线| 国产精品亚洲精品| 国产精品户外野外| 欧美视频中文字幕| 欧美视频一区在线| 国产精品av免费在线观看 | 亚洲在线免费观看| 99精品视频网| 亚洲视频观看| 亚洲欧美国产77777| 亚洲欧美日韩在线| 亚洲桃色在线一区| 亚洲一区二区三区精品视频 | 国产欧美日韩一区二区三区| 免费观看成人网| 亚洲网友自拍| 久久黄色小说| 免费一级欧美片在线播放| 欧美成人激情视频| 欧美系列亚洲系列| 国产精品久线观看视频|