• <samp id="sgkyk"><pre id="sgkyk"></pre></samp>
    
    

    舊版網站入口

    站內搜索

    韓春平:敦煌遺書數字化演進史

    2017年06月29日08:54來源:中國社會科學報國家社科基金專刊

    作者系國家社科基金重大項目“敦煌遺書數據庫建設”子課題負責人、蘭州大學圖書館研究館員

    敦煌遺書又稱敦煌文獻、敦煌文書等,是異常珍貴的歷史文化遺產。1900年發現于甘肅敦煌,隨后流散于海內外多處地方。在很長一段時間里,學界研究遺書主要依賴經過整理刊布的再生遺書資料,但這些資料與遺書原件一樣內容龐雜,卷帙浩繁,查閱不易,因此資料需求一直得不到有效滿足。20世紀80年代初,法國學者開始試探利用計算機處理遺書信息,遺書整理研究工作開啟了新的模式,進入了高效的數字化時代。自那時起,遺書數字化已走過了30余年歷程,其間涌現出許多數據庫產品和理論成果。各數據庫按其數據類型及操作功能,可籠統分為單一型、復合型和智能型三種。盡管三種數據庫中各單項成果的出現并非嚴格遵循時間次序,但每種類型的形成都與遺書數字化的演進步伐相對應,前后連綴可以從一個側面呈現遺書數字化的演進歷史。

    單一型數據庫

    單一型數據庫屬于探索性成果,出現早,歷時長;咎攸c是數據庫數量較多,但各庫通常只有一種數據類型,或為目錄庫,或為影像庫,或為錄文庫,或為其他小主題資料庫。各數據庫規模較小,結構簡單,功能較弱。在服務方面,多為僅供私人或機構內部使用的單機版,較少提供共享。

    1988年,臺灣地區相關研究機構開始對所藏遺書進行數字化處理,并將數據存入CD庫。這大概是敦煌遺書最早的數字影像。不過由于該研究院藏品數量非常有限,相關成果又未向外公布,其作用微乎其微。

    敦煌研究院于1995—1999年實施的院級課題“敦煌遺書數據庫”,是單一型數據庫中的翹楚。該庫實為《敦煌遺書總目索引新編》一書的電子版。初期僅著錄原北京圖書館及英、法兩國所藏約2萬號遺書的目錄,后期又補錄了俄、日兩國所藏及海內外散藏遺書的目錄。相關字段包括藏地、編號(卷號)、題名、分類、題記等多項。程序中起初預設了影像選項,后來并未真正實現。

    在眾多單一型數據庫中,存在一些基于少數遺書的成果,如國家圖書館創建的“中國國內散藏敦煌文獻聯合目錄數據庫”,臺灣成功大學基于《王梵志詩》《老子化胡經》等個別遺書全文錄文創建的數據庫等。此外還有一些基于小主題的成果,如上海師范大學方廣锠教授個人創建的“諸經起訖”、“英國敦煌遺書人名索引”,以及蘭州大學笹川良一青年教師基金項目“敦煌文獻中的佛教人物數據庫系統”等。在以上這類數據庫中,不乏有Excel表格形式。

    復合型數據庫

    復合型數據庫早在20世紀90年代即已出現。其基本特點是數據庫數量相對較少,但各庫數據類型則呈現多樣化,規模普遍較大,結構均較復雜,功能大幅提升。在服務方面,單機版已基本過時,各數據庫建設者至少在理念上都主張通過網絡渠道對外共享。不過實際情況并不樂觀,商業成果固然只提供有償服務,但許多公益成果要么只有死鏈,要么多有限制,真正供免費共享者寥寥無幾。

    最早的復合型數據庫,要數總部設在英國,由中、英、法、俄、日等多國合作共建的“國際敦煌項目”(IDP)專屬數據庫。該庫早在1994年即開始籌建,后于1998年在互聯網免費發布,內容包括多國藏品的彩色圖版影像和目錄信息,目前數據仍在持續上傳。不過IDP數據庫并非敦煌遺書專題庫,庫中還充斥著中亞地區多種古代歷史遺存的數字資源。受冗余數據干擾,敦煌遺書相關資料反而難于查找。除圖版質量普遍較高外,該數據庫迄未提供詳細目錄,現有目錄過于簡略,且不支持漢文檢索,極大降低了利用效率。

    蘭州大學曾于1998年承擔過CALIS項目“敦煌學數據庫”,后于2001年又通過科技部項目對其進行升級,推出綜合型敦煌學資料數據庫“敦煌學數字圖書館”,其中遺書子庫內容最為豐富,包括遺書的目錄和影像兩部分,已入庫數據涉及原北京圖書館、英國、法國及甘肅藏品,數據量數以萬計,在當時堪稱大庫。但其缺陷是遺書數量仍較有限,影像均為黑白圖版,且通常因故無法打開。

    2016年8月,由陜西師范大學創建、作為“漢籍數字圖書館”2.0版專庫之一的“敦煌文獻庫”(又稱“敦煌文獻數字圖書館”)正式上線,內含目錄庫和圖版庫兩個子庫,已入庫遺書7萬余號,圖版51萬多個。庫中圖版均有小圖、中圖和高清圖三種,可供用戶按需選用。該庫的優點是內容非常豐富,部分彩色圖版的錄入可充分展現遺書原貌,為學者提供詳盡的文獻信息;缺點是目錄信息過于簡略,且作為當前的新建數據庫,因缺乏錄文而無法進行全文檢索。

    智能型數據庫

    智能型數據庫其實也屬于復合型范疇,只是它并非普通的復合型數據庫,而是升級版,或者也不妨稱之為復合型2.0版。基本特點是成果數量進一步減少,但各類型數據則趨于齊全,規模更加龐大,結構更為復雜,功能整體增強,且注重智能技術的采用。智能型數據庫通常又稱為知識庫,它是人工智能和數據庫相結合的產物。目前還沒有成型的遺書知識庫,不過一些在建數據庫項目正朝著智能庫方向進行摸索,其服務模式也在探求之中。

    2003年,在日本京都舉行的敦煌學國際聯絡委員會成立會上,與會代表就曾動議創建“敦煌學知識庫”。2005年,在中國上海召開的敦煌學知識庫國際學術研討會上,內含遺書資源的“敦煌學知識庫”受到熱議,不過其熱度后來趨于消歇。雖然日本學者高田時雄的個人網站一直有個“敦煌學知識庫”,但除一些敦煌學零碎知識及學術資訊外,沒有任何符合“知識庫”意涵的成果。

    可喜的是,相關文獻數字化工作近年在國內得到了相應開拓,并已取得初步成效,已經推出的代表性成果主要是愛如生的“敦煌文獻庫”。該庫是具備初步智能操作功能的全文檢索版大型數據庫,共分5集,初集已于2012年出版,二集預定2017年出版。初集庫不僅輸入了大量遺書影像,而且對遺書文字內容進行了全文迻錄——這也是愛如生對遺書數字化工作的最大貢獻。除包括全文檢索在內的強大檢索功能外,該庫還開發了標注、書簽等9項研讀功能,并配套了多種其他平臺功能。其缺陷是現有影像均為黑白圖版,且部分圖版模糊不清。

    2012年,“敦煌遺書數據庫建設”首次被列入國家社科基金重大招標項目選題,敦煌研究院和上海師范大學一同中標。敦煌研究院一方項目組聯合浙江大學和蘭州大學,形成了強有力的團隊。所建新數據庫的主要亮點,是對相關各類型數據進行集成和優化,成果完成后,將不僅提供高質量的遺書全文錄文,實現錄文與高清圖版的對照閱讀,而且提供迄今最為詳備的目錄數據,并配套大量遺書研究文獻數據,同時新增藏文遺書的影像和錄文。上海師范大學一方項目的數據庫已完成第一期工程,并設想通過進一步完善,從文物、文獻、文字三個層面采集所有遺書的各種知識點,通過不同角度加以展示,同時顯示其內在網狀結構,由此打造高端學術平臺。

    敦煌遺書數字化是一個不斷演進的過程,通過海內外各界的努力,大量遺書已經被數字化,歷來各數據庫總數遠不止以上所列。既有成果為學界整理和研究遺書提供了方便,也為尋常百姓了解和欣賞遺書提供了便利。同時數字化有利于更好地解決遺書的保護與利用矛盾,既使遺書信息通過數字資源得到充分利用,又使遺書原件免遭過度接觸,從而得到更好的保護。此外,長期的數字化實踐也為后續工作留下了不少有益啟示,諸如資源建設者日趨專業化,數據庫內容和功能日趨集成化,資源利用日趨共享化,等等。不過,敦煌遺書數字化工作仍然在路上,現有成果并非盡善盡美,知識庫目標依舊道阻且長,公益資源與商業資源的博弈將在所難免,各種新舊問題都亟待解決。

    (責編:李葉、程宏毅)
    国产乱子精品免费视观看片| 亚洲精品国产精品国自产观看| 色噜噜亚洲精品中文字幕| 亚洲精品国产福利一二区| 精品在线免费视频| 无码精品A∨在线观看免费| 久久精品国产自在一线| 久久精品成人免费看| 亚洲无码精品浪潮| 51午夜精品免费视频| 亚洲av无码成人精品区一本二本| 国产精品嫩草影院人体模特| 亚洲综合一区无码精品| 日产精品卡一卡二卡三的概述| 影院成人区精品一区二区婷婷丽春院影视| 思思久久96热在精品国产| MM1313亚洲精品无码久久| 国产精品亚洲专区无码不卡| 亚洲欧洲久久久精品| 2022国产精品自在线拍国产| 久久亚洲国产精品| 91亚洲精品自在在线观看| 免费精品国产日韩热久久| 69精品人人人人人人人人人| 国产模特众筹精品视频| 国产精品无码素人福利不卡| 亚洲精品无码不卡在线播HE| 久久精品夜色国产亚洲av| 久久精品国产2020| 无码精品不卡一区二区三区| 国产在线精品二区赵丽颖| 久久精品成人免费国产片小草| 国产午夜精品视频| 999国产精品999久久久久久| 99热在线精品免费全部my| 国产精品一区二区综合| 91精品国产综合久久精品| 99热精品久久只有精品30| 久久精品青草社区| 亚洲国产精品尤物YW在线观看| 国产区精品一区二区不卡中文|