一、研究進展情況
① 研究計劃總體執行情況及各子課題進展情況;
自2013年1月至2014年6月為研究計劃的第一階段,主要是理論研究(子課題一)、軟件開發(子課題二)和數據采集(子課題三、四、五)三方面的內容,總體上目前已按計劃完成第一階段的各項工作任務,具體執行情況如下:
(一)子課題一“敦煌遺書數字化理論問題研究”進展情況:
理論研究主要致力于以下兩個各有側重而又相互融合的層面,并取得了相應成績:
其一、在側重于具體工作的敦煌遺書數據庫建設層面:通過與項目組工作人員進行充分交流,進一步明確了各子課題的具體任務,從而強化了對整個數據庫建設的感性認識。在此基礎上,不斷完善了對數據庫建設的總體構想和規劃,并力求與數據庫建設各項工作緊密結合。工作中重點對敦煌遺書元數據標準進行了深入探討,制定和提出了新的標準。
其二、在側重于抽象研究的敦煌遺書數字化學理層面:通過梳理同類數字資源建設的歷史,結合數字化技術的發展歷程,進一步探討了遺書數字化的內涵、學術價值和社會文化效益,以及遺書的著錄、標引等問題,并對數字化的負面效應進行了解析。已經完成一定篇幅的研究報告,并撰寫論文兩篇,其中一篇發表,一篇待刊;另外發表報刊文章一篇。
(二)子課題二“敦煌遺書數據庫關鍵技術研究及軟件系統開發”的進展情況:
1、開展了敦煌遺書數據庫的需求調研與系統總體設計
在項目啟動之初,就制定了敦煌遺書數據庫系統技術實施方案,依據此方案,對有關敦煌數據庫的應用需求進行了調研,包括走訪包括課題組成員在內的相關專家和研究人員、查閱相關資料、了解以往類似課題的研究進展情況及存在的問題,同時,對當前圖像數據庫的前沿技術進行了了解掌握,在此基礎上,對敦煌遺書數據庫系統的總體框架和功能進行了設計,綜合形成了“敦煌遺書數據庫需求分析與系統設計報告”,為正式開展敦煌遺書數據庫系統的開發提供了總體依據。
2、開展了敦煌遺書數據庫關鍵技術的研究工作
1)在子課題一的敦煌遺書元數據標準規范的指導下,對敦煌遺書的基本信息、圖版及研究文獻等數據庫素材的多源數據的組織存儲與表達形式等技術做了分析研究,形成了數據庫內部使用基本信息關聯存儲的組織形式與圖版數據使用圖像文件多分辨率組織存儲的方式,以便于減少數據庫的體積,提高數據庫的檢索效率。2)在上述遺書多源數據的組織表達與存儲技術的基礎上,研究了基于遺書的基本信息、研究文獻和圖版互相關聯的高效檢索技術,實現了遺書信息、圖版和研究文獻的關聯檢索;3)研究了基于公眾互聯網的敦煌遺書高清圖像遠程快速瀏覽技術研究,集成采用圖像多分辨率組織存儲技術,實現了在互聯網上遺書高清圖像的快速流暢顯示。
3、初步開發完成了敦煌遺書數據庫管理系統
在上述關鍵技術研究的基礎上,初步完成了敦煌遺書數據庫軟件系統的開發,為敦煌遺書的錄入、檢索瀏覽、輸出等管理與使用提供支持,具體包括以下功能:1)數據錄入功能:支持基于文檔表格的批量導入、單個手工錄入、修訂、刪除等;2)檢索瀏覽功能:支持針對數據庫的統一全文檢索,并支持基于各元數據字段的單個/多個并發條件檢索,支持遺書圖像的放、縮與快速瀏覽,支持圖像與錄文的對照瀏覽;3)輸出功能:按照用戶的要求輸出各種規格/類型的圖像/文字/文檔/報表等 4)數據庫維護功能,為其它子課題的建庫提供輔助支持。
(三)子課題三“敦煌漢文遺書數據庫”進展情況
敦煌研究院藏敦煌遺書基本信息383號、71808字;數字圖片815張;錄文361100字。
其他已經搜集和整理的敦煌遺書基本信息(件數及字數):
英國國家圖書館藏: S.00001—S.12649,全部12649條, 30萬字;錄文約200000字。
法國國家圖書館藏: P.2001—P.6040,全部4040號,14萬字;錄文約600000字。
俄羅斯藏敦煌遺書:1至17092號,83萬字。
中國國家圖書館藏:1至8738號,26萬字;錄文約10000字。
甘肅各地藏:甘博138號(32000),甘圖32號(8933),敦博81號(20458),西北師大19號(5287),酒博28號(6000),定博10號(2218),永博8號(2060),高博3號(1692),甘肅中醫學院3號(800),張博1號(273),以上共計704號, 79712字;錄文約1000字。
臺北“國立中央圖書館藏”敦煌卷子:1至144號,12612字。
湖北省博物館藏敦煌經卷:1至35號,6552字。
旅順博物館藏敦煌經卷:1至9號, 4296字。
上海圖書館藏敦煌經卷:1至187號,附1至2號,計189件,50067字。
天津圖書館藏敦煌經卷:1至177號, 18118字。
天津藝術博物館藏敦煌經卷:1至335號, 64342字。
安徽省博物館藏敦煌經卷:1至101號, 17253字。
浙江藏敦煌經卷:浙圖1至20號;文保所1至4號;靈隱寺1號;浙博1至177號;溫博1至2號。共計204號, 43307字。
重慶博物館藏敦煌經卷:1至23號, 3719字。
北京大學圖圖書館藏敦煌經卷,1至246號, 53240字。
日本法隆寺藏敦煌寫經:1號,147字。
日本國會圖書館藏敦煌寫經:1至5號,531字。
日本三井文庫藏敦煌寫經:1至112號,14926字。
日本唐招提寺藏敦煌寫經:1至28號,2584字。
日本有鄰館藏敦煌寫經:1至60號,6403字。
(四)子課題四“敦煌遺書數據庫藏文數據庫建設”的進展情況:
以敦煌研究院藏敦煌藏文遺書為主,編輯173件藏文遺書的基本信息48000字,拍攝完成了敦煌研究院藏敦煌藏文文獻高清數碼圖片約920張,錄入了敦煌研究院為主和法藏等的敦煌藏文文獻約100萬字;同時整理法國國家圖書館藏敦煌藏文遺書部分信息。具體情況如下
1.錄入敦煌研究院藏敦煌藏文無量壽經元數據76件,約41萬字。收藏編號分別為:Dy.t.014 Dy.t.015 Dy.t.016 Dy.t.017 Dy.t.018 Dy.t.019 Dy.t.020 Dy.t.021 Dy.t.022 Dy.t.023 Dy.t.024 Dy.t.025 Dy.t.026 Dy.t.027 Dy.t.028 Dy.t.059 Dy.t.060 Dy.t.061 Dy.t.062 Dy.t.063 Dy.t.064 Dy.t.065 Dy.t.066 Dy.t.067 Dy.t.068 Dy.t.069 Dy.t.070 Dy.t.071 Dy.t.072 Dy.t.073 Dy.t.074 Dy.t.075 Dy.t.076 Dy.t.077 Dy.t.078 Dy.t.079 Dy.t.080 Dy.t.081 Dy.t.136 Dy.t.137 Dy.t.138 Dy.t.139 Dy.t.140 Dy.t.141 Dy.t.142 Dy.t.143 Dy.t.144 Dy.t.145 Dy.t.146 Dy.t.147 Dy.t.148 Dy.t.149 Dy.t.150 Dy.t.151 Dy.t.152 Dy.t.153 Dy.t.154 Dy.t.155 Dy.t.156 Dy.t.157 Dy.t.158 Dy.t.159 Dy.t.160 Dy.t.161 Dy.t.162 Dy.t.163 Dy.t.164 Dy.t.165 Dy.t.166 Dy.t.168 Dy.t.169 Dy.t.170 Dy.t.171 Dy.t.172 Dy.t.173。
2.錄入敦煌研究院藏敦煌藏文般若波羅密多心經(編號Dy.t.019)元數據一件,500字。
3錄入法藏敦煌藏文目錄(P.t1299—P.t3615)約30萬字。
4.錄入法藏敦煌藏文解題目錄約25萬字。
5. 法敦煌藏文文獻(第一、二、三冊)目錄10萬字。
6.搜集法藏敦煌藏文遺書圖片約2000張。
(五)子課題五《敦煌遺書研究文獻庫》的數據采集與整理:
敦煌研究院藏敦煌遺書研究信息,約82000字;
采集編錄完成期刊目錄8296條;
清洗敦煌相關研究論文的期刊目錄數據2051條;
采集編錄完成敦煌相關研究圖書目錄764條。
另外,還采集到與敦煌遺書及其相關的研究文獻信息,如《中國敦煌學論文論著總目錄》、“敦煌遺書研究文獻按號索引”等。
前階段,項目組主要基于已有的相關研究目錄,通過主題、研究人員和文獻類型分析,提取關鍵檢索點,同時通過對國內大型數據庫和相關圖書館的OPAC目錄進行有關檢索, 獲取了敦煌遺書研究文獻的期刊論文目錄和圖書目錄,并依據有關元數據標準對元數據進行了清洗和過濾。并對全文數據的獲取制作進行了實驗。
②調查研究及學術交流情況(調研數據整理運用、文獻資料收集整理、學術會議、學術交流、國際合作等);
數據采集與文獻整理見前述。
小型學術會議二次,與國內各敦煌遺書的收藏單位交流五次。
與相關專家交流20次以上。
項目責任單位也是敦煌遺書收藏單位敦煌研究院的支持。
③成果宣傳推介情況(成果發布會、《工作簡報》報送情況、國家社科基金?陡寮安捎们闆r等);
2013年1月舉行項目開題報告會。
2013年內編印工作簡報兩期。
敦煌文書的數字化 甘肅日報,2014/6/13 (理論版)
④研究中存在的主要問題、改進措施,研究心得、意見建議;
我們的目的是建成完整的敦煌遺書數據庫。本項目研究建設工作中的最主要也是最大的問題,還是數據采集與經費兩個方面:首先是數據采集方面主要存在兩大難題:一是國外藏品數據的采集,主要是數字圖片的拍攝與擷取,涉及好多方面的問題;二是遺書的錄文工作,特別是社會歷史文書的錄文,不僅數量大,而且難度也很大,需要敦煌遺書整理研究方面的一流專家們經過長期研究和仔細?边^的錄文與研究成果以及他們的幫助,同時也涉及諸多方面的問題。而國內藏品數據的采集,相對來講情況可能會好一些,但也難度較大。其次是經費,敦煌遺書數據庫又是一項建設工程,而且是一項涉及全球范圍內的國際性研究項目和建設工程,需要有充足的經費保障,目前的項目經費也只是杯水車薪。
針對如上問題,改進措施即是在經費保障下的數據工作。有了充足的經費,就可以順利地從事數據采集,包括與國內外各收藏單位的協調,爭取到國內外敦煌遺書研究專家支持和幫助。為此,我們希望繼續得到國家社科基金的支持,以便將敦煌遺書數據庫作為國家社科基金重大項目做完整并不斷完善。
根據近兩年項目工作的進展情況和本數據庫建設的需要,我們重新制訂了項目工作計劃,本項目建設分三個階段進行:從立項至2014年6月為第一階段,2014年7月至2015年10月為第二階段,2015年11月至2018年6月為第三階段。我們建議將本項目設為滾動項目關得到相應的資助。
④其他需要說明的問題。
一、按本項目立項時的計劃,在2015年10月之前,本數據庫在建成軟件后,主要展示甘肅藏敦煌藏文遺書的全部數據,并適當展示敦煌遺書的其他信息。2015年10月之前的工作分為兩個階段。目前(2014年6月底前)為第一階段的工作,主要是在必要的理論研究前提下,建成敦煌遺書數據庫平臺,錄入敦煌研究院藏敦煌漢、藏文文獻及研究文獻的全部信息(包括數字圖片與錄文),以形成敦煌遺書數據庫和基本框架。現作為中期檢查的匯報即是第一階段的成果。接下來的第二階段,從現在開始至2015年10月底前,在不斷改進技術平臺的前提下,重點完成甘肅藏敦煌藏文文獻的全部基本信息采集與編輯、全部數字圖片的拍攝與編輯;同時完成法藏及部分零散收藏的敦煌藏文遺書的全部基本信息、部分數字圖片等數據采集,以及法藏、俄藏及部分零散收藏的敦煌遺書的全部基本信息、部分數字圖片,英藏、國圖藏敦煌文書的部分基本信息等數據采集,并在軟件平臺展示;繼續開展相關的理論研究工作,不斷為完善本項目提出新的要求。從2015年11月開始到2018年6月,從事第三階段的工作,采集整理全部敦煌遺書的各項數據并導入數據庫,建成完整意義上的敦煌遺書數據庫。
二、根據目前項目需要,增加從事敦煌遺書數字圖片拍攝和編輯的專家為項目組成員,他們是敦煌研究院盛䶮海副研究館員,梁旭澍、王海云、穆亞東館員,加入第四子項目敦煌藏文數據庫建設(此前他們已經參與了本項目的大量工作);而因本項目軟件系統不需要專門的藏文程序,此前投標書中所列藏文軟件編輯的專家祁刊玉教授不再參與本項目。
二、研究成果情況
代表性成果:
1、已發表和理論研究文章,主要是關于敦煌遺書數字化(含數據庫建設)的內涵、價值意義、技術開發、數據采集及整理等方面進行闡述。待發表的研究報告,主要是關于數據庫建設工作的總結和其他理論問題的進一步探索。
2、敦煌遺書數據庫(一期)
建成了敦煌遺書數據庫(一期),包括敦煌遺書數據庫軟件系統和遺書數據兩部分:敦煌數據庫軟件系統為敦煌遺書的錄入、檢索瀏覽、輸出等管理與使用提供支持,具體包括以下功能:1)數據錄入功能:支持基于文檔表格的批量導入、單個手工錄入、修訂、刪除等;2)檢索瀏覽功能:支持針對數據庫的統一全文檢索,并支持基于各元數據字段的單個/多個并發條件檢索,支持遺書圖像的放、縮與快速瀏覽,支持圖像與錄文的對照瀏覽;3)輸出功能:按照用戶的要求輸出各種規格/類型的圖像/文字/文檔/報表等。
一期數據庫已收錄入了目前敦煌研究院所收藏的全部藏文遺書173件和漢文遺書383件的完整數字資料信息,包括基本信息556條119800字、錄文461條571100字、圖版1735件,研究文獻170件1000八條82000字。敦煌遺書數據庫(一期)的建成是數字化時代敦煌遺書保護和研究的重要工作,已經成為敦煌學數字化大課題的重要分支,是敦煌學數字化乃至整個敦煌學研究的重要組成部分,可以事實推動和完善敦煌學的學科建設。
敦煌遺書數據庫(一期)的建成,首次從國家層面,系統性地將散落的敦煌遺書以數字化形式搜集在一起,特別是首次將全部藏文遺書以數字化的形式提供服務,可以為敦煌遺書研究提供一個內容豐富、檢索快捷、使用方便的數字化平臺,推動敦煌遺書研究工作的開展,進而為敦煌學研究的繁榮建立有效的平臺保障。由于數據庫建設在內容方面的極大擴展,以及數據之間更加多樣的關聯,可以對數字資源進行深度開發,有利于實現“知識發現”,從而達到提高資料文獻發現利用效率的目的;另一方面,可以為我們國家在研究古代各民族在文化、經濟等方面交往融合的歷史提供一個高效便捷的平臺,進而了解并增進我國各民族的文化融合,這不僅具有重要的學術價值,也將會產生極大的社會影響力。
3、敦煌漢文遺書數據庫(子課題二)主要成果如下:
(1)集中采集和整理敦煌研究院藏敦煌遺書基本信息383號、71808字;數字圖片815張,錄文361100字。
(2)其他已經搜集和整理的敦煌遺書基本信息:英國國家圖書館藏S.00001—S.12649,全部12649條30萬字,錄文約200000字;法國國家圖書館藏P.2001—P.6040,全部4040號14萬字,錄文約600000字;俄羅斯藏1至17092號83萬字,;中國國家圖書館藏1至8738號26萬字,錄文約2000字;甘肅各地藏共計704號總字數79712字,錄文約1000字;國內外散藏1667件,基本信息部分約29626字。
4、敦煌藏文數據庫第一次把敦煌藏文遺書的整理和建庫工作納入業務范疇,就海內外相關文獻資料進行綜合考察和研究,建立敦煌藏文基本信息庫系統。
(1)開展了以敦煌研究院為主的甘藏敦煌藏文及法藏部分目錄藏文文獻進行了初步摸底調查。目前已對敦煌研究院173件藏文文獻的編號、定名、保存現狀子目、題記、收藏地和來源等信息整理完成并拍攝完成了數碼圖片。
(2)部分法藏敦煌藏文基本信息的初步整理:錄入法藏藏文文獻P.t1299—P.t3615,完成法藏文文獻解題目錄的錄入,完成法敦煌藏文文獻的錄文。
(3)初步開發完成的敦煌藏文數據庫管理系統提供了以上的敦煌藏文文獻的全面、準確的信息。
5、敦煌遺書研究文獻信息部分,除敦煌研究院藏敦煌遺書研究信息約82000字之外,主要任務是全面搜集和整理國內外有關敦煌遺書(包括漢、藏文)研究的全部信息,在已有成果的基礎上,建立敦煌遺書研究文獻特色標引規范,通過各種出版物、數據庫、互聯網等,系統地發現、挖掘、跟蹤已有的研究文獻如圖書、期刊、學位論文、各類灰色文獻,密切注視國內外敦煌遺書研究的動態,及時、準確地提供各方面的研究信息,建立完善的敦煌遺書研究文獻信息庫系統,滿足研究人員對文獻信息的需求。
注:2010年立項的重大項目主要填寫2012年6月以來的研究成果情況。
序號 |
成果名稱 |
作者 |
成果形式 |
刊物名或出版社、刊發或出版時間 |
字數 |
轉載、引用、獲獎等情況 |
1 |
敦煌文化遺產數字化保護之淺見 |
馬德 |
期刊論文 |
《敦煌學輯刊》2013年第2期。 |
6千 |
|
2 |
敦煌遺書與數字化 |
韓春平 |
期刊論文 |
敦煌學輯刊2013(4) |
11.6千 |
|
3 |
敦煌遺書數字化理論問題研究 |
韓春平 |
研究報告 |
|
約50千 |
|
4 |
敦煌遺書數據庫軟件系統 |
許端清 |
軟件 |
|
|
|
5 |
敦煌遺書數據庫(一期) |
許端清 |
數據庫 |
|
|
|
6 |
敦煌漢文遺書基本信息數據 |
邰惠莉 |
電子文檔 |
|
172萬 |
|
7 |
敦煌漢文遺書錄文 |
趙曉星等 |
電子文檔 |
|
117萬 |
|
8 |
敦煌藏文遺書基本信息數據 |
勘措吉 |
電子文檔 |
|
200萬 |
|
9 |
敦煌藏文遺書數字圖片 |
盛䶮海等 |
數字圖片 |
|
2400張 |
|
10 |
敦煌藏文遺書錄文 |
勘措吉等 |
電子文檔 |
|
100萬 |
|
11 |
敦煌藏文遺書數字圖片 |
盛䶮海等 |
數字圖片 |
|
2400張 |
|
12 |
敦煌藏文遺書錄文 |
勘措吉等 |
電子文檔 |
|
100萬 |
|
13 |
完成期刊目錄 |
瞿晶等 |
電子文檔 |
|
8296條 |
|
|
清洗敦煌相關研究論文的期刊目錄數據 |
瞿晶等 |
電子文檔 |
|
2051條 |
|
|
完成敦煌相關研究圖書目錄 |
瞿晶等 |
電子文檔 |
|
764條 |
|
|
敦煌遺書研究文獻按號索引 |
申國美 |
電子書 |
|
|
|
1 |
中國敦煌學研究論著總目錄信息,論文17200條、著作1500條 |
李國 |
電子文檔 |
|
100萬字 |
|
2 |
敦煌藏文遺書數字圖片 |
盛䶮海等 |
數字圖片 |
|
2400張 |
|
3 |
敦煌藏文遺書錄文 |
勘措吉等 |
電子文檔 |
|
100萬 |
|
4 |
完成期刊目錄 |
瞿晶等 |
電子文檔 |
|
8296條 |
|
5 |
清洗敦煌相關研究論文的期刊目錄數據 |
瞿晶等 |
電子文檔 |
|
2051條 |
|
19 |
完成敦煌相關研究圖書目錄 |
瞿晶等 |
電子文檔 |
|
764條 |
|
20 |
敦煌遺書研究文獻按號索引 |
申國美 |
電子書 |
|
|
|
21
|
中國敦煌學研究論著總目錄信息,論文17200條、著作1500條 |
李國 |
電子文檔 |
|
100萬字 |
|