一、 研究進展情況
1、課題開題與子課題進展情況
本課題的主要設計思想就是要在校勘學理論的指導下,充分利用計算機技術和計算機資源,為校勘這一專業性強,工作效率較低的傳統人文學科服務,促進校勘學發展,為古籍的現代化作出貢獻。
根據總體目標,本課題分立5個子課題進行研究,分別是:
子課題1:計算機輔助古籍版本梳理系統研究
子課題2:計算機輔助古籍版本校勘和編撰系統技術設計與實現
子課題3:計算機輔助古籍版本校勘資源庫建設
子課題4:計算機古籍校勘自動編撰系統研究
子課題5:計算機輔助古籍版本校勘成果資料庫建設
截至目前,5個子課題工作進展順利,正在按計劃逐步推進。
2、調查研究及學術交流情況
2015年12月在北京師范大學召開項目協調會,協調部署項目研究工作。
前往國內外有關高校研究部門調研、洽談合作。與日本大東文化大學、越南漢喃研究院、韓國翻譯院等科研單位建立了合作交流關系。派出兩名學生前往日本交流,搜集材料。
3、學術會議與學術交流活動
2017年6月訪問韓國檀國大學漢文教育研究所和檀國大學東洋研究院,作“中國古代字書的數字化整理與研究”專場報告,與韓國檀國大學簽訂了《韓國小學類漢籍圖書調查及整理》合作協議書,協議2018年合作出版《韓國小學類漢籍圖書目錄》,并對重要文獻版本專題校勘研究。
2017年1月參加在臺灣高雄召開的“第七屆漢字與漢字教育國際研討會”,并在大會作“計算機輔助古籍版本自動校勘”專題演講報告。
開發的“古籍版本校勘軟件系統(V1.1)”已經運用于碩士、博士論文研究中。建設完成“小學文獻版本數據庫”和“佛經異文數據庫”。
2017年5月應邀分別訪問渤海大學、內蒙古師范大學作專題學術報告兩場。
4、成果推介與宣傳
成果宣傳推介不夠,計劃2017年底召開項目研討會及中期成果發布會,推介“古籍版本校勘軟件系統(V1.1)”試運行,并及時報送《工作簡報》,向國家社科基金專刊投稿。
二、 研究成果情況
代表性成果1:計算機輔助古籍版本校勘系統V1.1版
該系統在分析和總結傳統校勘工作模式的基礎上,建立計算機處理模型,實現了校勘中最核心的對校功能。軟件能夠顯性標注字符量差異、字符順序差異、字符形體差異等異文類型,實現對誤、衍、倒、脫四類現象等異文自動標注。
V1.1版具有如下幾個功能模塊:
1. 字符串自動比較功能:校勘前首先對底稿和一個校稿進行字符自動比較,記錄衍、脫、異體信息;有多個校稿可依次和底稿進行字條自動比較。并支持刪除字條自動比較結果功能,以解決誤比操作。
2. 顯示異文差異功能:即該系統能夠準確地將不同版本的差異之處顯示出來,高亮變色顯示差異內容。并明顯顯示字符差異,分別標記出衍、脫、異體、字面差異等。不同版本之間的異體差異、字面差異通過不同顏色的連線區分。
3. 類型選擇功能:提供校勘類型的快捷選擇方式,例如:脫、衍、倒、異等二級下拉菜單。
4. 編輯功能:當出現多出異文時,需要對標注對象提供字符串編輯功能,用戶可以拆分、刪除問題、合并問題,既自設標注對象。
5. 按語標注功能:校勘的價值,除了顯示異文以外,更重要的是體現在對這種差異的考證方面,所以,需要在相關異文提示的地方給出文本框,供使用者填寫考證的過程及結論。簡單來說就是加批注的功能。
目前古籍版本校勘系統V1.1版軟件系統已運用到碩、博士課題研究中,社會影響力正在逐漸加大。
代表性成果2:論文“計算機輔助古籍版本校勘資源庫建設淺議”
該論文在《圖書館理論與實踐》期刊上發表。文章指出:計算機輔助古籍版本校勘是古籍整理出版數字化的一個重要舉措。建設校勘資源庫的根本目的在于為計算機輔助古籍版本校勘提供豐富可靠的數字化資源。資源庫建設工作的主要內容包括設計資源庫整體架構、確定資源庫所要涵蓋信息種類、研究資源庫信息的采集標準與方法、資源庫的數據信息加工以及驗證評估資源庫信息的效度等。文章指出:計算機輔助古籍版本校勘資源庫所包含的資料信息種類較多,而且每種類型的資料數量也比較龐大。從資料來源上看,各種相關字典辭書是首要來
源,比如《古代漢語通假字大字典》《歷代避諱字匯典》等。歷代學者整理古籍時所撰寫的校勘記,比如《佛經異文校勘記》《十三經注疏校勘記》《二十四史校勘記》等。
代表性成果3:中國歷代小學類古籍書目數據庫
通過對中國以及日本、臺灣、韓國、美國等國家與地區的各大圖書館和高校圖書館的調研,該成果搜集了國內外現存中國歷代小學類古籍書目8000多條,書種數3000多種,30個版本以上的有24種字書;20—30個版本的字書有32種;有3個版本以上的字書共714種。其中版本數最多的是東漢.許慎著《說文解字》,有100多個版本。該成果是目前國內外收中國小學類古籍字書最多的。該成果對漢語言文字學的學術研究、對古籍整理與校勘提供了最基礎的參考文獻。目前被碩、博士廣泛使用。
代表性成果4:佛經異文資料庫
該成果搜集了《大正新修大藏經》8982卷、《卍新纂續藏經》5066卷、《嘉興大藏經》1659卷、《歷代藏經補輯》972卷、《國家圖書館善本佛典》248卷、《漢譯南傳大藏經》元亨寺版 70冊等,版本異文80多萬條。以《長阿含經》為例,該書共計22卷,異文共計2692條,除去重復以及沒有價值的異文之外,剩余共計1239條,平均每卷56條;單字異文885條,平均每卷40條。以此類推,僅《大正新修大藏經》8982卷就有50萬條(去重后36萬條)。該異文資料庫對古籍版本校勘具有重要的參考價值。可提供校勘系統聯機檢索使用。
課題組供稿