一、 研究進展情況
1、課題開題與子課題進展情況
自2016年3月開題以來,至2017年7月,課題組已經基本搭建起較為完整的數據庫架構,完成了總容量約為8個G(一個G為1024M)的清末民國社會調查數據庫。現在數據庫中已經有約2000萬字全文數據庫、300萬字原始文獻庫。另外,課題組還完成了約50萬字的文獻目錄索引,以及“婚姻家庭”專題數據庫的表格錄入工作。總體完成進度已經接近項目預計工作量的一半,項目進展順利。
子課題1已經對清末民國社會調查中調查的概念、調查活動的背景、調查的性質進行了深入分析。在此基礎上,已經根據調查報告的特點以及歷史學和其他社會科學學者的需求,設計出了數據庫的總體結構和功能;并對數據庫的建立制定了可行性方案和具體操作方案。在此基礎上,已經初步搭建好數據庫的基礎架構。
子課題2依據子課題3編制的文獻目錄索引提供的信息,查找、復制了原始社會調查文獻,已經建立了規模為300萬字的原始文獻庫。上述原始文獻已經被掃描并轉變為pdf格式,同時已經導入到原始文獻庫中與全文數據庫一一對應。
子課題3已經完成約50萬字的原始社會調查文獻目錄索引的編制,包括調查文獻的名稱、類型、調查時間、調查地點、調查主體、調查內容以及出版機構、出版時間以及文獻來源等各類信息。該索引根據社會調查的內容,將社會調查分為“綜合”、“環境”、“政治”、“經濟”、“軍事”、“法律”、“社會”、“宗教”、“文化”、“教育”、“民族”、“華僑”、“社會調查理論與方法”十三大類,每大類又根據文獻條目之多少逐級細分,且不論分成幾個層級,其最后一級分類所在條目,均按著作或刊布時間依序排列。有些類別條目較多,但涉及不同地區,則一般以地域予以分類。其中“綜合類”調查,主要指對某一特定地區的綜合性調查,涉及自然環境、政治、經濟、社會、文化等諸多方面,不論這一地域,是一個村莊,市鎮,還是省縣行政區,或是港口、鐵路沿線等地。為便于檢索,據其調查范圍之大小,分為“全國及跨省區”、“省域”、“縣域”、“城鎮”、“村落”、以及包括“鐵路沿線”等其他小類。“環境”類調查,主要包括“環境概況”、“資源”、“災害”等幾個方面。其中“資源”包括“氣象與氣候”、“地質”、“礦產”、“土壤與水資源”、“生物”(含森林植被、動物等)、“物產”等;“災害”指的是水、旱、蝗、震以及傳染性疾病等各類災害。其他各類情況,概述如下:政治——政治概況、國家行政、地方行政、基層自治、對外關系等;經濟——經濟概況、農業、手工業及工業、商業、財政、金融與經濟關系、經濟組織等;軍事——軍事概況、武裝力量、戰爭、后勤;法律——法律概況、司法體制、司法行為、民商事習慣;社會——社會概況、人口、婚姻與家庭、社會階層、社會組織、社會問題與社會運動、風俗習慣、醫療衛生、社會保障等;宗教——宗教概況、佛教、道教、基督教、伊斯蘭教、民間宗教;文化——文化概況、新聞、出版、文藝、體育、文博、其他;教育——教育概況、各類教育、教育管理、教學內容與方法、師資隊伍、學生學習與生活等;民族——民族概況、族別;華僑——華僑概況、國內華僑、海外華僑。
子課題4已經建立了約2000萬字的全文檢索庫,通過將數據輸入、校核與處理,通過將原始文獻轉換為word格式,從而建立了完整的全文數據庫。已經完成項目規劃4000萬字的50%。上述內容已經全部導入到數據庫之中,目前,數據庫已經能夠基本實現項目規劃的絕大部分功能。
子課題4同時也已經完成了婚姻家庭專題應用庫的表格錄入工作,后期將對社會調查中的數據進行編碼和重組,然后進行統計分析或繪制地圖,實現可視化和量化分析。
2、調查研究及學術交流情況
1、開題報告會
2016年3月27日上午9時,課題開題報告會在人民大學召開。來自中國人民大學、中國社會科學院、國家圖書館、北京大學、清華大學、北京師范大學、南開大學、福建教育出版社、上海精靈天下數字技術有限公司、中央民族大學、山西大學等單位的近30位專家學者以及課題組成員出席了會議。
北京師范大學朱漢國教授、中國社會科學院經濟所封越健教授、中國社會科學院近代史所金以林教授、北京師范大學歷史學院李志英教授、南開大學歷史學院李金錚教授以及清華大學社科科學學院經濟研究所龍登高教授擔任此次會議的評審專家。
人民大學洪大用副校長在致辭中表示,“清末民國社會調查數據庫建設”意義重大,它涉及社會學、經濟學、統計學、歷史學等多個學科,不僅有助于拓展史料、促進計量史學的發展,還有助于推動跨學科、跨學校的交流與合作。
2、課題組落實評審專家意見會議
為了落實開題報告會各位評審專家的意見和建議,課題組全體成員于2016年3月27日下午2:00-4:00在中國人民大學清史研究所會議室召開了項目組討論會,在黃興濤教授、夏明方教授的主持下,曹新宇、伍婷婷、林展、陳鵬、韓祥等課題組成員針對評審專家的意見,深入討論了數據庫設計中的屬性表及多維分類表問題,對原有的設計計劃、課題組的工作進度及子課題的成員分工做出了相應的調整,并具體部署了近期的有關工作。
3、屬性表錄入分工會議
2016年6月29日上午9時,由中國人民大學歷史學院黃興濤教授主持的國家社科基金重大項目“清末民國社會調查數據庫建設”屬性表分工會議,在中國人民大學清史所400會議室召開。上海精靈天下數字技術有限公司及課題組成員夏明方教授、邱志紅、李章鵬、伍婷婷、林展、陳鵬、杜佩紅等課題組成員參加了會議。會議由中國人民大學歷史學院林展講師主持,主要討論了數據庫建設屬性表錄入的分工及填寫要求。
4、數據庫建設進展報告會
2016年10月26日上午9時,由黃興濤教授主持的國家社科基金重大項目“清末民國社會調查數據庫建設”的數據庫建設進展報告會,在中國人民大學清史所400會議室召開。國家圖書館專家、上海精靈天下數字技術有限公司代表及課題組成員出席了本次會議。
5、屬性表填寫進展情況匯報會議
2016年11月7日下午14時,由中國人民大學歷史學院黃興濤教授主持的國家社科基金重大項目“清末民國社會調查數據庫建設”屬性表分工會議,在中國人民大學清史所400會議室召開。課題組錄入成員邱志紅、李章鵬、伍婷婷、林展、陳鵬、韓祥、杜佩紅參加了會議。會議由中國人民大學歷史學院林展講師主持,議題包括屬性表錄入的進展情況匯報及數據錄入中的問題。
6、“數字人文”與清史研究學術會議
2016年5月28-29日,課題組與中國人民大學《清史研究》編輯部在北京合作舉辦了“數字人文與清史研究”學術會議。來自北京大學、中國人民大學、中國社科院、北京師范大學、復旦大學、陜西師范大學、上海交通大學、河南大學、蘇州大學、南京師范大學以及香港科技大學、耶魯大學、哈佛大學、臺北“中研院”等海內外14家學術單位的30余位專家學者參加了本次工作坊。
課題組首席專家黃興濤教授在工作坊上指出,數字人文發展在目前史學研究中所代表的開創意義,在某種程度上構成了梁啟超百年前所提出“新史學”新的起點。歷史學者應該積極發揮作用,做出一些具有示范性的、典型的數據庫。數據庫的建設使史學站在了一個新的高點,其資料、視野的廣闊性有助于克服目前史學研究中“碎片化”的傾向。大家要緊緊抓住史學的本質,即“反思性的再現過去和反思過去”的基礎上做出高質量的數據庫,推進史學的進一步發展。
課題組成員林展向與會專家介紹了本課題的總體規劃和設計,得到與會專家的指導和好評。
3、學術會議與學術交流活動
除了上述會議外,課題組與上海精靈天下數字技術有限公司就數據庫建設相關的問題就行了12次溝通會議。
另外,項目組成員林展兩次被中國社會科學院近代史研究所邀請,介紹本課題的進展和相關經驗。
4、成果宣傳推介情況
本項目在推進過程中,通過中國人民大學科研處共計上報兩期工作簡報:
2016年4月《工作簡報》第1期
2017年1月《工作簡報》第2期
二、 研究成果情況
1、黃興濤、李章鵬:《現代統計知識和觀念的傳入與清末新史學》,《史學史研究》2016年第3期。
本文對于現代統計知識和觀念傳入中國的過程進行了系統梳理。為“清末民國社會調查數據庫”結構的搭建提供了重要的背景知識和理論支撐。
文章發現,在1897年之前,以具體統計事例為載體的西方統計知識和統計觀念已經傳入中國,1897年后,經日本消化吸收的社會統計學理論開始系統地引入,這對清末和民國統計的影響廣泛而深遠。清末時,梁啟超等人把統計材料匯編為歷史,陳黻宸等人明確主張以統計法來研究和表述歷史,他們固然受到西方史學理論的影響,但現代統計知識、觀念和外來成果所施予的直接刺激也不容忽視。
清末時已有人在史書編纂、地方志纂修和具體歷史問題研究方面,嘗試使用統計分析法,這構成為清末中國新史學有機的組成部分。可以說,“歷史統計學”的有關意識和實踐,在當時已經悄然醞釀、生發。只不過,清末尚沒有人明確提出“歷史統計學”的概念。這一任務直到20世紀20年代才由梁啟超、丁文江等人大體完成。清末學人在使用統計圖表分析歷史問題時,絕大多數都還沒有真正重視起數字,更沒有產生如何以精確的數字科學有效地分析和表述歷史的普遍觀念和系統見解。這是其明顯不足。實際上,清末民初時的中國史學,還遠不具備重視量化統計分析的社會文化基礎。甚至迄今,我們的史學在這方面仍有很多的課要補、很長的路要走。
2、林展:《新世紀中國的史料整理與人文社會科學研究 ——以<民國時期社會調查叢編>為例》,《光明日報》2016年4月6日第14版。
本文以《民國時期社會調查叢編》為例,討論了新世紀史料整理的重要性,以及建立“清末民國社會調查”數據庫的必要性。
文章認為,史料不僅是史學研究的基礎,也是眾多人文社會科學研究的重要基礎。20世紀初梁啟超倡導的新史學,如果脫離了史料的發掘整理,將是難以想象的。新世紀以來我國的史料整理工作,雖然借助于計算機與網絡技術,呈現出異乎尋常的突飛猛進態勢,但總體來說,并不盡如人意。一個突出的特點是,影印出版的史料大幅度增長,而經過歷史學者核對、比勘、系統分類的史料整理相對減少。這一現象對歷史學乃至整個人文社會科學可能產生的負面影響,迄今也沒有得到足夠重視。
難能可貴的是,盡管現行科研評價體制對史料整理工作并沒有給予足夠的重視和支持,但仍有少數富有遠見、不畏艱難的學者,基于對學術研究規律的信念,投身到大規模史料的系統整理工作之中,并對歷史學研究乃至其他人文社會學科帶來積極的影響。《民國時期社會調查叢編》(以下簡稱《叢編》)系列就是其中的一個顯例。
我們發現,《叢編》在他引方面呈現下面的特征。其一是總體引用次數比較高,據不完全統計,從2005年至2014年,累計引用數量接近1000次。其二,引用次數呈現逐年升高的趨勢。其三,影響的范圍廣,除中國大陸地區外,中國臺灣地區、日本、美國、澳大利亞等地都有學術著作引用,涉及學科包括歷史學、社會學、政治學、教育學、經濟學、心理學等。就期刊而論,自2005年至2014年,引用《叢編》的期刊論文一共有289篇,分布在199種期刊上。
這表明,以《叢編》為代表的專業化史料整理工作,具有重要的學術價值。當然,現有的專業化史料整理工作也存在局限性,比如出版成本高、周期長、容量有限、難以進行原文對照、無法進行全文檢索等。有鑒于此,專業化史料整理工作需要在歷史學者專業知識的基礎上,充分利用計算機技術,建設大規模集成式的歷史數據庫,從而為國內外同行搭建一個重要的基礎性資料平臺。
課題組供稿