• <samp id="sgkyk"><pre id="sgkyk"></pre></samp>
    
    

    舊版網站入口

    站內搜索

    漢語方言自然口語有聲基礎語料庫建設中期檢測報告

    2016年12月05日15:07來源:全國哲學社會科學工作辦公室

    一、研究進展情況

    一、研究計劃總體執行情況

    本項目2012年10月中標。2013年1月13日舉行開題論證會,開題至今(2016年7月)已有三年半。項目按計劃推進,總體順利。

    本項目分前期(2013)、中期(2014-2016)、后期(2017)三個階段。前期的理論研究與語料庫設計已如期完成,2014年至今(2016)為中期,有兩項主要任務:(1)語料采制;(2)軟件研究(語料轉寫核對軟件與語料庫管理軟件)。這兩項是本項目的中心工作。以下逐項匯報。

    1.1 語料采制(2014年7月-2016年7月)

    語料采制分采錄(調查錄制)與轉寫(研究標注)兩項工作。兩年來,分屬三個方言子課題的20個方言子項目按照《漢語方言語料采制手冊》的規范與要求工作,現有17方言點已完成語料采錄,開始轉寫;另3方言因故略延,正在籌備語料采錄。以下就方言布點、語料內容、研究進展與項目管理逐一匯報。

    1.1.1 方言布點:兼顧方言與文化選擇20方言點

    依據投標書設定的“兼顧方言與文化”的布點原則,選了20個方言點,覆蓋全國九個一級方言區和官話的八個二級分區(《中國語言地圖集》)。這20方言點均為當地經濟文化中心(或為古城),具有方言與地域文化的雙重代表。

    1.1.2 語料內容:基礎語料與語篇語料數量大

    每方言點有4位發音人:老年男女、青年男女,分別錄制基礎語料字、詞、句和語篇語料;A語料以老男為主,同時錄制另三人音系基礎字。語篇語料4人均錄。為方便多人對話,專設一引話人(方言地道、清楚本項目任務)參與雙口語篇與三口語篇錄制。語篇分話本語篇、話題語篇與自話語篇,三類語篇的口語自然度依序遞增。每方言點共錄制6105字,約5600詞(核心詞200、基礎詞5260、特征詞100-200),100語法例句,900分鐘語篇(見下頁表1)。語料數量大于一般方言調查和一些在研方言數據庫。

    表1 本項目單方言點語料結構表

    注:6105字含老男4002同音字和1092雙字調式字,老女、青男、青女各337音系例字。

    1.1.3 研究進展:已完成17方言點的語料采錄

    2014年上半年完成南京語料的試點采錄、修訂完善了語料采制大綱《漢語方言語料采制手冊》后,即籌備路途最遠的新疆哈密方言的采錄。7月,新疆大學哈密方言子項目完成采錄的前期準備:擬定當地獨有方言文化采錄底本(特征詞、熟語、傳說、故事、軼事、歌謠、非遺曲藝),為4位發音人分擬獨用的語料底本,選定合適的發音人,擬定采錄工作日程,勘查預定錄音錄像場地等。8月,5人團隊赴哈密,全天調查并錄制。首席專家劉俐李教授率隊,哈密方言研究專家新疆大學張洋教授同步監聽發音質量,發現問題隨即質疑、討論、重錄,子項目負責人新疆大學楊洪建副教授與研究生卜元彬負責檢查、復核、剪輯與整理音檔,發現不合格的音檔隨即補錄,項目組侯超實驗師負責錄音與錄像,確保各技術參數達標。5人團隊白天錄制,晚上總結整理,各司其職、相互配合,緊張而有序地按計劃完成了哈密語料采錄。

    2014年10月上旬,經費撥至各方言,各子項目陸續開始語料采錄。10月,北京官話首先啟動,12月,蘭州、銀川兩方言啟動。2015年1月,徽語、東北官話、晉語、粵語、溫州吳語啟動。2015年暑假前后,閩語、常熟吳語、湘語、膠遼官話啟動。目前這12方言點均已完成語料采錄,開始語料轉寫。2016年上半年完成客家話、西南官話、黃岡江淮官話的語料采錄。截止2016年7月,共有17個方言點完成語料采錄。

    首席專家參與了5個方言點的語料采錄,其余由各方言責任人負責:蘭州城市學院莫超、張建軍兩教授,暨南大學陳曉錦、浙江師范大學王洪鐘、山西大學史秀菊、山東女子學院王淑霞教授,哈爾濱師范大學梁曉玲、新疆大學楊洪建、安徽大學栗華益、常熟理工學院顧勁松、鹽城師范學院馮青青等副教授,南京師范大學侯超實驗師。博士研究生唐志強、付康,碩士研究生施小梅、漆盈、郭文娟、張敏怡、卜元彬等參加調查采錄。

    1.1.4 項目管理

    依據開題研討會專家的意見,各方言語料的采制聘請當地有造詣的方言學者承擔!爱數胤窖詫W者”一指本籍方言學者,二指雖非本籍但工作于當地并于當地方言有造詣者。20個方言點有20位責任人,人多力大,但需要規范與統一,這是保質、如期完成語料研制的前提。

    項目組以《漢語方言語料采制手冊》為法規,規約并統一20方言點的語料研究,采用兩級責任制管束并推進各方言點的工作。啟用法規手冊與兩級責任制的實質是協助與推動各子項目的工作,以保證任務的完成。

    (1)用《漢語方言語料采制手冊》規約并統一研究

    該手冊由首席專家牽頭、項目組核心成員集體研究(2013),經南京方言試點檢驗后修訂完善(2014上半年)。手冊有上下兩編。上編是“語料采制規范”,規范并約定各方言點的采錄內容、采錄對象以及錄音、錄像、攝像等技術指標,規范音頻與視頻的剪輯整理、語料標注、漢字與國際音標的使用、語料入庫路徑,提供快捷轉寫語料的方法與相應軟件,提供語料庫結構模型,提供音頻、視頻、標注、文本等入庫語料的電子安放模板“××方言語料包”。下編是“語料采制底本”,提供各方言通用的字、詞、句、語篇的采錄底本。

    (2)用兩級責任制管束并推進研究

    項目組下設子課題,子課題下設子項目,子項目對子課題負責、子課題對項目組負責。每一方言為一子項目,20方言點隸屬三個子課題:西部北部方言組(北京、東北、中原、蘭銀、膠遼、西南、冀魯官話,晉語),由蘭州城市學院、華東師范大學博導莫超教授主持;中部東部方言組(吳語、江淮官話、徽語、湘語),由浙江師范大學王洪鐘教授主持;南部方言組(粵語、閩語、客家話、贛語),由暨南大學陳曉錦教授主持。子項目承擔各方言點語料的研制,包括人員組織、經費使用、研究進度、結項成果等,與項目組簽有協議書。

    (3)用協助與監管來保證各子項目完成任務

    項目組采用通訊(電子郵件、QQ群、電話)、視頻課件、會議、派員等方式,在各方言語料研究的不同階段實施協助與監管,以保證各子項目按設計要求不走彎路順利完成任務。

    ◇語料采錄前:審核采錄底本與發音人選,提供語料包與語料研究軟件包。

    采錄底本與發音人選是采錄語料的關鍵,各方言在錄制前要報首席專家審核批準。

    各方言的采錄底本分全國通用與本地特有兩類。通用語料集中于字、詞、句等基礎語料,特有語料集中于語篇。通用語料取自《漢語方言語料采制手冊》,各方言相同,但要將每條語料的編碼改為本方言的唯一碼。特有語料由各方言自擬,有方言特征詞、當地熟語、傳說、故事、軼事、歌謠、非遺曲藝、名產、名物等。特有語料底本由各子項目自擬、報首席專家審批,然后將通用底本與特有底本合成本方言采錄底本。再拆分成4位發音人專用的分角色底本,經首席專家審批后再使用。

    2015年1月,在語料采錄普遍啟動時,項目組將語料包與軟件包下發各子項目。語料包是語料研究與語料入庫的電子模板,可使各方言在研究伊始就清楚結項要求,避免走彎路,同時也規約并統一各方言的語料采制。軟件包提供6種語料研究軟件,以方便并統一各方言語料采錄。有(1)音頻處理軟件、(2)文件更名軟件、(3)國際音標軟件、(4)語篇處理軟件、(5)語音分析軟件、(6)同音類記法與文件更名操作視頻。(6)是培訓視頻,講授字表快速記音的“同音類記法”與批量更換文件名的“拖把更名器”的使用方法。

    ◇語料采錄中

    有些方言點技術力量不足,項目組派員并攜帶設備協助,例如哈密、長沙、北京。有些方言點在錄制中遇到問題,項目組則通過電話、短信、電子郵件等協助解決,例如平遙、廣州、銀川、蘭州、北京、長沙、黟縣、溫州等。

    ◇語料采錄后

    項目組逐一檢查各方言報送的原始語料,及時通告所發現的問題。

    提供語料轉寫軟件。語料轉寫耗時費力,是語料研究的難點與重點。子課題“方言口語庫的數字化新技術研究”(簡稱軟件組)設兩個分組,專項研究開發輔助4個子庫轉寫語料的軟件與方法。在開始語料轉寫前,將這些軟件和方法提供給各方言。

    培訓專用語料轉寫軟件的使用。

    2015年11月,軟件組完成了兩款專用軟件和兩種快速記音法的研制,部分方言點完成了語料采錄,即將開始語料轉寫。11月7日,項目組召開中期研討會,邀請各方言負責人和骨干成員參加,議程之一是培訓以下4款軟件的使用:

    1)詞表標音軟件的使用與實習(鮑培明副教授講授)

    2)聲調分析軟件VoiceSort的使用與實習(宋益丹講師講授)

    3)字表同音類記法的使用與實習(侯超實驗師講授)

    4)詞表快速標音法說明與實習(劉俐李教授講授)

    1)和2)是自行研制的軟件,3)和4)是綜合已有軟件、excel表以及方言學知識研制的字表、詞表快捷標音方法。這4種軟件與方法以及后來研制的句表標音系統有效提高了語料的標音效率。

    下圖1是課題組成員學習詞表標音軟件的場景一角。

    圖1 學習詞表標音軟件

    下圖2是課題組成員學習聲調分析軟件VoiceSort的場景一角。后排三人是軟件組成員,彎腰站立者是軟件組的鮑培明副教授,她根據與會者提出的意見正指導團隊現場修改詞表標音軟件的程序。

    圖2 學習聲調分析軟件VoiceSort

    1.2 軟件研究

    2014年7月至今(2016年7月)的兩年里,軟件組研制了兩類軟件。 一是語料庫管理軟件,二是語料轉寫軟件。語料庫管理軟件體現語料庫的信息化構架并保障其運行,適用于本庫;語料轉寫軟件針對語料個體,既可用于本庫語料也可用于其他語料,具有一定通用性。語料轉寫軟件是方言研究的數字化工具。

    2014年7月3日,首席專家劉俐李教授召集計算機科學、地理信息系統、實驗方言學三領域的項目成員,專題研討語料庫管理軟件及語料轉寫軟件的研制。9月中旬,劉俐李教授與軟件組負責人曲維光教授再次商討,確定了具體研究方案。

    1.2.1 字庫與詞庫管理軟件初步完成

    由熟悉方言語料庫的計算機學者鮑培明副教授具體執行語料庫管理軟件的研究。本項目所建語料庫有字、詞、句、篇4個子庫,各庫數據結構不同,4子庫每條數據分別為52、137、38、30字段,管理軟件需要分別設計與研制。

    2014年11月,完成語料庫整體設計。2015年5月,首先研制出字段最多的字庫與詞庫管理軟件。6月,首席專家與實驗方言學者查看字庫與詞庫的管理界面,提出修改意見。2015年10月完成修訂,11月7日,在項目中期研討會上演示,全體與會者審閱并提出修改意見。軟件組當即研究并修改。會后建立了項目組專用QQ群,交流討論問題。目前已完成修訂,字庫與詞庫的界面已可使用。

    句庫與篇庫管理軟件在研制中。

    1.2.2 標音軟件“語料庫標音系統”初步完成

    2015年7月完成詞庫標音系統,經方言組試用,提出修改意見,修改后再試用,再修改。2015年 11月7日培訓骨干成員學習使用,聽取意見,現場修改。在詞庫標音系統的基礎上,11月中旬完成句庫自動標音系統,并將詞庫與句庫標音系統合為語料庫標音系統。

    句庫標音系統也可用于語篇標音:將語篇拆分為句,即可應用從而實現篇庫的快速標音,而拆篇為句也是語篇標注的要求。由是,語料庫標音系統可實現詞、句、篇3個子庫的快速標音。

    1.2.3 初步完成聲調分析軟件VoiceSort的研究

    聲調是方言記音中的難題,本項目多采用聲學語音實驗來完成。聲調實驗

    數據的處理是語音學與方言音系學的接口,工作量大,處理尺度不易把握,是聲調實驗研究的難點。本項目研制的聲調分析軟件VoiceSort可緩解這一難題。

    1.2.4 創建字表快速標音的“同音類記法”

    2015年1月,侯超實驗師與首席專家歸納整理出“同音類記法”。其原理是同音聚類與批量標音,作用是給字表快速標音。首先要完成方言音系聲韻調例字的標音,然后利用字表中的古音信息聚類,再應用EXCEL表的批量處理功能就可快速標音。

    二、各子課題進展情況

    本項目有五個子課題。子課題一是軟件組,研制建庫系列軟件;子課題二、三、四是方言組,負責方言語料的研究;子課題五研究方言韻律。五個子課題基本依照計劃完成任務。

    2.1 子課題一:軟件組

    負責研究語料庫管理軟件和語料轉寫軟件,使語料的處理軟件化或半軟件化。設兩個分組。第一組由南京師范大學計算機學院曲維光教授牽頭、鮑培明副教授負責。第二組由首席專家劉俐李教授負責,文學院宋益丹講師、侯超實驗師實施。

    第一分組已完成四項工作:

    (1)語料庫管理軟件的總體設計;

    (2)字庫和詞庫管理軟件的研制,界面已可使用;

    (3)詞庫與句庫標音軟件“語料庫標音系統”的編程,已提交各方言語料研究小組使用,普遍反映良好;

    (4)完成項目組前期成果“現代漢語有聲詞匯庫”的上網改造,并獲得國家專利。

    第二分組已完成兩項工作:

    (1) 聲調分析軟件VoiceSort;

    (2) 字表快速標音的“同音類記法”。

    聲調分析軟件與同音類記法各方言已使用,反映良好。

    該組成員同時進行語言處理及計算語言學的相關研究,發表論文2篇,獲得專利1項。

    2.2 子課題二:西部北部方言語料研究

    負責北方官話二級分區及晉語的9個方言點的語料研究。負責人蘭州城市學院莫超教授。2014年7月至今(2016年7月),完成了7個方言點的語料采錄,開始語料轉寫。另2個方言點預計2016年12月前完成采錄。

    該組成員同時進行本方言的相關研究,出版專著2部,發表論文21篇,完成3.3萬字的調研報告1份,該報告獲市社科聯科研二等獎。

    自2014年至今,該組成員獲得國家社科基金課題2項:語言接觸視閾下的河州方言形成與演變研究(2015),黑龍江省漢語方言地圖集(2016);獲得國家語委、教育部“中國語言資源保護工程專項任務”5項(山西平遙,黑龍江哈爾濱、肇東,甘肅蘭州、文縣);獲得教育部社科項目1項:絲綢之路經濟帶甘肅段語言文字使用狀況研究(2015)。

    2.3 子課題三:中部東部方言語料研究

    負責吳語、徽語、湘語、江淮官話共6個方言點的語料研究。負責人浙江師范大學王洪鐘教授。

    2014年7月至今,6個方言點全部完成語料錄制,已開始語料轉寫。

    該組成員同時進行本方言的相關研究,出版著作1部,發表論文18篇。

    自2014年至今,該組成員獲得國家社科基金課題2項:蘇北江淮官話的地理語言學研究(2015)、南部吳語發聲類型多維特征參數實驗研究(2015);教育部人文社科基金課題1項:吳語特殊發聲類型研究(2014);國家語委、教育部“中國語言資源保護工程專項任務”3項(浙江江山方言、江山文化、衢州);中國博士后基金課題2項:蘇北方言語音的現狀及歷史演變研究(2014),石臼湖流域方言的地理語言學研究(2015);省教育廳課題2項:安徽宣州吳語語言資源調查(2014),湘語與贛語共同特征的歷史比較研究(2014)。

    2.4 子課題四:南部方言語料研究

    負責粵語、閩語、客家話、贛語4個方言點的語料研究,負責人暨南大學陳曉錦教授。2014年7月至今(2016年7月),該組完成3方言點語料的錄制,開始語料轉寫。剩余的1個方言點預計2016年12月前完成采錄。

    該組成員同時進行本方言的相關研究,發表論文10篇。

    2014年該組成員獲得國家社科基金課題2項(重大與重點各一):海外華人社區漢語方言與文化研究(重大)、美國華人社區漢語方言與文化研究(重點)。

    2.5 子課題五:方言口語韻律研究

    負責人南京師范大學顧文濤教授。根據開題評審專家“收縮任務”“研究韻律詞變調”的意見,本組研究任務有所調整。

    該組目前已完成的研究:

    (1) 南京、徐州、蘇州、常州方言句焦點重音的韻律編碼方法的對比研究;

    (2) 基于聲調格局的“邊緣吳語”概念研究;

    (3) 仙居話內爆音發聲態研究。

    正在進行的研究:

    (1)江淮官話和吳語的發聲態研究;

    (2)方言區的情感語音特征研究。

    該組成員同時進行韻律及方言的相關研究,發表論文6篇。

    三、調查研究

    有文獻調查和實地語料調查研究兩類。

    3.1 文獻調查

    文獻調查的主要目的是擬制各方言語料采制底本,其次是梳理各方言音系的已有研究。已完成采錄的17方言在2014年7月前已完成文獻調查。現有3個方言點正在調查研究相關文獻。

    3方言之一的贛語已完成語料采制底本的擬制,正在查閱梳理音系研究文獻。冀魯官話與中原官話正在調查研究本方言特有文化與特征詞的相關文獻,查閱梳理本方言音系研究的相關文獻,然后撰寫本方言特有語料采制底本與音系研究綜述,預計于8月底完成并提交審核。

    3.2 實地調研

    已完成的17方言點的語料均在方言當地調查與錄制。有些方言點調查與錄制分數次完成(多在上課期間),有的集中時間一次完成(多在假期)。另3個方言點將于2016年9月至12月赴當地調查。

    四、舉辦學術會議

    2015-2016年舉辦了三次學術會議:

    (1) 本項目中期研討會(項目組全體骨干成員會議,南京,2015)

    (2) 2015實驗方言學論壇(全國性學術會議,南京,2015)

    (3) 第五屆海外漢語方言國際學術研討會(國際學術會議,美國舊金山,2016)

    4.1本項目中期研討會2015年11月在南京召開

    11月6日報到,11月7日召開。項目組全體骨干成員從全國各地赴會(有兩人請假,派員參會)。下圖3為與會者合影。

      

    圖3 項目中期研討會合影

    會議有三項議程:(1)匯報課題進展與問題:(2)審議語料庫管理軟件;(3)培訓4款語料轉寫軟件(方法)。

    表2 “漢語方言自然口語有聲基礎語料庫建設”中期研討會日程

    會議按照以上日程順利進行。聚焦點是鮑培明副教授演示的語料庫網頁設計,與會者提出了各種建設性意見。其次是各方言點語料采制工作,全體成員具體探討了語料采錄、整理及語料轉寫的各類問題。

    4款語料轉寫軟件(方法)的培訓采用講解與現場實習模式,講解后隨即試用并提出修改意見,講者與聽者均有收益。

    4.2 舉辦“2015實驗方言學論壇”(南京,11月)

    這是第二屆實驗方言學論壇。由中國語言學會語音學分會主辦、本項目所屬南京師范大學文學院與南京師范大學綜合語音實驗室承辦。五十余名國內外著名實驗語音學家、方言學家及青年學者出席會議,本項目中期會議與會者均出席。下圖是合影。會議的主旨之一是推動方言研究數字化,這是本項目建設的兩項目標之一。項目組發布了前期電子成果“現代漢語方言有聲詞匯庫”。

    應《方言》雜志主編麥耘教授約稿,“2015實驗方言學論壇”的會訊發布于《方言》2016年第1期。

    圖4 項目組舉辦的全國性學術會議的

    4.3 舉辦“第五屆海外漢語方言國際研討會學術”(2016,美國舊金山)

    7月15-17日在美國舊金山召開。由美國舊金山大學與中國暨南大學聯合主辦,本項目子課題負責人陳曉錦教授是中方主辦人,本項目首席專家與另一位方言子課題負責人出席。這是漢語方言學術會議第一次走出國門,與陳曉錦教授2014年中標的國家社科基金重大項目“海外華人社區漢語方言與文化研究”(14ZDB107)相呼應。國際國內50余名方言學者出席會議,中心議題除海外漢語方言與文化的研究外,還包括方言研究的數字化。

    五、學術交流

    5.1 出席學術會議

    2014年7月至2016年7月,項目組成員出席國際、國內重要學術會議50人次。

    除由項目組舉辦的“第五屆海外漢語方言國際研討會學術”“(2016年7月,美國舊金山)和“2015實驗方言學論壇”(2015年11月,南京)外,其他重要會議還有:“第十二屆全國語音學學術會議”(2016年7月,通遼),“漢語方言國際學術高端論壇”(2015年9月,成都),“首屆亞太語言文化生態國際會議”(2015年6月,廣州),“中國語言學會第十七屆學術年會” ( 2014年9月,北京),“he 3rd CCF Conference on Natural Language Processing & Chinese Computing(NLPCC 2014)”(2014年12月,深圳),“‘動態普通話:變異與規范’首屆學術研討會”(2014年11月,澳門),“第47屆國際漢藏語言暨語言學會議”(2014年10月,昆明),“第十三屆全國計算語言學學術會議(CCL2014)”(2014年10月,武漢),“第十一屆中國語音學學術會議”(2014年8月,烏魯木齊),“Australian International Speech Science and Technology Conference 2014”(2014年12月,新西蘭Christchurch),等。

    5.2學術講座

    2014年7月至2016年7月,項目組成員應邀在國內外講座11人次。

    2016年4月,劉俐李教授應邀在南京曉莊學院做“漢語方言地理信息系統”講座。

    2016年4月,顧文濤教授應邀在日本東京大學做“Speech prosody of Chinese languages(漢語演講的韻律)”講座。

    2015年11月,顧文濤教授應邀在意大利那不勒斯東方大學做“Quantitative analysis of L1 and L2 Mandarin speech prosody(L1和L2普通話韻律的定量分析)”講座。

    2015年9月,顧文濤教授應邀在德國基爾大學做“From function to form in the study of Mandarin speech prosody(漢語韻律的功能與形式研究)”講座。

    2015年7月,劉俐李教授應全國漢語方言學會邀請在“漢語方言田野調查高級研修班”(上海交通大學)做“方言研究數字化”講座。

    2015年4月,劉俐李教授應邀在湖南科技大學做“漢語方言地理信息系統”講座。

    2015年3月,莫超教授應邀在隴南市政府做“‘氐羌來賓’:遠古走來的白馬藏人”。

    2014年12月,顧文濤教授應邀在澳大利亞麥考瑞大學做“Stress, tone and intonation in L2 Mandarin speech by English and Cantonese learners”講座。

    2014年11月,劉俐李教授應邀在澳門大學講學一周,有兩個專題:(1)現代語音學研究與應用;(2)方言音系(聲韻調)的系列實驗研究。

    2014年8月,劉俐李教授應全國漢語方言學會邀請在“2014田野調查語音學研修班”(珠海)講授“方言音系實驗”。

    六、成果宣傳推介情況

    成果推介。項目組在“2015實驗方言學論壇”宣傳并推介前期電子成果“現代漢語方言有聲詞匯庫”。

    2014年7月至今(2016年7月),項目組在《中國社會科學報》發表4篇文章介紹本項目學術思想與研究成果:“數字化推動特色方言口語庫建設”(2014/8/11),“漢語河州話的形成及其語言性質”(2015/9/10),“從西北方言文獻角度考察文化變遷”(2016/2/25),“氐羌來賓”:遠古走來的白馬藏人”(2015/4/15)。

    本項目倡導并實踐的“方言研究數字化”已為國家社科規劃辦采納,列為2014年度國家社會科學基金項目語言學課題指南的第12號“方言研究數字化基礎建設研究”(首席專家劉俐李教授2011年將“方言研究數字化基礎建設”上報“國家哲學社會科學重大基礎理論研究選題建議”)。

    工作簡報。2014年7月呈報中期評估報告(1.76萬字),2015年7月撰寫了中期評估報告(2.37萬字,上報未收),12月呈報《工作簡報》(0.8萬字)。

    七、研究中存在的主要問題和改進措施

    因經費少、工作量大而造成一些操作性困難。開題時項目組根據下撥經費情況收縮了任務,但方言布點與語料庫結構只能微調無法大減,否則會傷及項目的基礎設計。項目組想方設法應對這一困難,主管單位也盡力協助。

    7.1 因任務重經費少有6方言負責人請辭

    方言子項目負責人先后有6人請辭(贛語、閩語(2)、客家話、冀魯官話與西南官話)。

    不少方言點負責人同時承擔國家語委、教育部的“中國語言資源保護工程專項任務”。該項目每方言點撥經費8萬(方言語料)和15萬(文化語料),本項目只有2萬。以8萬計,為本項目的4倍,而本項目工作量為其4倍多(見表3數據)。負責人請辭也是事出有因。

    表3 兩項目單方言點語料量及經費對比

    解決辦法:改由項目組承擔此6方言的語料研制。

    項目組曾多方設法另找方言點負責人,但無合適者:或本人愿意但與課題要求不符,或雖符合課題要求而本人得知任務后又打退堂鼓。

    問題雖已解決,但此6方言進度后延,影響到項目的整體進度。原計劃2016年12月完成全部語料研制,2017年試運行語料庫并完善語料庫管理軟件。但此6方言的語料研制預計分別于2017年與2018年完成,原定2017年的工作只得順延。

    二、研究成果情況

    一、代表性成果

    以下所列5項成果均與方言研究的革新和數字化有關,方言研究數字化是本項目的建設目標之一。

    國家社科重大項目除完成所設定的研究任務外,還應有益于學科建設。漢語方言學從20世紀20年代誕生至今已近一個世紀,碩果累累。但需要發展。我們認為,漢語方言學承繼先賢智慧與碩果,對語言靜態基礎單位字、詞的研究已達極致,儲備了足夠的發展勢能。探索語言動態運作基本單位語篇,應是本世紀漢語方言學發展的重要方向,因為語篇的動態研究更能揭示語言本質,故此,國際語言學界近年推崇立足于語篇研究的功能語言學。但研究語篇的工作量遠大于字詞,傳統的作坊式手工勞動已不能勝任,與之匹配的應是方言研究的數字化,包括①采錄語料數字化,②確定語料音質實驗數據化,③轉寫標注語料軟件化,④匯集語料數據庫化,⑤繪制方言地圖平臺化,⑥刊布成果自控化(《中國社會科學報》2014年8月11日)。所報5項成果與上述①至④有關。這5項成果都很稚嫩,但這是我們邁出的第一步,祈望能拋磚引玉,推動方言研究的數字化發展。

    1.1《漢語方言語料采制手冊》(16.6萬字)

    這是本項目工作的法規性文件。2013年完成初稿,2014年試用后修訂,2015年再試用再修訂,同年11月在項目中期研討會印發紙質本。該手冊分上下兩編。

    如上所述,轉型語篇研究是本世紀漢語方言學發展的重要方向,本手冊下編為方言學轉型提供了語料采集的初本。與方言語篇研究匹配的研究方式是方言研究的數字化,本手冊上編提供了語料采集數字化初案。

    上編有梳理資料、采錄語料與整理語料三項規范。

    (1)資料規范:有擬制文化語料及特征詞規范,確定音系規范。

    (2)采錄規范:有采錄對象、采錄內容、音頻采錄與處理、視頻采錄與處理、拍照等五項規范。同時提供具體操作指導。

    (3)語料整理規范:有音頻與視頻剪輯、轉寫漢字、標注國際音標、字詞標注及復核、例句標注及復核、語篇標注、數據模板、入庫數據語料包等八項操作規范。同時寫明各類軟件的使用方法、操作步驟與具體要求。

    下編有語料概覽、基礎語料與語篇語料三部分。

    (1)語料概覽:用6張表列出采錄底本的結構、語料種類、數量,各類語料錄制時長、錄制方式,不同角色發音人的具體任務。

    (2)基礎語料:有單字4002個,雙音節韻律詞546組(研究變調用),詞匯約5600(核心詞200、基礎詞29類5260詞、特征詞100-300),語法例句100。

    (3)語篇語料:有話本、話題、自話三類。話本語篇有六類,分所有方言通用與各方言特用。話題語篇有四類:單口敘述型、多口交互型、儀式型、藝術型,每類提供話題及引導詞。自話語篇有自然場景與特定場景兩種。

    上編集中闡述采制方言語料的數字化方式與技術手段。下編是以語篇為核心的自成體系的語篇采錄大綱。就我們目力所及,語篇調查大綱在漢語方言學界尚未見,本手冊應是首次。

    1.2 現代漢語方言有聲詞匯庫V1.0(網址:fych.njnu.edu.cn,4.94G)

    語料庫是儲存語料的數字化方式!艾F代漢語方言有聲詞匯庫”是本項目的前期成果,可在網上查詢使用,是一個兼顧語音的方言有聲詞匯庫。2016年取得國家計算機軟件著作權(登記號2016SR157089)。由兩期211重點學科建設項目資助建設,10年中約40名碩士生、博士生參與研究。2008年建成單機光盤版,2012年改造成網絡版。經多次語料復核后2015年11月上網,更名為“現代漢語方言有聲數據庫”(該庫還有二期建設的其他語料,但未完成復核,未上網,該庫目前只有詞匯)。下圖是其首頁。

    圖8 “現代漢語方言有聲詞匯庫”首頁

    該庫所選方言點分布于全國10大方言區,覆蓋官話的8個二級區,以及湘、閩、吳語的部分二級區。每方言點錄制詞匯3600~4000條。每條數據有26字段,分5類:詞項,詞屬,詞音,詞義,詞性。詞項是綱,統領各方言詞義;“詞屬”標明每一詞條的詞匯大類(基礎詞、核心詞、特征詞);“詞音、詞義、詞性”

    描寫詞條的內部構造。詞音與詞義并注,聲音與文本同現,集中反映方言詞匯的共性和個性?蓮姆窖、詞項、詞屬、詞音、詞義、詞性等不同角度檢索詞匯,還可進行聲母、韻母、韻尾、調類、調值、音節數等單項或多項語音檢索。可選擇單點或多點方言組合檢索?稍跈z索結果中進行10次再檢索。每種檢索同時匹配文本與聲音,并有計數?捎糜谡Z音、詞匯的專項研究,也可用作教學演示,如方言課、語音課,中小學語文課,文化課等,也可供社會使用。

    本項目所建語料庫與此詞匯庫不同:(1)本項目所建庫有字庫、詞庫、句庫和語篇庫,該庫只是兼顧語音的詞匯庫;(2)本項目詞庫每方言有5600詞,該庫是3600~4000詞;(3)本項目詞庫數據有137字段,該庫為26字段;(4)兩庫的方言布點與發音人皆有不同。

    1.3 語料庫標音系統

    這是一個給方言詞和方言句子自動標注國際音標的軟件。由鮑培明副教授團隊研制。軟件自身占用空間6兆。無需安裝,直接復制即可使用。該標音系統附有使用說明,有文有圖,按圖索驥便可操作。使用前將要標音的詞表、句表與已標好音的字表復制到軟件指定位置。然后運行程序,即可自動完成詞表與句表的標音。漢字標音后需要手動標注詞匯中的音變,如變調、變聲與變韻。

    本項目各方言已使用,普遍反映提高了標音效率。其他方言也可使用,前提是按照本項目字表、詞表與句表的格式輸入數據。

    1.4 同音類記法

    是一種快速記音法,基本原理是聚類同音字、批量記音,而不必一字一記。按照同音聚類原理,利用EXCEL表的批量處理功能,即可實現字表的快速記音。關鍵步驟是聚類同音字、批量記音與校音。記音的第一步是給方言音系的聲韻調例字標注方音;第二步利用方音與古音的對應關系聚類同音字;第三步用EXCEL表的批量處理功能記錄字音;第四步關聯漢字音檔與標音,運用同音校對法核對標記的字音,校正與古音不對應的字音。

    該方法由侯超實驗師與劉俐李教授歸納整理。

    1.5方言聲調分析軟件VoiceSort

    這是一款用于分析和歸納方言聲調的軟件。由宋益丹講師研制。

    軟件的設計思路是對接praat基頻提取腳本,實現方言聲調五度值轉換的批量處理,提升方言聲調系統歸納的效率。VoiceSort分析和歸納方言聲調系統的

    優勢:

    (1)根據五度值曲線進行調類歸納,不受主觀因素干擾,聲調系統的歸納過程更具科學性,并有助于發現聲調系統的動態變化;

    (2)批量處理多個文件(如老男、老女、青男、青女),無需分次打開,大大提高聲調歸納的效率;

    (3)所有樣本的作圖自動完成,一步到位;數據與圖表直接以excel表形式輸出,便于數據匯總和結果呈現。

    目前已完成單字調的分析部分,預計于2017年1月完成雙字調系統的自動化處理,實現軟件的全部功能。

    同音類記法、語料庫標音系統與方言聲調分析軟件VoiceSort,是針對本項目字表、詞表、句表的標音以及聲調研究的數據處理工具,覆蓋了本項目4個子庫的語料標音(語篇可拆分成句應用標音系統)。這套方言研究的系列數字化工具有效緩解了本項目語料標注的難題,同樣也應有助于其他同類研究。

    2014年至2016年,項目組成員獲立國家社科基金課題6項,其中重大項目1項,重點課題1項。

    二、成果清單 見下頁。

    成果清單

    課題組供稿

    (責編:沈王一)
    夜色www国产精品资源站| 狼人无码精华AV午夜精品| 思热99re视热频这里只精品 | 精品中文字幕久久久久久| 亚洲αv在线精品糸列| 国产A级毛片久久久精品毛片| 久久精品无码中文字幕| 91嫩草亚洲精品| 久久丫精品久久丫| 成人午夜精品无码区久久| 七次郎在线视频精品视频| 97超碰精品成人国产| 精品国产一区二区三区久久久狼| 久草视频这里只有精品| assbbwbbwbbwbbwbw精品| 国产精品原创巨作?v网站| 国产成品精品午夜视频| 国产精品久久久久久久 | 成人综合久久精品色婷婷| 久久精品国产亚洲av影院| 国产福利精品一区二区| 亚洲人精品午夜射精日韩| 国产综合免费精品久久久| 国产精品一区二区三区免费| 午夜精品久久久久蜜桃| 国产精品久久亚洲一区二区| 国产精品视_精品国产免费| 麻豆精品国产免费观看| 精品无码成人网站久久久久久| 亚洲综合久久精品无码色欲| 国产精品久久久久无码av| 国产成人精品亚洲2020| 四虎永久在线精品波多野结衣| 国产精品天天影视久久综合网 | 国产美女亚洲精品久久久综合 | 日本一卡精品视频免费| 亚洲av成人无码久久精品| 无码精品国产一区二区三区免费| 无码人妻精品一区二区三18禁| 无码人妻精品一区二区三区久久 | 国产一区二区精品久久岳√|