一、研究進展情況
① 研究計劃總體執行情況及各子課題進展情況:
本項目研究計劃為:通過實施和完成中國北方具有影響力或代表性語言,即蒙古語、土族語、東部裕固語、東鄉語、保安語、維吾爾語、哈薩克語、鄂溫克語、鄂倫春語、錫伯語等語言的語音聲學參數數據庫,搭建“中國少數民族語言語音聲學參數統一平臺”(簡稱“統一平臺”)框架并進行調試,為進一步開展基于“統一平臺”的少數民族語言語音聲學描寫研究和比較研究打好基礎。
本課題自2014年7月以來的研究進展情況:
本項目總體上按照原計劃實施。到目前為止
共完成了蒙古、維吾爾、鄂溫克、達斡爾、土族等5種語言的索引庫、聲樣庫、音段標注庫、聲學參數標注庫和聲學參數庫(這些聲學參數庫已達到熟庫,并投入了使用);
完成并投入使用“聲學參數自動標注/提取軟件”和聲學參數統一平臺軟件等軟件工具,搭建了“中國少數民族語言語音聲學參數統一平臺”框架;
利用“統一平臺”完成了“阿爾泰語系語言語音實驗研究叢書”的蒙古、維吾爾、鄂溫克等三卷;
建立了哈薩克、東部裕固等語言的索引庫、聲樣庫、音段標注庫和聲學參數標注庫(半熟庫);
正在研制東鄉語、保安語和錫伯語的索引庫、聲樣庫、音段標注庫和聲學參數標注庫。
聲學參數自動標注和自動提取軟件介紹:兩個軟件共有源代碼大約1500行,自動標注實現了除沖直條外所有聲學參數的自動標注,自動提取軟件增加了譜重心、偏移量、韻律參數等新的參數的自動計算和提取,兩款軟件經過了多個用戶、大量數據的運行實踐和改進,證明了其穩定和高效,極大提高了參數標注和提取的工作效率。
語音聲學參數統一平臺管理軟件介紹:該軟件大約有2000行源代碼,實現了一次多個音素或多個模糊音節的快速查詢,并可以指定多個音節位置、多個數量和多個類型的限定條件,在結果集里增加了選定范圍的功能,對所有數量型參數自動統計平均值、標準差、最大值、最小值、波動率等,極大方便了用戶的參數統計工作。
②調查研究及學術交流情況(調研數據整理運用、文獻資料收集整理、學術會議、學術交流、國際合作等):
調查研究:自2014年7月以來,我們課題組前后赴甘肅、青海交界的積石山保安族東鄉族撒拉族自治縣、甘肅省臨夏回族自治州等地進行語言調查和語音信號采集工作,采集了東鄉語和保安語近10個人的語料,10多小時幾個G的聲樣。發音人均來自上述地區的熟練使用本民族語言文化傳承人和民間藝人。他們的發音純正,能夠代表本民族語言的語音特征,沒有嗓音方面的疾病;錄音地點:在當地廣播電臺標準錄音棚或安靜的住所;儀器設備:配有索尼指向性話筒 SONY ECM 44B和Creative錄音軟件的IBM R系列筆記本電腦。采樣率為22kHz, 16bits,單聲道,S/N 不低于45dB。
自2016年7月25至26日,與內蒙古民族大學蒙古學學院聯合承辦了“第十二屆全國語音學學術會議”。有140位專家學者參加了本次會議。從地區來講,有15個省市和自治區,包括香港、臺灣;從機構來看,中國科學院、中國社會科學院、公安部物證鑒定中心、廣東省公安廳刑事技術中心;北京大學、南開大學、復旦大學,包括香港科技大學和理工大學、臺灣國立聯合大學等36個科研單位和大專院校。本次會議論文集共收集128篇論文。這些論文基本反映了當前我國在語音學研究領域的現狀與最新進展。
正在與俄羅斯布里亞特聯邦共和國國立大學合作“布里亞特語語音聲學參數庫”;正在與蒙古國科學院協商合作研制“蒙古語喀爾喀方言語音聲學參數數據庫”一事。
④研究中存在的主要問題、改進措施,研究心得、意見建議
本項目原計劃實施三年,即2013.1—2015.12月。但在實施過程中發現,本項目所涉及的語言較多、實施子課題時需要在多單位之間進行多方面的調節、技術難度和工作量較大等問題。爭取2016年12月結項,如果結不了,不會超過重大項目五年期限,即2017年12月。
意見和建議:為了更好地實施和完成我們團隊所提出的“中國少數民族語言語音聲學參數數據庫”中長期目標,本項目需要滾動立項,望基金委予以考慮。
二、研究成果情況
① 代表性成果簡介(基本內容、主要觀點、學術價值、社會影響等)
呼和,再論蒙古語詞重音問題,12千字,民族語文,2014年第4期。基本內容和主要觀點:蒙古語詞重音分絕對重音和相對重音。非詞首音節中含有短元音的多音節詞的重音為絕對重音;非詞首音節中不含短元音的多音節詞的重音為相對重音。蒙古語詞重音是整個音節語音四要素變化的綜合效應;詞重音屬自由重音,但不完全是自由的,其位置與長元音(或復合元音)有關;學術價值、社會影響:該項研究針對幾百年以來有關蒙古語詞重音方面的爭論,用實證和感知實驗的方法解釋和解決了詞重音問題。這對蒙古語、蒙古語族乃至阿爾泰語系語言的韻律基礎研究和應用研究具有較高的參考價值和應用價值。
周學文,呼和,語音聲學參數自動標注/提取系統簡介,8千字,中文信息學報,2014年第3期,第28卷(Vol.28, No.3),p123-128,2014年5月出版。本文重點介紹了一個實用的語音聲學參數自動標注/提取軟件系統。使用該系統能夠極大地降低語音參數標注和采集的錯誤率,有效提高語音聲學參數庫研制效率,確保實驗方法和實驗數據的可重復性和可驗證性,從而推動語音聲學參數數據庫研制和語音聲學實驗研究工作的規范化和標準化。
呼和,蒙古語元音演變的聲學語音學線索,中央民族大學學報(哲社版),2015年第4期,p142—151, 1萬字。本文從聲學語音學的視角探討了蒙古語元音的演變問題。主要結論為: 圓、展唇元音的聲學格局確定了它們的演變方向和方式;輔音發音方法影響元音舌位的高、低,而其發音部位影響元音舌位的前、后;后置輔音對其前置元音的影響相對大于前置輔音對其后置元音的影響;音位層面的關系是絕對的,而變體層面的關系是相對的;“陰陽對立”是蒙古語元音的一種屬性,而“元音和諧律”是這種屬性在具體語言中的表現形式。其中,屬性層面的關系是絕對的,而規則層面的關系是相對的。導致語音演變的條件和因素錯綜復雜。學術價值、社會影響:本文用聲學模型的理論和方法為語音演變提供新的研究思路和方法。
呼和,語言親屬關系聲學語音學線索,實驗語言學,第四卷第4號,2015年。本文提出用“語音聲學模型相似度”實證語言之間親屬關系親近度的思路和方法,并用蒙古、維吾爾、鄂溫克、達斡爾和土族等阿爾泰語系語言的元音聲學模型進行了初步驗證。學術價值、社會影響:本文為語言親屬關系親近研究提供新的理論和方法。
課題組供稿