(一)研究計劃總體執行情況及各子課題進展情況
本項目旨在探討面向事件結構基于本體動力學的語義網模型,通過事件和事件鏈的標注,奠定計算機進行文本理解和查詢推理的基礎,并通過本體演化實現領域本體結構的構建,從而實現對文本內容的語義理解。根據項目內容和預期目標,該項目分為五個子課題協同推進,分別是:面向事件的本體結構資源建設、面向事件的語義網表示和推理機制、基于知識發現的本體演化機制研究、事件語義的自動標注研究和基于事件的語義查詢與推理研究。
項目開展以來,項目組整合了武漢大學、中南財經政法大學和武漢科技大學等多所大學和單位的多學科研究力量及相關學院的資源,分子課題或集中研討,協同推進,現各子課題基本完成預期時間節點任務要求,確保了整個項目正常推進。
子課題一為面向事件的本體結構資源建設,旨在建立涵蓋實體、屬性、性質、事件及其上下位關系的基礎本體結構,建立涵蓋事件和事件鏈的語義標注資源,為文本的深度語義標注、上下文理解和語義查詢及推理奠定基礎。
本體結構方面,我們用近年新創的“詞群-詞位變體理論”和“基元結構理論”構建了移動類事件和言說類事件的局域系統,其創新點是:事件觸發詞具有伸縮性的類系統,同類事件的本體結構可通過本體自動創建,為篇章事件的理解標注和機器自學習,提供了新的語言資源。
事件資源方面,在總結和研究多學科相關成果的基礎上,根據語言信息處理和人工智能的需要,把事件定位為話題結構的語義及其結構。結合語言的功能和信息特點,構建了適用于語言信息處理的事件理論系統。現階段我們集中對敘述類和描述類事件篇章的事件鏈進行標注。
目前我們確定了語料標注的具體步驟,包括語料的選擇、語料的預處理、詞匯鏈標注、事件及事件鏈標注,并對數據進行了部分標注。事件結構表示為謂詞及其論元結構,為篇章事件鏈的標注奠定了基礎。與以往的事件結構研究只是局限在句法層面所不同的是,本項目提出,篇章的基本構成單位是事件,每個事件內部存在一個語義結構,同時,篇章內部事件之間也存在相互關系,這些事件本體之間的相互關系構成了篇章語義關系的雛形---事件鏈。篇章的語義分析通過實踐和事件鏈的分析實現。
在事件鏈標注中,從篇章中的詞匯鏈入手,根據這些詞匯鏈所覆蓋的最長名詞短語所觸發的謂詞形成的鏈條來確定篇章的語義結構。本子課題的創新之處在于引進詞匯鏈上詞匯所在的最長名詞短語(NP鏈),保證了詞匯鏈上名詞短語的中心詞、名詞短語的修飾語甚至謂詞都能跟事件觸發詞通過NP鏈取得聯系,確定與不同語法位置的體詞緊密聯系的謂詞。在詞匯鏈標注環節,嚴格按照同形、同指、同義三原則,以跨句兩次及以上的重復為判別標準;在從詞匯鏈到NP鏈標注環節,按照句法關系將詞匯鏈上詞匯擴展到其所在名詞短語的最大投射;從NP鏈到事件鏈環節,事件觸發詞是其自身與直接論元所在NP鏈在當句中覆蓋詞匯鏈最多的那一個謂詞,通過比較計算詞匯鏈詞匯數量的方式推導出事件觸發詞。標注的各個環節盡可能確保客觀操作性和可重復性,由此提取出來的主干事件鏈既直接反映篇章連貫,又以精簡形式概括了文章主旨。
子課題二為面向事件的語義網表示和推理機制,此課題旨在研究大規模的事件語義描述及其推理模型和引入統計推理,以支持面向事件的語義查詢和實時自然語言查詢,并從邏輯基礎的角度來驗證這種表示機制的可滿足性和可判定性。目前,對于事件表示機制,我們分析了事件表示機制時間、角色等基礎屬性,在綜合分析RDF、OWL等語言表示機制的基礎上,探討了一種基于Named Graph的事件語義表示機制,它以RDF表示語言為基礎,擴展其Endpoint機制,支持基于圖的語言表示,符合事件表示的需求。另外,在現有SPARQL語言基于Pattern Tree的代數表示語言的基礎上,設計了一種支持事件語義的SPARQL Algebra,并在Raptor SPARQL查詢語言實現機制的基礎上,實現了相應的原型。在事件語義方面,主要完成了三個方面的研究:①設計了支持事件的中文開放醫學鏈接數據,將其中的重要事件如手術、病狀變化、用藥等采用事件語義進行表示,并在此基礎上與武漢協和醫院、中南醫院進行廣泛合作,開展了抗菌藥物合理用藥監管的研究。②針對設備管理中存在知識管理方式不足的問題,設計了一種基于事件語義的新型設備知識管理、績效評價等機制。目前已經實現了相應的原型系統,并在整理設備管理相關開放鏈接數據庫。③針對消防信息系統中信息異構、多樣性的特點,以事件語義表示機制為基礎,設計了消防開放鏈接數據,采用事件語義表示其中的狀態變化等方面的問題。目前已經完成了一個具體項目的研發(武漢鋼鐵集團消防綜合信息管理系統和指揮決策系統),在開放鏈接數據方面,已經完成了消防總體開放鏈接庫的設計,并完成了目前國內所有危化品知識庫的設計。
本子課題在以下方面有所創新:1)從邏輯的角度對事件語義進行了形式化的定義,將事件定義為一個具有時間、角色等多種屬性的元素,并具體采用Named Graph描述事件語義;從查詢的角度,定義了事件查詢的算子;2)首次從事件的角度描述手術、病情變化等用常規方法無法準確描述的醫學信息資源。并以此為基礎進行了臨床應用嘗試;3)建立了醫學、消域等專業領域的中文開放鏈接數據,豐富了中文開放鏈接數據庫的內容,并為相關應用奠定基礎。
子課題三為基于知識發現的本體演化機制研究,旨在研究在大規模文本的作用下,基礎本體到領域本體以及領域本體間的演化機制。這方面的主要進展在于:1)設計并開發了從文本中抽取關鍵詞和概念的機制,能自動發現特定領域中涌現的新概念;2)設計并開發了概念屬性及屬性值的發現機制,能確定新概念的屬性及屬性值;3)自動發現領域文本中的事件觸發詞及其論元。這些工作的創新性在于:第一,利用無指導的方法發現新關鍵詞和概念;第二,利用復雜網絡的辦法發現新的社團,其中包含事件觸發詞和可能的論元。下一步的工作集中在基于復雜網絡技術探討本體結構的演化規律,以及結合描述復雜性理論探討領域本體的收斂性問題。
子課題四為事件語義的自動標注研究,本課題旨在基于人工標注的一定數量語料實例和概念本體的基礎上,遵照人工標注事件語義規范,利用機器學習方法,進行事件結構學習和事件關系抽取,為未標注Web頁面自動進行事件語義標注,并在事件語義自動標注軟件的幫助下,獲得更多的標注了事件語義的語料實例,擴展事件本體資源的規模。目前,我們探討了原子事件語義角色,形成了包括3個主體語義角色、4個客體語義角色、2個時空語義角色、5個附加語義角色以及否定、模態、時態等事件語義算子在內的事件語義角色規范;深入了解了成篇七原則中的銜接與連貫,探討了(原子)事件語義關系,形成了包括3個平行類型、4個偏正類型在內的事件語義關系規范;設計并實現了人工輔助事件語義標注工具,針對NTCIR-9 RITE任務的語料,進行了人工事件語義標注,對人工標注過程中的問題進行了深入討論;設計并實現了新聞門戶網站(網易)的網絡爬蟲,通過預處理模塊獲取所爬取的網頁內容。
本子課題的創新之處在于:1)基于新聞文本統計特征以及語言規則,抽取原子事件,獲取新聞文本分析與理解的焦點;2)對事件語義結構與事件語義關系規范的探討,可以促進新聞文本事件語義結構自動標注與事件語義關系標注,有助于新聞文本語義理解;3)將事件語義自動標注與醫療文本信息結合,利用事件語義自動標注方法,對藥物說明書與電子病歷文本進行基于事件語義的計算與理解。
子課題五為基于事件的語義查詢與推理研究,本項目旨在建立一種基于事件的推理模型,以及一種基于事件推理的語義查詢與推理系統。按照預期目標,已經完成以下研究:①推理的形式化表示和推理中涉及的事件關系,即互釋(復述)關系和推導關系的研究,以及事件之間邏輯關系的研究。②事件圖的構建,從詞匯資源、推理資源和在線知識庫中抽取事件,其中的事件構成節點,事件間的推理關系構成邊。③完成了基于事件的蘊涵識別算法,利用Dijkstra算法構建推理算法,并提出了蘊涵置信度評估方法。④完成了基于事件鏈的推理算法。對事件鏈中的邏輯關系進行分類,并利用啟發式規則實現邏輯關系的自動判斷,推理過程采用啟發式規則進行識別。⑤在評測平臺方面,完成了RTE、NTCIR評測數據收集分析,并對評測工作現狀進行分析,完成了原型系統設計、錯誤分析和系統改進。在此基礎上,課題成員參與了NTCIR-10組織的的中文文本推理任務,系統效果在參賽隊伍中名列前茅。
本子課題的創新性在于提出了基于事件圖模型的蘊涵識別方法,該方法能一定程度刻畫深度語義,能夠識別面向語篇的蘊涵關系,有助于提高語義查詢系統的性能。
(二)調研及學術交流情況
項目初期,項目組廣泛查閱了相關課題國內外研究現狀,從語義網知識表示、本體演化、語義查詢與推理等方面對前人研究成果進行了歸納綜述,總結了前人成果存在的語義理解深度不夠、無法處理大規模實時性語義推理以及依靠領域專家手工建構等方面的問題,以此為依據來謀劃布局本項目的研究目標和實施方案。
項目實施以來,為了幫助和實現項目的研究在國內外學科前沿高水平展開,除了團隊內部的例行討論,我們還注重與國內外著名專家學者的火花碰撞,先后邀請了多位國內外知名教授和語義網領域專家前來講座交流,深入探討語言哲學、語言認知等語言學宏觀問題以及語言信息處理等技術前沿問題。
2012年9月,荷蘭阿姆斯特丹自由大學計算機系高級研究員、歐盟第七框架重大項目LarKC中推理組重要成員黃智生教授,通過介紹歐盟第七框架重大語義萬維網技術項目LarKC (http://www.larkc.eu) 所開發的海量語義處理平臺及其語義技術在生命科學上的應用,闡述了海量語義數據處理技術的基本原理、實現方法和應用開發等一系列關鍵問題,對我們項目子課題五中語義查詢與推理在學術上和應用上與國際最新進展同步,具有重要作用。
12月,國內著名語言學家馮志偉教授應邀到我校與項目組成員進行為期一周的交流討論。以語言計算的先驅、認知語言學的研究及語言學的戰略轉移為主題,馮教授對語言學及計算語言學進行全方位的概述,提出了“反思哲學”的觀點,此觀點對我們項目研究中關于語言本體構建及知識表達的科學性具有啟迪和指導作用。
今年4月,國內著名計算語言學專家,清華大學黃昌寧教授應項目組邀請來我校作客講學,黃教授重點解答了如何處理在大數據時代背景下的語言知識構建、語言學分析的關系問題。他還充分肯定了本項目關于本體知識構建的重要性,其訪學對我們更好地完成項目語言本體的構建給予了極大的幫助。
5月,基于子課題二“面向事件的語義網表示與推理機制”,我們特別邀請了荷蘭阿姆斯特丹自由大學人工智能系知識表示與推理研究組Frank van Harmelen教授前來交流。Frank van Harmelen作為語義網領域國際著名專家,語義網國際標準語言OWL的共同設計者,并作為共同項目負責人主持全球第一個語義網研究項目ON-TO-KNOWLEDGE,目前正在領導歐盟大規模知識加速器項目LarKC。與Frank van Harmelen教授的交流主要涉及元級推理以及如何進行有效的知識表示以提高從數據中自動識別正確答案的能力。他提出了一種基于啟發式聚類的方法,該方法與我們基于事件的查詢方式結合,對克服目前學界相關研究的不足,提高我們這方面的研究層次作用甚大。
5月,還組織了《海量語義數據與醫學信息系統》方面的YOCSEF研討會,與受邀來華訪問專家、國際及國內部分醫學信息系統研究廠商共同探討海量語義數據存儲機制、事件語義在臨床質量監管等方面的應用。
此外,2012年7月6日至9日,課題組和我校計算機學院及語言與信息研究中心共同主辦了第13屆漢語詞匯語義學研討會,此次研討會以漢語詞匯語義學的理論、方法、計算及其應用為主題,邀請了日本國東京外國語大學語言學家Yukio Tono、韓國浦項科技大學教授LEE Jong-Hyeok、蘇州大學計算機學院教授周國棟分別就詞匯語義學、機器翻譯中的詞匯語義學、自然語言處理中的語義分析研究等話題作會議特邀報告。會后,大會組織相關領域的專家從來自法國、俄羅斯、日本、韓國、新加坡、蒙古和中國及香港、臺灣等共10個國家和地區的160余名語言學家和計算語言學專家的140多篇論文和摘要中篩選出110篇論文形成會后論文集,該論文集英文版由德國Springer(LNAI)出版社出版,并被EI檢索。
(三)代表性成果簡介
武漢大學該社科重大項目,總結當前語言信息處理成果與不足,在計算機語義理解成為中文信息處理的熱點與前沿的時代背景下,積極探索構建新的語義理解和語義推理模型。對“事件”概念的再定義以及以詞群——詞位變體理論為基礎的漢語同義詞群建構,為我們提出基于事件鏈的語篇連貫理論,通過詞匯鏈的標注進而追溯事件詞提供了可行性上的支持,從而給出了一個判定和應用語篇連貫的新方法。
項目至今,我們在資源建設、軟件開發、學術交流和論文撰寫等方面已經取得了一些代表性的研究成果。在成果表述方面,由項目負責人蕭國政教授和姬東鴻教授合寫的《智能性新一代語義網模型:語言科學與計算機科學的深度聯姻》在中國社會科學報上發表。
迄今,項目組成員發表中英文學術成果53項,其中專著3部,論文集1部,博士學位論文3篇,其它論文46篇,其中中文類核心和計算機類核心各1篇,18篇被收錄EI檢索。
(1)資源建設、軟件開發、論文發表方面
子課題一在研究事件結構的基礎上,確立了漢語篇章中詞匯鏈、事件和事件鏈的標注原則,并開發了事件鏈標注平臺Event Annotation Platform。目前,我們已經完成1000篇中文篇章中的事件鏈的標注,事件鏈標注語料統一來源于賓州中文樹庫的生語料。基于這些研究,已發表論文13篇。
子課題二以三元組形式完成了消防、設備管理領域和臨床醫學領域的資源建構。前者構建了1735種危化品及其相應規則;后者主要表現為三個方面的成果:①根據《衛生部抗生素用藥指南》生成了247條邏輯規則,998條三元組。②根據武漢協和醫院指定的88種抗生素藥生成了2728條三元組。③對DrugBank中的6689種藥物進行漢化處理,生成了528431條三元組,并與國內藥物建立了映射關系。該課題以應用為導向,對基于語義的合理用藥監管、基于語義和云服務的設備管理技術作了深入研究,這些應用成果預見了語義網技術在醫藥領域和設備領域的應用前景。目前,該課題已發表論文10篇,其中6篇被EI檢索。
子課題三已開發了一系列關鍵詞、概念、屬性和屬性值、事件等的發現工具,為確立本體演化機制奠定了基礎。目前已發表論文3篇。
子課題四按照目前的事件語義標注規范,已經人工標注了2701個原子事件,基于此開發了基于統計與規則的新聞原子事件自動抽取系統和人工輔助事件語義標注工具。在研究基礎上,出版了專著《基于認知與計算的事件語義學研究》,從認知與計算角度介紹有關事件語義學的內容,探索事件語義結構認知和事件語義關系,并從計算角度討論了事件語義的形式化。另外,發表學術論文5篇,其中EI收錄期刊1篇,EI收錄會議2篇,中文核心期刊1篇;已錄用待發表的中文核心期刊2篇,學術會議論文1篇。
子課題五在明確推理涉及的事件關系類別的基礎上,完成了事件圖的構建,實現了基于事件的蘊涵識別方法和基于事件鏈的推理算法。在平臺方面,完成了各個評測數據收集分析,并對評測工作現狀進行分析,完成了原型系統設計、錯誤分析和系統改進。基于該課題,已發表12篇學術論文,對于事件語義進行了充分的闡述。
(2)學術交流和學術報告方面
項目組成員還積極參與海內外各項相關學術活動,交流和宣傳本項目的研究及其成果。
2012年7月和12月,項目負責人蕭國政教授分別在第13屆詞匯語義學國際研討會和湖北省語言學會年會大會上作題為《詞義的單個研究與集群研究》的大會報告;10月,在江蘇召開的“當代語言科學創新與發展國際學術研討會暨《語言科學》創刊十周年慶典大會”上作關于《事件模型與事件本體建構——面向自然語言理解的事件研究》的會議報告;10月在華中師大召開的“漢語語序問題”國際學術研討會上,擔任大會主席,并作關于《報告,息序、言語結構與漢語理解——兼論“焦點敏感算子”的語言性質》的論文報告;8月,出席英國利茲大學語言學與漢語教學國際會議,作關于《區分培養對象,回歸語言本體,指向語言應用——指向語言應用的分對象本體研究》的大會主題報告。
此外,項目組成員還在CLSW2012、Coling2012和PAKDD2013等計算語言學領域的國際學術會議上作大會報告和論文報告。2012年2月至2013年2月,項目組還派出成員赴新加坡國立大學進行學術訪問,就文本事件語義與社區問答相結合的問題進行深入探討與研究。
(3)簡報報送方面
項目開展以來,為了及時反饋項目進展,報送簡報6期。
第一期簡報報道了2012年2月15日的項目開題報告會,此次開題報告,明確了該項目的研究構成、研究目標、研究意義、步驟方法和預期成果以及現有基礎,并就項目的5個子課題分別制定了工作手冊,明確了子課題的項目內容、進度安排、人員分工、經費預算、成果形式、成果及成果進展的檢查及驗收標準等,對項目開題和全面實施進行了較充分的規劃和準備。
第二期簡報報道了2012年4月19日的項目培訓會,在此次針對各子課題負責人和參與項目的其他博士、碩士的專題培訓會上,對所有參項人員進行了整合和分組。通過培訓,各子課題負責人明確了本項目的實施和推進方式以及個人所負責子課題的具體任務。
第三期簡報匯報了2012年7月8日項目研討會的召開情況,此次研討會邀請了語言信息處理領域的知名專家香港理工大學文學院院長黃居仁教授、蘇州大學自然語言處理實驗室負責人周國棟教授,他們就語義學領域有關事件的研究做了綜述,在肯定本項目研究意義的同時,對自然語言處理中的語義關系抽取進行了詳細闡述,給了項目組很多啟發。
第四期簡報報告了該項目的應用研究成果在服務社會方面的新亮點,即基于該課題應用的研究成果“2012年中國教育熱點網絡輿情報告”,在全國“兩會”前召開的第五屆“北京?長江教育論壇”上發布的《中國教育黃皮書》(2013)中刊登,后被多家重要媒體轉載報道,引起了強烈的社會反響,標志著該項目在服務于應用方面邁出了堅實的一步。
第五期簡報報告了項目開展以來項目組邀請國內外專家學者進行報告交流的整體概況,我們邀請了荷蘭阿姆斯特丹自由大學計算機系高級研究員以及歐盟第七框架重大項目LarKC中推理組重要成員黃智生教授、國內著名語言學家馮志偉教授、清華大學黃昌寧教授、荷蘭阿姆斯特丹自由大學人工智能系知識表示與推理研究組Frank van Harmelen教授、香港理工大學文學院院長黃居仁教授、蘇州大學自然語言處理實驗室負責人周國棟教授等專家學者來我校作報告交流,從宏觀和圍觀層面與項目組成員共同探討語言信息處理的發展現狀與前景展望,并吸收他們對于本項目的建設性意見。
第六期簡報報告了2013年項目核心資源——事件鏈語料標注系列研討會開展情況,迄今研討會共召開了11次,通過多次的試錯和修正,基本確定了詞匯鏈、NP鏈、事件和事件鏈的確定和標注原則,以及從詞匯鏈到NP鏈、從NP鏈再到事件鏈的整體標注思路,并從可操作性方面比較了從依存語義角度和NP鏈角度進行標注的優劣,在操作性上認可了NP鏈角度在客觀性及效率性上的顯著優勢。隨著討論的不斷深入,還確定了事件鏈牽出之后其事件結構的描寫方式,即其直接論元只用描寫其中心語,然后在結構之后附加其在詞匯鏈上的修飾語對這個中心語的依存關系。
(四)成果宣傳推介情況
子課題一基于事件本體和事件鏈的中文資源建設從比較成熟的詞匯鏈理論出發,結合事件結構的相關理論進而發現篇章的語義結構,這種方法既反映語義內容,也具有結構信息,更能反映篇章的語義內容,為語篇連貫提供了合適的描寫機制和計算基礎。目前,該方法在自動文摘和語言教學中的寫作教學中的優勢已經初步顯現。該部分資源的建設匯聚了來自文學院、外語學院、計算機學院的項目組成員的集體智慧,展示了多學科和跨學科合作的潛力,其論文在國內外學術會議進行了宣讀和報告。
子課題二基于語義的合理用藥監管研究首次將語義技術應用于臨床用藥監管領域,對于臨床中用藥、病情變化及手術等難以用傳統邏輯方法描述的事件進行研究,實現了根據病人病情發展、藥品等綜合因素進行智能用藥監管。目前,該項技術已經受到了廣泛的關注,國內7家省級報社及電視臺報道了項目組與協和醫院的初步研究成果。此外,該子課題基于語義和云服務的設備管理關鍵技術研究首次將云服務機制和語義技術引入設備管理領域,用于設備只是管理、運維計劃及績效考核,取得了良好的效果反饋。該課題通過了省級項目鑒定,等級認定為國內領先。
子課題三項目成員一方面參與了本領域的幾個主要學術會議,同時也將本體結構的部分研究成果應用到了互聯網數據中心和輿情分析領域,并在國家安全、教育和醫療等領域得到了具體應用。
子課題四項目成員在CLSW2013國際學術會議期間,就原子事件語義結構標注方面的問題進行了交流;在新加坡國立大學學術訪問期間,就文本事件語義與社區問答相結合的問題進行了探討與研究;參與了將事件語義運用到醫療信息處理方面的宣傳與推廣。
子課題五成功運用于教育領域熱點網絡輿情監測和收集,該系統對2012年教育熱點網絡輿情的監測,被今年全國“兩會”前召開的第五屆“北京?長江教育論壇”上發布的《中國教育黃皮書》(2013)刊登引用,會后多家重要媒體如中國青年報、中國新聞網、人民網、新華網、中國教育網、鳳凰網、搜狐、網易等都進行了報道轉載。據不完全統計,大陸及香港不同網站、網頁轉載250余次,引起了有關部門和社會大眾對我國教育現狀的深刻反思。
階段性成果
序號 |
成果名稱 |
作者 |
成果形式 |
刊物名或出版社、刊發或 出版時間 |
字數 |
轉載、引用、獲獎等情況 |
1 |
中國語文的現代化與國際化 |
蕭國政 |
專著 |
軍事科學出版社, 2012,7月 |
|
|
2 |
基于認知與計算的事件語義學研究 |
劉茂福胡慧君 |
專著 |
科學出版社 |
25100 |
|
3 |
言說動詞概念語義網絡系統構建研究 |
肖珊 |
專著 |
光明日報出版社 (2013.8) |
129400 |
|
4 |
現代漢語判斷性事件的句法語義分析 |
屠愛萍 |
博士學位論文 |
武漢大學 2013 |
14200 |
|
5 |
基于事件鏈的語篇連貫研究 |
張明堯 |
博士學位論文 |
武漢大學博士學位論文,2013年5月 |
130000 |
|
6 |
以“拿”為認知基元的現代漢語動詞同義詞群建構研究 |
馮麗 |
博士學位論文 |
武漢大學博士學位論文 |
|
|
7 |
Chinese Lexical Semantics(《漢語詞匯語義學》) |
姬東鴻 蕭國政主編 |
論文集 |
第13屆詞匯語義學國際研討會(CLSW2012)論集 【德國】Springer出版社, 2013,2月 |
|
EI檢索 |
8 |
Discourse Coherence: Lexical Chain, Complex Network and Semantic Field |
Mingyao Zhang |
論文 |
Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, pp. 756–765, 2013. |
5200 |
EI檢索 |
9 |
Verbal Empty Categories and Their Types in Mandarin |
Tu, A. P.& Zhang, L. |
論文 |
In Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, 2013. |
18000 |
EI檢索 |
10 |
The NLP-Oriented Empty Categories [A]. Proceedings of the 2nd International Conference on EMEIT |
Tu, A. P. |
論文 |
Paris:Atlantis Press, 2012. |
11000 |
EI檢索 |
11 |
Semantic Labeling of Chinese Serial Verb Sentences Based on Feature Structure |
Bo Chen,Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
EI檢索 |
12 |
Measuring the Semantic Relevance between Term and Short Text: Using the Concepts of Shortest Path Length and Relatively Important Community |
Hua Yang,Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
EI檢索 |
13 |
Rapid Increase of the Weighted Shortest Path Length in Key Term Concurrence Network and Its Origin |
Lan Yin, Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
EI檢索 |
14 |
Discourse Coherence: Lexical Chain, Complex Network and Semantic Field |
Mingyao Zhang,Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
EI檢索 |
15 |
New Exploration into the Word Semantic Generation Mechanism Based on Word Representation |
Shengjian Ni, Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
EI檢索 |
16 |
Atomic Event Semantic Roles and Chinese Instances Analysis |
Maofu Liu,Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
14000 |
EI檢索 |
17 |
The Systematic Characters of Synonymous Paradigm in Chinese |
Dan Hu |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
14000 |
EI檢索 |
18 |
Leveraging Hybrid Citation Context for Impact Summarization |
Po Hu,Donghong Ji |
論文 |
In Proceedings of the 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013).Springer
|
3000 |
|
19 |
Context-Enhanced Personalized Social Summarization |
Po Hu,Donghong Ji |
論文 |
In Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012) |
3000 |
|
20 |
Joint Na?ve Bayes and LDA for Unsupervised Sentiment Analysis |
Yong Zhang, Donghong Ji |
論文 |
In Proceedings of the 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013).Springer
|
3000 |
|
21
|
Ensemble Learning for Sentiment Classification |
Ying Su, Yong Zhang, Donghong Ji |
論文 |
The 13th Chinese Lexical Semantics Workshop,China(CLSW2012).Springer |
13000 |
EI檢索 |
22 |
On the core elements in sememic description from the perspective of lexicographical interpretation |
王興隆 |
論文 |
第十三屆漢語詞匯語義學研討會2012 |
6584 |
EI檢索 |
23 |
The Text Deduction and Model Realization of the Lexical Meanings in Dictionaries Based on “Synset-Lexeme Anamorphosis” and “Basic Semantic Elements and Their Structures” |
蕭國政王興隆 |
論文 |
第十三屆漢語詞匯語義學研討會 2012 |
6290 |
EI檢索 |
24 |
Semantic derivation patterns of the Chinese character "SHENG" - A Perspective from metaphor |
Xiong, Weidu;Zhao, Ling |
論文 |
Chinese Lexical Semantics - 13th Workshop, CLSW 2012、LNAI, 2013, |
6497 |
EI檢索 |
25 |
A Syntactic, Semantic and Cognitive Analysis of Existential Sentence Oriented to Language Information Processing—Taking “V-Construction” as an Example |
Xiong, Weidu |
論文 |
Advanced Materials Research Vols. 756-759 (2013) pp 2081-2085 |
3080 |
|
26 |
Atomic Event Semantic Roles and Chinese Instances Analysis |
Maofu Liu, Yan Li, Donghong Ji, Yi Zheng |
論文 |
Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, 2013.
|
|
EI收錄(收錄號:20130916058292) |
27 |
Multi-Document Extractive Summarization Using Event Semantic Relation Graph Clustering |
Maofu Liu, Huijun Hu |
論文 |
International Journal of Advancements in Computing Technology |
|
EI收錄(收錄號:20125215844456) |
28 |
Social Relation Extraction Based on Chinese Wikipedia Articles |
Maofu Liu |
論文 |
Ji, D. H. & Xiao, G. Z. (eds.). Chinese Lexical Semantics [C]. Berlin: Springer, 2013. |
|
EI收錄(收錄號:20130916058290) |
29 |
Semantic Cache and Replacement Policy for XML Algebra based Query Optimization |
顧進廣等 |
論文 |
International Journal of Computer Mathematics |
|
EI檢索 |
30 |
A Semantic Annotation Algorithm for Content-Based Recommendation |
王鈺巍等 |
論文 |
ICIE 2012 |
|
|
31 |
Publishing CLOD of Dangerous Chemicals Based on Semantic MediaWiki |
鄧海龍等 |
論文 |
中國語義網大會(CSWS 2013) |
|
EI檢索 |
32 |
Pharmaceutical semantic database query mechanism Based on KeyWords |
孫鵑等 |
論文 |
中國語義網大會(CSWS 2013) |
|
EI檢索 |
33 |
Automatic construction approach for Ontology based on medical medication guide |
陸玉婷等 |
論文 |
中國語義網大會(CSWS 2013) |
|
|
34 |
智能性新一代語義網模型:語言科學與計算機科學的深度聯姻 |
蕭國政 姬東鴻 |
論文 |
中國社會科學報,2012-09-05 |
|
|
35 |
基于詞語表示的語義生成機制新探 |
倪盛儉姬東鴻 |
論文 |
第十三界詞匯語義學國際會議
|
6000 |
|
36 |
基于實例分析的原子事件語義標注研究 |
劉茂福姬東鴻 |
論文 |
第十三界詞匯語義學國際會議
|
6000 |
|
37 |
基于事件鏈的漢語語篇連貫資源建設 |
張明堯 |
論文 |
長江學術、2013年4月 |
6400 |
|
38 |
篇章連貫:詞匯鏈、復雜網絡、語義場 |
張明堯等 |
會議論文 |
第十三屆詞匯語義學國際會議,2012年7月 |
5000 |
|
39 |
顯性非賓格動詞句的語義特征 |
屠愛萍 |
論文 |
長江學術,2013,(2) |
5000 |
|
40 |
現代漢語非名詞性空語類 |
屠愛萍 |
論文 |
現代外語,2013,(3) |
12000 |
|
41 |
隱性形式、扣合和句位變體 |
屠愛萍 |
論文 |
漢語學習,2013,(4) |
11000 |
|
42 |
“事件”的概念厘定和多維表征 |
王興隆 |
論文 |
《中文信息學報》2013可刊 |
8969 |
計算機類核心(蘇州會議論文) |
43 |
從兩版《現代漢語詞典》的對比看義位描寫的轉向 |
王興隆
|
論文 |
中國語文現代化第一屆國際會議 2012 |
6808 |
|
44 |
基于統計與詞匯語義特征的中文文本蘊涵識別 |
劉茂福李 妍 顧進廣 |
論文 |
計算機工程與設計 |
|
中文核心期刊 |
45
|
題元角色理解與英語動詞一詞多義的認知與教學 |
雙文庭 |
論文 |
武漢科技大學學報(社會科學版)2012(3) |
|
|
46 |
存現句的句法語義及認知分析——以“發生”句為例 |
熊葦渡 |
論文 |
社會科學論壇、2013(6) |
5400 |
|
47 |
規則與統計相結合的主謂謂語句的日漢機器翻譯研究 |
熊葦渡 |
論文 |
理論月刊、2013(4) |
9000 |
CSSCI擴展版 |
48 |
重復圖數據收縮清理策略 |
黃莉等 |
論文 |
計算機工程與應用 |
|
EI檢索 |
49 |
基于語義和云服務的設備管理關鍵技術 |
顧進廣等 |
項目鑒定 |
|
|
結論:國內領先 |
50 |
抗菌藥物指南知識的語義轉換與生成 |
顧進廣等 |
論文 |
中國數據醫學,2013.4 |
|
|
51 |
基于圖數據庫的RDF數據分布式存儲 |
項靈輝等 |
論文 |
計算機應用與軟件 |
|
EI檢索 |
52 |
基于任務搶占與數據分區的XML多核查詢優化 |
吳鋼等 |
論文 |
工業控制計算機 |
|
EI檢索 |
53 |
基于概念特征的漢語交互類言說動詞詞義分析及同義詞群的建構 |
肖珊 |
論文 |
中文信息學報 (即將刊登) |
7800 |
|
(課題組供稿)