• <samp id="sgkyk"><pre id="sgkyk"></pre></samp>
    
    

    舊版網(wǎng)站入口

    站內(nèi)搜索

    面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究中期檢測報告

    2016年11月29日15:38來源:全國哲學(xué)社會科學(xué)工作辦公室

    一、研究進展情況

    ①研究計劃總體執(zhí)行情況及各子課題進展情況

    項目總體按計劃進行,至今已完成了第一階段和第二階段的大部分工作,正在重點推進第三階段的工作。第一階段的任務(wù)為:數(shù)據(jù)收集和基礎(chǔ)理論研究(2013.1-2013.6);第二階段的任務(wù)為:專項深化研究(2013.7-2015.7)。在前兩個階段工作的基礎(chǔ)上,正在設(shè)計原型系統(tǒng)和開發(fā)測試,同時開展實證研究(詳見后文報告)。2014年7月以來的研究內(nèi)容主要包括:基于SVR模型的中文領(lǐng)域術(shù)語自動抽取研究;信息覓食理論與學(xué)科導(dǎo)航網(wǎng)站性能優(yōu)化;搜索引擎服務(wù)質(zhì)量與用戶忠誠關(guān)系的實證研究;大數(shù)據(jù)時代科技情報服務(wù)的挑戰(zhàn)與思考;基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架研究;基于機器學(xué)習(xí)的自動文摘研究綜述;基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建;網(wǎng)絡(luò)檢索結(jié)果聚類研究綜述 ;中文網(wǎng)絡(luò)灰色文獻分布探析,等等。

    2014年7月以來已發(fā)表35篇學(xué)術(shù)論文,其中英文論文8篇,中文論文27篇。

    ②調(diào)查研究及學(xué)術(shù)交流情況

    調(diào)查研究情況。目前采集的數(shù)據(jù)和文獻資料主要用于學(xué)科本體構(gòu)建、用戶行為研究、學(xué)科服務(wù)機制研究等實證研究方面。其中,2000-2015年《情報學(xué)報》數(shù)據(jù)集用于中文領(lǐng)域術(shù)語自動抽取研究;200多萬條查詢?nèi)罩緮?shù)據(jù)用于基于搜索日志的用戶行為分析;5萬余篇CSSCI論文題錄數(shù)據(jù)用于我國圖書情報學(xué)科知識結(jié)構(gòu)的演化分析;259份問卷數(shù)據(jù)用于對搜索引擎服務(wù)質(zhì)量評價體系的研究;89份問卷訪談樣本數(shù)據(jù)用于行動者網(wǎng)絡(luò)理論視角下的CALIS運行機制研究,等等。此外,項目組成員還奔赴北京、上海等地的高校、圖書館、情報所、企業(yè)等研究機構(gòu)進行實地調(diào)研和數(shù)據(jù)資料采集工作。

    學(xué)術(shù)交流情況。學(xué)術(shù)會議: 2015年3月,項目主持人和骨干成員出席iSchool年會(iConeference 2015),參與了大會專題研討會和海報展示,并參加了多項學(xué)術(shù)交流活動; 2015年7月初,項目組成員赴土耳其伊斯坦布爾參加第15屆國際科學(xué)計量學(xué)與信息計量學(xué)年會并做邀請報告;2016年3月,項目組成員赴美國費城參加iConference 2016年會;2016年6月,項目組成員赴北京參加數(shù)據(jù)科學(xué)與情報學(xué)國際研討會。國際合作:2016年4月-6月間,項目組成員陸續(xù)邀請到前任國際科學(xué)計量學(xué)與信息計量學(xué)學(xué)會(ISSI)主席Prof. Dr. Ronald Rousseau、美國Indiana University的Prof. Ying Ding、美國UIUC信息學(xué)院副院長Prof. J. Stephen Downie等前來開展交流合作,圍繞信息資源的測度以分析、用戶采納和接受信息的行為、網(wǎng)絡(luò)數(shù)據(jù)挖掘等主題進行了深入的探討。

    ③成果宣傳推介情況

    2014年7月7日,項目負責人以本項目首席專家身份在光明日報理論版發(fā)表文章《大數(shù)據(jù)時代人文社會科學(xué)如何發(fā)展》,探討學(xué)科發(fā)展尤其是人文社會科學(xué)研究在大數(shù)據(jù)時代的發(fā)展問題,并對項目成果進行宣傳推介。本文受到全國哲學(xué)社會科學(xué)規(guī)劃辦公室網(wǎng)站、光明網(wǎng)、人民網(wǎng)、求是網(wǎng)、鳳凰網(wǎng)、中國臺灣網(wǎng)等多家網(wǎng)絡(luò)媒體轉(zhuǎn)載。

    2016年2月,項目首席專家在《人民日報》發(fā)表專刊理論文章,縱論“大數(shù)據(jù)使社科研究不再“望數(shù)興嘆”。文章從研究全程評價和全部研究數(shù)據(jù)資產(chǎn)化、研究資料的碎片化重組、計算化分析與可視化表現(xiàn)的結(jié)合、學(xué)科融合與數(shù)據(jù)服務(wù)發(fā)展等視角闡述如何運用大數(shù)據(jù)開啟社會科學(xué)研究新局面。文章還認為,大數(shù)據(jù)的運用還將進一步推動學(xué)術(shù)技術(shù)分析服務(wù)、數(shù)據(jù)服務(wù)的發(fā)展,傳統(tǒng)承擔文獻資料服務(wù)和普通信息服務(wù)的圖書館、情報服務(wù)機構(gòu)等將向數(shù)據(jù)委托服務(wù)、計算分析服務(wù)轉(zhuǎn)型。人民日報網(wǎng)絡(luò)版、中國社會科學(xué)網(wǎng)、新華網(wǎng)、環(huán)球網(wǎng)等主流媒體均予以宣傳報道,很好地對項目的研究成果進行了宣傳推介。

    此外,項目組還向國家哲學(xué)社會科學(xué)規(guī)劃辦公室遞交成果簡報1份,向《情報學(xué)報》、《圖書情報工作》、《情報科學(xué)》等期刊進行了推介,洽談專題組稿的計劃和工作安排。

    ④研究中存在的主要問題、改進措施,研究心得、意見建議

    一些最新的研究進展和階段性成果沒有及時進行總結(jié),并將最新進展報送規(guī)劃辦公室,在通過新聞媒體向社會大眾宣傳推廣上也存在不足。今后,課題組應(yīng)繼續(xù)加強向規(guī)劃辦提供工作簡報,并利用多種有效途徑向?qū)W術(shù)網(wǎng)站、重要報刊、學(xué)術(shù)期刊等媒體推介課題研究成果,加強對研究成果的宣傳推廣。

    在深層網(wǎng)絡(luò)數(shù)據(jù)的采集和價值挖掘上,遇到了一些難點,這也是本課題中比較難以應(yīng)對的任務(wù),對原型系統(tǒng)的開發(fā)也需要進一步加大人力物力。課題組將在接下來的工作階段中,繼續(xù)凝神聚力,攻堅克難,爭取在這兩個方面取得突破和進展。

    二、研究成果情況

    代表性成果Journal of Informetrics發(fā)文“Selecting publication keywords for domain analysis in bibliometrics: A comparison of three methods”,著重探討了文獻關(guān)鍵詞分析中一個尚未引起重視的問題,即在大量領(lǐng)域文獻中如何精確有效地選擇關(guān)鍵詞分析的對象。論文討論了傳統(tǒng)的TF方法,以及兩種替代方法:TF-IDF方法以及TF-KAI方法。這兩種方法考慮到了關(guān)鍵詞消歧。進一步的實證研究表明,TF-KAI方法表現(xiàn)性能最佳,它能夠保存領(lǐng)域?qū)<姨暨x出的關(guān)鍵詞,并揭示領(lǐng)域內(nèi)的研究焦點。本文對關(guān)鍵詞選取的理論和實踐具有重要價值。

    代表性成果Scientometrics發(fā)文“Exploring the topic hierarchy of digital library research in China using keyword networks a K-core decomposition approach”,提出一種通過構(gòu)建關(guān)鍵詞網(wǎng)絡(luò)以及K核分解,自動發(fā)現(xiàn)主題層級的方法。相鄰的類團能夠根據(jù)其密度和聚類系數(shù)合并到對應(yīng)層級中。對中國數(shù)字圖書館領(lǐng)域的關(guān)鍵詞網(wǎng)絡(luò)進行分析,發(fā)現(xiàn)了4個不同的層級。基礎(chǔ)層包含17個內(nèi)部緊密相聯(lián)系的核心概念;中間層包括13個中介概念,并與基礎(chǔ)層中的技術(shù)概念直接相連;詳細層包含65個實體概念,并聚成13個類團;邊緣層則包含了一個局部和孤立的概念。

    代表性成果《圖書與情報》發(fā)文“大數(shù)據(jù)時代科技情報服務(wù)的挑戰(zhàn)與思考”,從大數(shù)據(jù)科技環(huán)境的時代特征著手分析了大數(shù)據(jù)環(huán)境對科技情報工作的主要挑戰(zhàn),并結(jié)合當前實踐提出了相應(yīng)的對策建議。論文認為:數(shù)據(jù)處理是科技情報機構(gòu)服務(wù)創(chuàng)新的動力。大數(shù)據(jù)的離散分布和開放可得、用戶信息需求向深度廣度發(fā)展以及資源服務(wù)一體化,弱化了科技情報機構(gòu)的資源優(yōu)勢,提高了信息分析的難度,給科技情報機構(gòu)的服務(wù)能力提出了挑戰(zhàn)。同時,也為大規(guī)模資源保障體系和信息服務(wù)模式的創(chuàng)新提供了可能。

    代表性成果《情報資料工作》發(fā)文“行動者網(wǎng)絡(luò)理論視角下的CALIS運行機制”,從信息管理的視角,將行動者網(wǎng)絡(luò)理論引入CALIS運行機制的研究中,系統(tǒng)地分析目前CALIS的運行機制及現(xiàn)狀。結(jié)果表明現(xiàn)存障礙共包括經(jīng)費不足、忽略以用戶為中心的資源建設(shè)及技術(shù)。支撐不夠等七個層面,各行動者涉及的利益主要包括共建、共享及共知等七個維度。最后文章對現(xiàn)有問題給出了相應(yīng)的對策,并對未來CALIS可能的發(fā)展方向進行了探索。

    代表性成果《情報理論與實踐》發(fā)文“基于SVR模型的中文領(lǐng)域術(shù)語自動抽取研究——面向圖書情報領(lǐng)域”,結(jié)合語言學(xué)和統(tǒng)計方法,通過構(gòu)建術(shù)語庫提取術(shù)語抽取模板來抽取候選術(shù)語。此外,還通過引入回歸的方法,將術(shù)語抽取問題轉(zhuǎn)化為對詞語成為術(shù)語的概率的預(yù)測問題。術(shù)語是本體的重要組成部分,術(shù)語自動抽取是本體自動構(gòu)建的基礎(chǔ),文章采用回歸的方法對未登錄詞進行概率( 某個數(shù)值( 組合) 對應(yīng)的候選詞集合中術(shù)語的概率) 預(yù)測,獲得該詞可能為術(shù)語的概率。論文提出的方法最后通過實驗驗證了其有效性。

    代表性成果《情報科學(xué)》發(fā)文“基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架研究”,以網(wǎng)絡(luò)資源為研究對象,以多維度聚合為主要手段,針對網(wǎng)絡(luò)資源內(nèi)容的大數(shù)據(jù)化、動態(tài)化、多維度等特征,探索基于語義關(guān)聯(lián)的網(wǎng)絡(luò)資源深度揭示與多維度聚合,以此為基礎(chǔ)研究基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架,進而研發(fā)基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)技術(shù)系統(tǒng),并結(jié)合特定領(lǐng)域、特定需求進行應(yīng)用示范與對策研究。

    代表性成果《圖書館》發(fā)文“基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建”,回顧關(guān)聯(lián)數(shù)據(jù)、學(xué)科網(wǎng)絡(luò)信息深度聚合概念;分析基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建的可行性,構(gòu)建“聚合框架”并對學(xué)科網(wǎng)絡(luò)信息關(guān)聯(lián)數(shù)據(jù)發(fā)布工作流程進行分析;提出“聚合框架”實施應(yīng)該注意的問題:如成立學(xué)科網(wǎng)絡(luò)信息關(guān)聯(lián)數(shù)據(jù)管理中心,發(fā)布中文編碼體系詞表的關(guān)聯(lián)數(shù)據(jù),遵守關(guān)聯(lián)數(shù)據(jù)查詢的內(nèi)容協(xié)商機制,注意關(guān)聯(lián)數(shù)據(jù)訪問控制問題以及注意關(guān)聯(lián)數(shù)據(jù)更新的同步問題等。

    代表性成果《情報資料工作》發(fā)文“信息覓食理論與學(xué)科導(dǎo)航網(wǎng)站性能優(yōu)化”,首先回顧信息覓食理論的理論基礎(chǔ)和基本模型;然后將信息線索劃分為文字型、像型、音頻型和視頻型四種類型,設(shè)計信息線索在學(xué)科導(dǎo)航網(wǎng)站中應(yīng)用的五個原則;最后,構(gòu)建基于信息覓食理論的學(xué)科導(dǎo)航網(wǎng)站性能優(yōu)化模型,選擇美國的Infomine學(xué)科導(dǎo)航網(wǎng)站進行案例分析。

    代表性成果《現(xiàn)代圖書情報技術(shù)》發(fā)文“基于搜索日志的用戶行為分析”,利用搜索引擎日志數(shù)據(jù)對用戶查詢行為特征進行分析。采用分詞、統(tǒng)計分析、聚類分析、可視化等方法,分別從用戶的查詢串、查詢方式、查詢主題、查詢點擊行為和用戶類型5個方面對用戶使用搜索引擎時的行為特征進行分析。發(fā)現(xiàn)搜索用戶偏好使用2-5個中文名詞短語組成的查詢串;更少使用口語化查詢,不愛使用高級檢索功能;查詢用詞變得多樣化;查詢時間存在高峰低谷;再次證實存在"翹尾現(xiàn)象"。使用搜索引擎日志可以獲得用戶行為特征,并能為改善搜索引擎提供一些建議。

    代表性研究成果《情報理論與實踐》發(fā)文“網(wǎng)絡(luò)檢索結(jié)果聚類研究綜述”,根據(jù)網(wǎng)絡(luò)檢索結(jié)果聚類算法的改進方向?qū)⑵浞譃槊嫦蚪?jīng)典和面向標簽的聚類算法兩類。前者的改進主要有優(yōu)化特征選擇、優(yōu)化聚類數(shù)K以及生成重疊聚類等; 后者的改進主要有優(yōu)化類計分運算、優(yōu)化類合并運算、數(shù)據(jù)結(jié)構(gòu)優(yōu)化、候選標簽選擇以及基于語義的優(yōu)化等。在對相關(guān)研究進行綜述的基礎(chǔ)上探討了檢索結(jié)果聚類面臨的問題和未來的發(fā)展方向。

    課題組供稿

    (責編:沈王一)
    国产精品高清一区二区人妖| 无码国产精品一区二区免费式影视| 久热精品视频在线观看99小说| 日韩精品亚洲人成在线观看| 色哟哟精品视频在线观看| 国产精品午夜国产小视频| 无码精品一区二区三区在线| 国内精品视频一区二区三区八戒| 国内精品久久久久影院薰衣草| 亚洲中文字幕久久精品无码2021| 国产伦精品一区二区三区免费下载| 亚洲精品国产成人片| 国产精品亚洲一区二区在线观看| 在线观看国产精品日韩av| 亚洲精品国产福利在线观看| 国产精品va在线观看无码| 久久99精品久久久大学生| 久久精品国产99精品最新| 奇米影视国产精品四色| 国产精品夜色视频一级区| 国产成人精品福利色多多| 精品无人区一区二区三区| 国产精品gz久久久| 精品特级一级毛片免费观看| 久久亚洲日韩精品一区二区三区| 国产一精品一aⅴ一免费| 毛片亚洲AV无码精品国产午夜 | 国产精品永久久久久久久久久| 国产精品毛片AV久久66| 少妇人妻偷人精品无码AV| 香蕉久久夜色精品国产2020| 亚洲精品制服丝袜四区| 99久久精品费精品国产一区二区| 国产精品无码亚洲精品2021 | 久热爱精品视频线路一| 12345国产精品高清在线| 99精品视频在线观看re| 久久精品夜色噜噜亚洲A∨| 国产手机精品视频| 国产成人精品亚洲一区| 老司机精品福利在线|