• <samp id="sgkyk"><pre id="sgkyk"></pre></samp>
    
    

    舊版網站入口

    站內搜索

    面向知識創新服務的數據科學理論與方法研究的中期檢查報告

    2018年12月03日16:01來源:全國哲學社會科學工作辦公室

    一、研究進展情況

    1研究計劃總體執行情況及各子課題進展情況

    本項目共分為五個子課題,分別為:

    子課題一:面向知識創新服務的數據科學理論研究:目的與體系

    子課題二:面向知識創新服務的數據科學方法研究:信息采集與知識抽取

    子課題三:面向知識創新服務的數據科學方法研究:知識融合與知識發現

    子課題四:面向知識創新服務的數據科學應用研究:知識創新服務機制

    子課題五:面向知識創新服務的數據科學應用研究:實現與驗證

    以總體方案為指導,按照研究計劃,通過文獻檢索、網絡調查、實地調研、專家訪談與通信咨詢等方式,針對要解決的問題和要研究的內容,分別開展了各個子課題的研究,并在研究過程中注重各個子課題之間的關聯,總體執行情況概要如下:

    ? 從2016年12月開始,結合原有的工作積累,對有關“知識創新”“知識服務”“數據科學”“知識發現”“知識融合”等相關研究進行文獻檢索、文摘閱讀與原文篩選下載等工作,并且這項工作一直在持續進行著;

    ? 咨詢國內外領域專家對課題開展與開題等工作進行指導,同時,制定課題開題論證會議議程,2017年2月25日召開了開題會,邀請到會的9位專家分別來自中國社會科學院、上海社科科學院、北京大學、武漢大學、南京大學、華中師范大學、南京農業大學等機構;

    ? 2017年4-7月間,分別對中國科技信息研究所、中國船舶749所、中國兵器210所、中國同方、等知識服務機構進行實地訪問和網絡調查,向情報工作人員發放問卷,與研究人員交流等,獲得了有關知識服務、知識創新等方面的第一手資料;

    ? 選取數字圖書館、全文數據庫網站、學術搜索引擎三種類型的在線知識服務平臺和Research Gate、分答、值乎、推文等社交平臺,采集相關數據進行數據處理、數據挖掘、知識融合與發現等的數據科學理論和方法研究;

    ? 邀請國內外學者研討與交流6次;

    ? 舉辦主題為“數據科學驅動的圖書資訊學變革與轉型”第14屆海峽兩岸圖書資訊學學術研討會1次;

    ? 完成發表17篇期刊論文,其中:被SCI/SSCI雙收錄1篇、CSSCI收錄13篇、CSSCI擴展版收錄3篇;

    ? 完成頂級國際會議論文7篇;

    ? 完成錄用待發表期刊論文8篇,其中:被SCI/SSCI雙收錄1篇、被SCI收錄2篇、ESI收錄1篇、CSSCI期刊收錄4篇;

    ? 完成待出版專著1本:數據驅動的知識服務體系與方法;

    ? 此外,參加2017年計算語言學領域的自動摘要國際測評比賽論文1篇,專家寄語1篇,首席專家被邀大會報告與講座9次。

    下面將分別簡述子課題的進展情況

    1.1子課題一:面向知識創新服務的數據科學理論研究:目的與體系

    該子課題是關于研究背景、需求與體系構建的探索部分,圍繞著大數據、學科知識創新、知識創新服務和數據科學展開。

    ① 2017年1月至2017年3月,按照計劃開展的工作如下:

    ? 對有關“知識創新”“知識服務”“數據科學”等相關研究進行文獻與綜述;

    ? 在聽取專家論證建議與文獻綜述分析基礎上,課題組進一步凝練了要強化圖書情報與數據科學關聯研究,并突出實證檢驗研究以體現理論對實踐的指導意義的方案。

    ②2017年4月至2017年8月,按照計劃開展的工作如下:

    ? 通過文獻調查、數據調查等手段,研究知識創新與大數據、知識服務與大數據、知識創新服務內涵、數據科學的內涵、特征,以及綜述與分析相關研究的國內外現狀;

    ? 通過實地調查與專家訪談,探究大數據環境下現有知識服務存在的問題以及知識服務未來的發展動向。在調研中,側重對知識獲取、知識特征提取、知識多源集成、知識檢索、知識抽取和知識應用六個方面的服務進行調查與分析,研究大數據對學科知識創新的重構,總結大數據環境下學科知識創新的知識創新服務需求。

    ③2017年9月至2018年2月,按照計劃開展的工作如下:

    ? 通過文獻調查、歸納總結等方法,在對國內外知識創新服務相關研究現狀研究基礎上,結合學科知識創新的轉變與新路徑研究以及知識服務的重構需求,引入野中郁次郎的SECI模型和DIKW價值鏈模型,研究知識創新服務的內涵、特征、影響因素與支撐要素;

    ? 以“DIKW價值鏈”為指導,借助于“綜合集成研討廳”將專家智慧、數據和信息、計算機技術相結合的思想,首先,分析在知識創新服務中的數據流動的特點、方法與表現形式;然后,對“DIKW價值鏈”按照“大數據(D)?蘊含知識的信息(I)?元知識(K)?智慧(融合和涌現知識)(W)”進行重構與解讀。再次,以“重構的DIKW價值鏈”為主線,研究并構建面向知識創新服務的數據科學的學理思想與基本方法論。

    ④2018年3月至2018年7月,按照計劃開展的工作如下:

    ? 以知識創新服務需求為驅動,以重構的“DIKW價值鏈”為導向,將數據科學的核心研究內容(多源異構數據獲取、數據預處理、數據統計分析、數據挖掘、數據可視化和數據產品)與知識創新服務的核心內容(知識創新、信息采集與知識抽取、知識融合與知識發現、知識創新服務機制、知識創新服務應用)相結合,研究并構建面向知識創新服務的數據科學理論與方法體系。

    1.2子課題二:面向知識創新服務的數據科學方法研究:信息采集與知識抽取

    該子課題是圍繞知識創新服務目標,探索多源數據的信息采集與知識抽取面臨的特殊性和困境,提出可行的信息采集與知識抽取模式、途徑和程序。

    ①2017年1月至2017年3月,按照計劃開展的工作如下:

    ? 整理與分析現有基于多源數據的信息采集與知識抽取現狀、功能和缺陷等。

    ②2017年4月至2017年6月,按照計劃開展的工作如下:

    ? 通過分別對中國科技信息研究所、中國船舶749所、中國兵器210所、中國同方等知識服務機構進行實地訪問和網絡調查,研究面向知識創新服務的知識源特征與采集需求,分析了面向知識創新服務的知識抽取的新特點與需求。

    ③2017年7月至2017年9月,按照計劃開展的工作如下:

    ? 在現有研究調查基礎上,研究了數據源的評估原則、數據數據源質量評估體系構建,數據源質量評估方法實現;

    ? 針對基于多源數據的信息采集模式與采集加工平臺,從采集流程中三個重要組成部分展開了研究:一是多源異構資源及其相應的數據格式(數據源產生途徑、類型特征、分布形式);二是用戶需求經轉化后形成的數據源質量信息和配置信息;三是針對不同類型數據源采集模塊的功能設計。具體地,首先對網絡數據資源采集的典型方法和關鍵技術開展技術基礎進行了研究;其次通過實驗樣例和測評指標對多源數據的信息采集技術方案適用性進行評估;再次針對所采集的數據結果,研究數據清洗與預處理的手段。由此,設計提出了基于多源數據的信息采集模式與流程。

    ④2017年10月至2018年2月,按照計劃開展的工作如下:

    ? 對大數據驅動的知識抽取涉及到的關鍵技術進行研究,具體有異構知識源的知識抽取方法研究和大數據驅動的知識迭代抽取模式,包括詞語語義知識的分類研究,引文域的自動識別、引用類型的分類以及自動摘要研究。尤其是針對科技文本的引文內容方面,進行了引文內容抽取與相關應用的研究,利用在線圖書評論數據,對圖書評論與館藏的相關性進行了探索等。

    ⑤2018年3月至2018年6月,按照計劃開展的工作如下:

    ? 調查了知識驗證方法方面的國內外研究現狀,尤其是對候選知識質量評估方法進行了比較分析,并以人工智能的研究為例,進行實證分析。

    1.3子課題三:面向知識創新服務的數據科學方法研究:知識融合與知識發現

    該子課題是圍繞著知識融合和知識發現的理論、方法、技術以及工具等,進一步深化面向知識創新服務的數據科學的理論與方法研究。

    ①2017年1月至2017年3月,按照計劃開展的工作如下:

    ? 結合原有關于知識融合研究(發表在《數字圖書館論壇》上的論文“大數據時代知識融合體系架構設計研究”和前期課題)的工作積累,實證走訪調查了中國科技信息研究所、上海社會科學院信息研究所、江蘇省科學技術情報研究所、中國同方等機構,咨詢國內外領域專家,收集和閱讀有關知識融合與知識發現等相關文獻,并進一步整理和分析國內外研究現狀,掌握現有知識融合與知識發現的現狀、功能和缺陷等。

    ②2017年4月至2017年8月,按照計劃開展的工作如下:

    ? 針對基于多維動態組合的知識融合與知識發現模式進行了系列研究,主要有:通過引文內容分析探索高被引論文的影響力演化模式,利用中文在線社交網站研究用戶飲食的偏好與演化模式,通過情感分析技術探測社交網絡上的中國用戶飲食偏好等。

    ③2017年9月至2018年2月,按照計劃開展的工作如下:

    ? 針對大數據驅動的知識融合與知識發現關鍵技術和方法進行了系列研究,主要有:利用引文數據的內容融合探測學科交叉知識,以Research Gate為例評估學術社會化問答平臺的答案質量,對學術論文寫作風格的度量、論文接受與稿件處理周期的關系、基于學術社交網絡上閱讀行為進行學科交叉度計算,基于科學推文數據的非正式科學交流語言分布、作者行為模式與地理分布,基于政策文件數據的替代計量指標分布特征等。

    ④2018年3月至2018年8月,按照計劃開展的工作如下:

    ? 針對知識融合與知識發現結果的展示及驗證,主要的研究有文獻調查與整理,構建情報研究知識庫,分別以人工智能和石墨烯為例的實證分析,形成了初步的研究結果。

    1.4子課題四:面向知識創新服務的數據科學應用研究:知識創新服務機制

    該子課題的研究包括知識創新服務的需求、知識創新服務的模式、知識創新服務的運作以及知識創新服務的保障等。

    ① 2017年1月至2017年6月,按照計劃開展的工作如下:

    ? 通過網絡調查,選取數字圖書館、全文數據庫網站和學術搜索引擎三種類型的在線知識服務平臺進行研究,以分析現有知識服務平臺提供的學術資源、知識服務的表現形式與平臺功能等;

    ? 結合調查與分析,研究與界定知識創新服務的定義、內涵與特點,以形成相關的理論與方法基礎。

    ②2017年7月至2017年12月,按照計劃開展的工作如下:

    ? 借鑒數據科學的理論方法探索知識創新服務的顯在需求分析、潛在需求分析,對用戶的行為軌跡和活動規律進行特征表示、特征提取、用戶建模,挖掘出用戶潛在和顯在的知識服務需求進行研究,并通過綜述研究了IT采納和使用中用戶轉移行為的特征、模式與影響因素。

    ③2018年1月至2018年6月,按照計劃開展的工作如下:

    ? 通過調查與實證分析大數據時代知識服務平臺和系統所需的各種情報技術和工具,基于“DIKW價值鏈”從知識揭示、知識導航、智能檢索、知識學習和知識挖掘等方面進行考查,并以基于語音互動的付費知識問答社區運營模式為例,研究了知識服務平臺的運營現狀與發展的對策;

    ? 為探索以文獻資源主導的顯性知識創新服務模式和以參與者為主導的隱性知識創新服務模式,研究國際公眾科學領域演化路徑與研究熱點,從項目視角、理論方法視角以及參與者視角等研究樂基于群體參與及協作的公眾科學研究模式的興起與發展狀態,以及對策建議等。

    1.5子課題五:面向知識創新服務的數據科學應用研究:實現與驗證

    該子課題是以知識創新研究為實證場景,構建面向知識創新服務應用模式與實現系統,通過利用數據科學的理論與方法,以達到支撐使多源異構數據得以處理、提取、匯聚、關聯、分析、融合,并實現從數據到知識的轉化直至最終創造出新知識的研究宗旨。

    ① 2017年6月至2017年12月,按照計劃開展的工作如下:

    ? 數字圖書館、全文數據庫網站和學術搜索引擎三種類型的在線知識服務平臺為例,描繪平臺運行的信息流,進而系統分析大數據知識服務的組織架構、組織網絡、規章制度、組織信息管理等。

    ② 2018年1月至2018年12月,按照計劃開展的工作如下:

    ? 面向學科領域的研究前沿探索應用實證,以人工智能為例,開展了研究前沿探索的實證。進而,分析大數據時代知識創新服務平臺和系統所需的各種情報技術和工具,知識服務的全過程進行平臺原型的功能設計等。

    2調查研究及學術交流情況(調研數據整理運用、文獻資料收集整理、學術會議、學術交流、國際合作等)

    2.1調研數據整理運用

    ? 在Web of Science數據庫核心合集中下載有關“人工智能”數據72萬多條,并用于學科領域前沿的研究中;下載Public Library of Science (PLOS)中的7756論文并用于引文內容抽取與分析中;下載Scopus和Altmetric.com數據集中共45萬多條科學推文及其元數并用于知識挖掘與發現的研究中;下載 Altmetric.com公司中從2013年1月到2016年6月收集的所有政策文件數據共90036條,并用于知識挖掘與發現的研究中;在CNKI數據庫和SIPO數據庫中下載有關“石墨烯”領域的2000條文獻數據和4000條專利數據 并用于知識庫的構建研究及分析中;下載美團網美食頻道19個類別、5132道菜肴中的115321條評論數據并用于在線社交網站的知識抽取研究中;

    ? 選取數字圖書館、全文數據庫網站、學術搜索引擎三種類型的在線知識服務平臺和Research Gate、分答、值乎、推文等社交平臺,采集相關數據用于數據處理、數據挖掘、知識融合與發現等的數據科學理論和方法研究;

    ? 分別對中國科技信息研究所、中國船舶749所、中國兵器210所、中國同方、等知識服務機構進行實地訪問和網絡調查,向情報工作人員發放問卷,用于2017年4-7月間,與研究人員交流等,獲得了有關知識服務、知識創新等方面的第一手資料。

    2.2文獻資料收集整理

    ? 檢索了有關“知識創新”“知識服務”“數據科學”“知識融合”“知識發現”等方面的國內外研究論文,一共有1200多篇,選擇主要的文獻進行閱讀,用于主要觀點與內容的提煉、研究綜述的撰寫等。

    2.3學術會議、學術交流與國際合作

    ? 2017年2月25日召開了開題會,邀請有9位專家到會并征集咨詢建議;

    ? 組織學術研討與報告會6次,先后邀請印第安納大學丁穎教授、華北水利水電大學張琳教授、大連理工大學王賢文教授、武漢大學吳丹教授、加拿大麥吉爾大學舒非博士、北卡羅來納大學教堂山分校Javed Mostafa教授參加項目研討并做學術講座:

    (1)2017年5月16日,華北水利水電大學張琳教授學術報告:“文獻計量與科學家個人成果評價研究”(http://sem.njust.edu.cn/38/34/c6134a145460/page.htm);

    (2)2017年5月16日,大連理工大學王賢文教授學術報告:“地理位置大數據與計算社會科學研究”(http://sem.njust.edu.cn/38/34/c6134a145460/page.htm);

    (3)2017年5月17日,武漢大學吳丹教授學術報告:“基于情境與APP交互的用戶移動搜索行為研究”(http://sem.njust.edu.cn/38/75/c6134a145525/page.htm);

    (4)2017年6 月21日,美國印第安納大學教授、教育部長江學者講座教授丁穎博士學術報告:“Zero to One:Success to Innovation”(http://sem.njust.edu.cn/41/01/c6134a147713/page.htm);

    (5)2018年4月18日,加拿大麥吉爾大學舒非博士學術報告:“National and International Scientific Elites”(http://sem.njust.edu.cn/97/ab/c6134a169899/page.htm);

    (6)2018年6月20日,北卡羅來納大學教堂山分校Javed Mostafa教授學術報告:“Consumer Health Information Searching: TowardAutomated, Trustworthy, and Secure Personalization” (http://sem.njust.edu.cn/af/4a/c6134a175946/page.htm)。

    ? 2018年7月6日至8日,舉辦“第十四屆海峽兩岸圖書資訊學學術研討會”,本屆會議主題為:“數據科學驅動的圖書資訊學變革與轉型”,到會的海峽兩岸40余所高校與科研院所的160余名知名專家、學者和學生,

    (http://sem.njust.edu.cn/b1/d7/c6134a176599/page.htm)。

    ? 組織小型學術研討會12次,除了課題組成員外,還邀請了校外內專業技術領域人員到會參與課題研討。

    ? 2017年8月29日,北京國際會議中心2C,參加納米研究前沿分析報告發布會。

    ? 2017年11月15-17日,貴陽大數據中心參觀與交流。

    3成果宣傳推介情況(成果發布會、《工作簡報》報送情況、國家社科基金專刊投稿及采用情況等)

    ? 中國社會科學網報道:數據科學理論與方法體系亟待完善(2017年03月06日)(http://www.cssn.cn/gd/gd_rwhd/xslt/201703/t20170306_3441434.shtml)

    ? 首席專家被邀請會議主題報告與學術講座:

    (1)王曰芬.2016年12月7日,中國“互聯網公益”研究報告發布會,分論壇:互聯網公益數據監護主持,并做報告:互聯網公益數據監護

    (https://charity.nju.edu.cn/9d/18/c835a171288/page6.htm)

    (2)王曰芬.2017年2月24日,上海社會科學院學術演講“數據科學支撐的知識服務創新對策思考”( http://www2.sass.org.cn/detailAction.do?method=ShowNewsContent)

    (3)王曰芬.2017年4月20-22日,高校新型智庫建設與協同創新發展論壇,河南財經政法大學,鄭州市東方維景國際酒店,CNKI主辦,主題報告:面向智庫的情報搜集與分析(http://edu.people.com.cn/n1/2017/0421/c1053-29228184.html)

    (4)王曰芬.2017年6月8-9日,首屆數據分析與知識發現學術研討會,北京世紀金源香山商旅酒店,主題報告:信息哲學視域下數據驅動的科學知識發現方法論思考(大學圖書館學報,2017(5):126-127)

    (5)王曰芬.2017年7月21-23日,第七屆全國博士生論壇,北京科學院大學雁棲湖,大會報告:數據科學支撐的知識服務創新對策思考(http://ndsis.las.ac.cn/dct/page/65583)

    (6)王曰芬.2017年8月18日,第六屆中國電科戰略情報研討會,成都黃龍溪欣瑞大酒店,主題報告:大數據時代科技情報理論與方法創新及應用

    (http://www.sohu.com/a/165709252_466078)

    (7)王曰芬.2017年9月13日,江蘇大學圖書館學術講座:數據科學支撐的知識服務創新對策思考(http://www.ujs.edu.cn/info/1065/17520.htm)

    (8)王曰芬.2018年5月7日,華南師范大學講座:大數據與數據科學及其應用

    (http://em.scnu.edu.cn/a/20180507/6288.html)

    (9)Wang Yuefen .Evolution study of individual author and component network in the life cycle stage based on scientific collaboration network data,The Annual Conference on Data, Information, and Society ,Nanjing, China, July 3–6, 2018.( http://www.dis2018.net/Program.html)

    4研究中存在的主要問題、改進措施,研究心得、意見建議

    4.1研究中存在的主要問題與改進措施

    ? 在研究中面臨的主要問題:一是,難以收集到可以有效借鑒的國外研究資料;二是,從各種數據資源(數據庫)中下載的數據處理上存在有效算法支撐不足,而導致效率低下、處理時間長;三是,在國際交流的范圍與深度上還不夠;四是,在傳播學術研究成果過程中向期刊投稿,大部分國內期刊需要收取版面發稿補貼費用,而導致有些論文不能及時發表。

    ? 改進的措施:一是,擴大文獻檢索與實際調研的范圍,擬將從2018年9月開始加大對外交流的力度;二是,加大實證研究的范圍,并爭取與專業化學會取得聯系,將研究成果通過專業學會的傳播與發布;三是,與計算機等專業人員合作,爭取在數據處理算法與應用上有一定的突破;四是,爭取多向國家社科基金委資助的期刊投稿。

    4.2研究心得與意見建議

    ? 研究心得:本項目是一個以圖書館、情報與文獻學為主的多學科交叉融合的前沿性綜合研究,既要系統地探索數據科學的理論與方法,又要與面向知識創新服務的實踐應用緊密結合,研究的難度較大、涉及的面較廣。為了使研究具有理論的深度、方法的效度與應用的代表性,一方面需要廣泛地收集國內外相關的研究成果,閱讀、匯總與摘錄,并進行定量與定性結合的綜述,另一方面需要對國內外相關的服務平臺與系統進行調查研究、專家訪談,同時從多源異構的數據源中下載大批量的數據,以實踐與驗證數據采集、處理、挖掘與知識融合、知識發現等方法和流程。因此,本課題后續研究中,要加大人力投入、總結提煉與實踐嘗試,同時,注重各個課題之間內容研究的銜接。

    ? 意見建議:由于從2016年開始的經費預算中在研究成果出版費上有限制,導致階段性的研究論文發表受到影響,為了更及時地傳播研究成果,特別是前沿性研究傳播的新穎性,建議在出版費(國內期刊論文版面費)的限制上能夠有所區別。

    5其他需要說明的問題

    ? 本課題的項目號是16ZDA224,課題在研究中,由于沒有注重項目號正確的寫法,導致在論文發表時出現了三種不同的寫法,分別是:16ZDA224、16ZAD224、16DZA224,后面兩種寫法出現了錯誤。在中文期刊發表時,由于能夠出現項目的名稱,所以目前的狀態是項目名稱是正確的,而有些論文項目編號中的字母出現上述錯誤。如今發現了這種錯誤,并通知給各個子課題負責人,相信后期將不會有類似錯誤發生。

    ? 在已經發表的17篇期刊論文中,為了得到其他基金在出版費方面的支持,有7篇論文標有兩個或者以上的項目號。待出版8篇論文中,有4篇標有兩個或者以上的項目號。后續的研究中,將盡可能使發表的論文在基金署名上專屬一個基金,并加強研究成果的及時發表傳播。

    ? 為了鼓勵研究生積極申報與參加江蘇省研究生科研創新計劃項目,相關部門提出由導師主持項目給予資助并經過審核立項的倡議,所以,課題研究過程中,為了使研究生尤其是博士研究生在投入研究時又能獲得省研究生科研創新計劃項目立項,將用于資助學生參與會議和助研費等的課題經費同時算作是對創新計劃項目的支持,因此論文發表時也要對立項的研究生創新計劃項目加以標注,出現論文發表時沒有單標一個項目。盡管如此,卻體現出國家社科基金所做的貢獻。

    二、研究成果情況

    1代表性成果簡介

    1.1基本內容與主要觀點

    ? 關于知識創新面臨的大數據挑戰

    從科學研究角度看,知識創新指通過科學研究獲得新的基礎科學和技術科學知識的過程,知識創新不僅是技術創新的基礎,是新技術、新發明的源泉,還是促進科技進步和經濟增長的革命性力量。伴隨我國創新發展驅動戰略和科技創新的需求,知識創新的目標與要求必須朝著國家戰略倡導的“在新思想、新發現、新知識、新原理、新方法上積極進取,強化源頭儲備”上發展。

    作為大數據的重要組成部分,科學大數據正在使科學世界發生變化,驅動科學研究進入數據密集型科學發現范式這一全新階段。科學大數據是科學發現與知識創新的新引擎,將改變人類生活及其對世界的深層理解。在大數據背景下,及時更新、開放的海量數據為知識創新提供豐富的知識原料,大數據技術與工具極大提高知識共享和轉化的效率,但大量多源、異構、碎片化、良莠不齊的數據源和知識源也給知識創新帶來挑戰。因此,大數據使研究人員對知識的獲取和使用從過去的“一種混沌”(知識供給匱乏同時有效知識不足)走向“另一種混沌”(數據來源多樣、信息供給過載但有效知識不足),人們迫切希望從大數據中獲取系統化的知識支撐。

    ? 關于大數據對學科知識創新模式的重構

    大數據重構了傳統科學研究中“數據—信息—知識—智慧”的價值鏈,體現在4個方面:①由于數據來源的廣泛性,知識不再以孤立的種群存在于某一種生態位(如某一種形態、某一個領域、某一種平臺、某一種存量與其他知識或者環境的簡單關系)上,而愈來愈呈現出復雜種群系統特征,噪音和不確定性并未因為知識的多位性而弱化,反而愈益強化;②由于數據變化的瞬態性,運行于這種復雜種群基礎上的知識自生、交互與反饋、共生與競爭、演化與再生等機制已經發生質的改變,知識“涌現”現象日益突出;③由于數據載體的多樣性,知識生產者、提供者、使用者與知識之間的“主體-客體”界限已經模糊,學科知識創新研究的正式知識交流模式與非正式知識交流模式亦已交融整合,數據的無處不在使知識的不同依存載體、傳播媒介及價值鏈節點與能量要素也形成了一種數據“泛在協同”關系,與此同時,這種泛在協同關系本身又為學科創新服務提供了一種全新的可轉化為知識的數據來源;④由于數據的多維關聯性,在數據與知識的交互和演化過程中,知識的“因果”已不再重要,取而代之的是基于數據關聯支撐的知識間的泛在“關聯”,這即可為學科創新研究生命周期各階段的全景知識提供了源泉,以激活學科創新工作者的隱形知識,其亦是學科創新研究中的“偶遇”“意外”或者“異想”知識的源泉,為學科創新工作靈感提供動力。因此,大數據使學科創新活動處于“數據密集型科學發現”的第四范式,此研究范式產生的多源、廣泛、瞬態、多維關聯的大數據,一方面為學科創新研究帶來越來越難以處理的數據困擾和知識渴求,另一方面為學科知識創新生命周期各階段全景知識提供源泉,也為研究中的等創新工作靈感或隱性知識提供激活的更多可能。

    ? 關于大數據驅動下知識創新服務及其新需求

    主要體現在以下4個方面:①從知識主體上,大數據對知識創新主體提出新要求,知識主體需要基于數據和數據技術來決策,從數據中挖掘出知識的價值、發現新的知識,借助社會媒體激發靈感或基于數字化平臺進行廣泛交流與合作;②從知識資源上,知識的獲取不再局限于已經公開的文獻資源或組織內部及其所在的社會網絡,科研過程中的數據集、互聯網資源與社交媒體的交互數據都是組織知識創新的重要源頭;③從方法與途徑上,隨著數據存儲、數據挖掘、機器學習、人工智能的發展,為知識的交流、共享、吸收與利用提供便利。同時,各種媒體、專門機構及其提供的服務可以使知識創新的主體突破地域的限制,促使知識創新社會化生態的形成。技術與方法成為知識創新主體的功能外延,媒體與專門機構成為支撐知識創新的重要途徑,知識創新主體對于方法與途徑的依賴越來越強;④從實現的支撐上,創新的源泉來自數據、信息與知識的轉化。知識經濟的核心是通過知識與服務實現創新,進而優化科學研究、商業經濟、企業管理、國家政策和制度設計,知識服務是支撐知識創新的重要途徑。在大數據和關聯數據環境下,圖書情報、數據科學、計算機科學、科學學等進一步匯聚,所形成的新的知識發現、趨勢鑒別、情報研究和決策分析方法、工具和服務,正成為知識服務滿足知識創新需求的應用支撐能力。服務機構將以最大程度地激勵和支持用戶進行創新作為知識服務的重要使命,借助于大數據思維與技術支撐知識創新變革,并提供有價值的知識或提供使數據/信息/知識/智慧得以高效轉化的途徑。

    ? 關于數據科學的理論與方法

    數據科學這一術語早在二十世紀六十年代就已出現,并常被用來指代數據的表示、收集、儲存、整合、分析和理解的科學原理。自二十世紀八十年代以來,以大量數據支持決策的趨勢逐漸成為主流,在二十世紀九十年代初,隨著關系型數據庫技術的成熟以及數據業務的流程更加自動化,數據科學領域誕生并迅速發展起來。數據科學的內涵與特征主要體現在:

    其一,以知識發現為主要研究目的。數據科學隨著大數據的興起,也被賦予了更加豐富的內涵,亦在研究中被更廣泛的應用。大量的研究人員從數據科學的具體實施過程和目的入手對其進行了闡釋,在將知識發現與提取作為數據科學的主要目的這一點上已基本形成了共識。

    其二,多學科與復合領域特性。數據科學的多學科與復合領域特性在其興起伊始就被廣大數據科學研究人員所廣泛提及,數據科學的基礎學科知識組成應該來源于計算機科學,數學與統計學和應用領域學科。

    ? 關于數據科學的主要應用領域

    其一,支持預測與決策。對未來的預測是基于統計學原理,從數據分析技術產生的開始就建立的一個主要實踐方向。實現預測一直以來也是數據科學的一個重要應用,也是進行后續決策優化的一個重要步驟。這一應用的體現主要在經濟管理領域,但是隨著數據科學的發展,應用涉及領域的范圍也越來越廣泛。主要包括:一是實現更精確的預測。

    其二,服務于創新型學科知識研究與發現。由于目前對數據科學的應用多是在大數據背景下實現的,新型的數據集往往可以對已有的方法、流程進行優化,也可使決策更加智能。所以數據科學在研究優化方法、決策等方面的應用也越來越流行。數據科學的這一應用主要是面向本身就會產生復合大數據時代特征的新型數據集的學科,這些對象的特性決定了其與數據科學的相生相依的關系。這一應用的主要體現在生物科學、醫學、環境科學等領域。

    1.2學術價值與社會影響

    ? 研究產生的主要觀點的學術價值

    ? 推動數據科學理論與方法體系的建設和迭代創新

    數據科學是在多科學交叉基礎上產生的新興研究領域,一方面需要研究數據本身具有或者呈現出的各種類型、特點、存在方式及其變化形式和規律,另一方面要為社會科學與自然科學提供新的研究方法。因此,基于現有的基礎理論與方法,結合應用的需求,形成一套從數據獲取、處理到分析的數據科學理論與方法體系和針對應用的關鍵技術方法,使數據/信息/知識得以轉化成解決實踐問題的基本依據,是建立和發展適應大數據時代特征的各學科領域數據科學所必要的。同時,針對理論與方法的具體內容和應用問題,進一步探索與大數據思維和技術結合的基礎理論與共性方法的科學性,將有力推動數據科學理論與方法體系的迭代創新發展。

    ? 優化大數據和數據科學新發展機遇背景下的圖書情報學科研究體系

    在圖書情報領域,一方面,在技術與經濟發展的驅動下,實踐環節中產生了許許多多亟待解決的重大問題,其中,如何使數據、信息更有效的集成,并轉化為知識進而轉變形成支撐決策的智慧,關系到圖書情報領域學科體系創新的趨向與能否贏取核心競爭優勢的途徑;另一方面,已有的知識服務、知識創新、知識發現等理論與方法在其它學科滲透沖擊下迫切需要變革創新或者不斷完善以形成有實際效用的體系框架。大數據的發展與知識創新服務的迫切需求,為圖書情報領域的學科發展提供了一個切合時代趨勢的機遇。本課題從理論方法構建、關鍵技術方法研究與應用驗證多個方面切入,并基于多元化的理論與多學科支撐,形成面向知識創新服務需求的數據科學的系列化研究成果,這將為圖書情報領域優化學科體系提供重要的研究基礎與保障。同時,針對學科知識創新的重構和提供知識創新服務,以數據科學作為圖書情報學科體系研究的重要支撐,將突破現有學科發展局限、深化研究主題、開拓新的研究空間、提升研究水平,促使圖書情報領域的學科體系建設在未來發展中抓住核心競爭力的優勢契機。

    ? 研究產生的社會影響

    課題在研究過程中,被國內多個學術會議和研究機構邀請進行學術交流,所撰寫的論文被國內外核心期刊與頂級會議錄用,產生了較大社會影響。

    ? 課題研究觀點被社會的評價

    上海社會科學院信息研究所的評價: “2017年2月24日上午,國家社科重大項目首席專家、南京理工大學經濟管理學院信息管理系王曰芬教授到信息所作學術演講。報告會上,王曰芬教授以“數據科學支撐的知識服務創新對策思考”,從國家大數據戰略和國家科技創新規劃切手,介紹了所承擔的國家重大項目的申請背景與項目內涵旨意,深入分析了國內外知識服務、數據科學的起始與發展,結合中國當代的發展環境,提出了基于數據科學的創新對策的新理念、新戰略和新實踐,為我們提供了以數據為基礎的知識服務如何發展并達到新經濟與新技術所需的服務業態的全新思考。王曰芬教授在演講中所提出的數據的收集、分析與建模并為學科創新工作靈感提供動力;數據科學可提供管理的優化研究精度的提高;在以往知識服務產品的基礎上注重工具的使用;如何在雙輪互動中進行研究熱點挖掘、主題演化、趨勢預測,如何將大數據分析與學科領域生命周期結合起來,并進行深度聚合與挖掘,用以發現各學科領域中的作者關鍵詞關系圖……,以上這些論述與分析,對信息所正在從事的一帶一路研究、科技創新研究、互聯網研究、信息安全研究、城市信息化研究、人才信息研究等均具有重要的啟示。(http://www2.sass.org.cn/detailAction.do?method=ShowNewsContent)”

    ? 課題研究中論文發表與引用及下載情況

    發表期刊論文17篇,其中:SCI/SSCI雙收錄期刊《Scientometrics》發表論文1篇(在Web of Science核心合集數據庫中的Usage Metrics為43次)、CSSCI收錄的一級學會期刊《中國圖書館學報》發表2篇、CSSCI收錄的一級學會期刊《情報學報》發表3篇、CSSCI收錄期刊《圖書情報工作》《圖書與情報》《情報資料工作》《數據分析與知識發現》等期刊發表9篇、CSSCI擴展版收錄期刊《數字圖書館論壇》發表3篇;發表本學科頂級會議(ISSI2017、ASIST2017)論文長文3篇、短文4篇,其中被EI收錄6篇;發表的中文16篇學術期刊論文在CNKI數據庫中,截止到2018年7月22日共被下載4056次、被引用19次。

    2階段性成果清單

    2.1 學術論文發表

    ? 發表的學術期刊論文共17篇(其中:SCI/SSCI雙收錄期刊論文1篇,國內一級學會期刊論文5篇)和發表的本學科頂級學術會議論文7篇(其中:被EI收錄6篇),具體信息見附件EXCEL。

    2.2錄用待發表論文與交付待出版專著

    ? 被錄用待發表的學術期刊論文(共8篇)

    (1) Lei Li, Daqing He, Chengzhi Zhang*, Li Geng, Ke Zhang. Characterizing Peer-Judged Answer Quality on Academic Q&A Sites: A Cross-Disciplinary Case Study on ResearchGate[J].Aslib Journal of Information Management.(in press)(SCI/SSCI雙收錄期刊)

    (2) Qing qing Zhou*, Chengzhi Zhang*. Detecting Users’ Dietary Preferences and Their Evolutions via Chinese Social Media[J].Journal of Database Management. (in press) (SCI收錄期刊)

    (3) Shutian Ma*, Yingyi Zhang, Chengzhi Zhang*. Using Multiple Web Resources and Inference Rules to Classify Chinese Word Semantic Relation[J].Information Discovery and Delivery.(in press). (ESI收錄期刊)

    (4) Chao Min,Ying Ding, Jiang Li,Yi Bu,Lei Pei,Jianjun Sun*.Innovation or Imitation: The Diffusion of Citations[J].Journal of the association for information science and technology, 2018(in press). (SCI收錄期刊)

    (5) 余厚強,曹嘉君,王曰芬.情報學視角下的國際人工智能研究前沿分析[J].情報雜志(錄用)(CSSCI收錄期刊)

    (6) 王曰芬*,鄒本濤,宋小康.大數據驅動下情報研究知識庫及其體系架構設計[J].情報理論與實踐(錄用)(CSSCI收錄期刊)

    (7) 宋小康,何勁,王曰芬*.大數據驅動下情報研究知識庫構建的關鍵技術及實現[J].情報理論與實踐(錄用)(CSSCI收錄期刊)

    (8) 曹嘉君,王曰芬*,宋小康.大數據驅動下情報研究知識庫的應用:以石墨烯領域為例[J].情報理論與實踐(錄用)(CSSCI收錄期刊)

    ? 待出版的專著:王曰芬等.數據驅動的知識服務體系與方法[M].科學出版社

    2.3發表其他研究成果

    (1) 在2017年計算語言學領域的自動摘要國際測評比賽論文

    Shutian Ma, Jin Xu, Jie Wang and Chengzhi Zhang*. NJUST @ CLSciSumm-17. In: Proceedings of the 2nd Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL 2017), Aug, 2017, Tokyo, Japan. (CL-SciSumm 2017測評比賽冠軍)

    (2) 專家寄語:王曰芬.創新驅動發展需要基于大數據的知識服務[J]數字圖書館論壇,2018(3):1

    (注:*表明的是課題的主要研究者)

    三、下一步研究計劃

    總體上,進一步按照研究計劃,以理論與方法研究為重點、以應用研究為落腳點,強化學術交流、成果發布、國際合作。在2018年9月召開一次中期研討會,在2019年上半年將理論與方法研究成果與實踐工作部門對接,以爭取一定范圍的應用,2019年底完成課題的總報告。具體地,每個子課題的工作方案如下:

    ? 子課題一:面向知識創新服務的數據科學理論研究:目的與體系

    2018年9月至2019年6月

    通過專家咨詢和集體攻關途徑,攻克與面向知識創新服務的數據科學理論與方法體系架構有關的難點問題;與其他子課題合作,在后續知識抽取、知識融合和知識創新服務的實現模式和實證應用研究過程中,完善需求分析、理論與方法體系以及應用與保障體系架構設計;在此過程中,整理并發表若干篇高水平的學術論文;

    2019年7月至2019年12月

    完成子課題研究報告。

    ? 子課題二:面向知識創新服務的數據科學方法研究:信息采集與知識抽取

    2018年7月至2018年9月

    分別開展大數據驅動的多層次知識表示模式、大數據用戶知識表示方法的研究;

    2018年10月至2019年6月

    與其他子課題合作,在后續有關大數據驅動的知識融合的實現模式和實證應用研究過程中,完善知識抽取模式、方法與技術實現方案;在此過程中,整理并發表若干篇高水平的學術論文;

    2019年7月至2019年12月

    完成子課題研究報告。

    ? 子課題三:面向知識創新服務的數據科學方法研究:知識融合與知識發現

    2018年7月至2018年8月

    分別開展知識融合與知識發現結果的展示、知識融合與知識發現結果的驗證研究;

    2018年9月至2019年6月

    與其他子課題合作,在后續有關知識創新服務應用和實證研究過程中,完善知識融合和知識發現的模式、方法與技術實現方案;在此過程中,整理并發表若干篇高水平的學術論文;

    2019年7月至2019年12月

    完成子課題研究報告。

    ? 子課題四:面向知識創新服務的數據科學應用研究:知識創新服務機制

    2018年7月至2019年3月

    基于知識管理的認知模型和社會模型,探索知識創新服務的孵化機制;基于組織科學的創新擴散理論,探索知識創新服務的擴散機制;基于野中郁次郎的知識管理模型,探索知識創新服務的轉化機制;基于認知科學的認知吸收理論和組織行為學的吸收能力理論,探索知識創新服務的吸收機制;

    2019年4月至2019年12月

    對數據科學支撐的知識創新服務保障進行系統研究,分別就組織管理、技術保障、產學研合作以及人才培養進行充分調研和探索;發表若干篇高水平的學術論文,并最終形成論文集和結項驗收報告作為子課題成果,完成子課題結項。

    ? 子課題五:面向知識創新服務的數據科學應用研究:實現與驗證

    2018年7月至2018年12月

    理清大數據時代知識創新服務平臺和系統的創新型知識服務模式,分析服務平臺和系統中各要素,建立要素之間的關系;建立完整的大數據時代知識創新服務機制和模式的理論框架;進行大數據知識創新服務平臺和系統的詳細設計,進行知識庫的構建,完成知識服務平臺的建設;

    2019年1月至2019年8月

    以某技術領域為例,開展面向學科領域的研究前沿探索應用實證、面向科研資源共享與用戶項目眾包的科研眾包應用實證;構建知識創新服務的應用反饋機制,建立應用效果的評估體系,實現服務的應用反饋和效果評估;

    2019年9月至2019年12月

    對課題研制過程中形成的技術文檔進行整理,并對整體的應對體系進行整合;發表若干篇高水平的學術論文,并最終形成論文集和結項驗收報告作為子課題成果,完成子課題結項。

    (課題組供稿)

    (責編:孫爽、閆妍)
    国产成人综合久久精品尤物| 中文国产成人精品久久不卡| 国产精品视频2020| 69精品免费视频| 日韩精品在线观看| 精品一区二区三区视频在线观看| 精品亚洲AV无码一区二区三区| 精品日产一区二区三区手机| 亚洲国产婷婷综合在线精品| 国产乱码精品一区二区三区麻豆| 久久久精品国产sm调教网站| 国内精品久久久久影院一蜜桃| 午夜精品久久影院蜜桃| 精品人妻少妇一区二区三区不卡 | 亚洲精品少妇30p| 免费精品久久久久久中文字幕| 精品无码综合一区二区三区| 精品久久亚洲中文无码| 99精品国产在热久久婷婷| 国产女主播精品大秀系列| 久久996热精品xxxx| 亚洲精品国产精品乱码不卞| 国产精品国产国产aⅴ| 国产精品久久久久久久小说| 精品久久久久成人码免费动漫| 久久精品国产亚洲AV高清热| 久久国产精品老人性| 国产精品揄拍100视频| 三级精品视频在线播放| 亚洲成人国产精品| 成人国产精品一区二区网站| 国产精品亚洲一区二区三区在线观看| 香蕉久久丫精品忘忧草产品| 亚洲精品白浆高清久久久久久| 国产精品亚洲美女久久久| 国产精品熟女福利久久AV | 国产在线观看高清精品| 久久99精品久久久久久噜噜| 精品国产免费人成网站| 国产精品国产高清国产专区| 亚洲精品久久久www|