一、研究進展情況
(1) 項目總體執行情況執行良好,子課題之一:計算社會科學的歷史演進及其發展規律課題已經基本完成;子課題之二:世界范圍內計算社會科學的發展趨勢和前沿動態完成一大半;子課題之三:社會科學的學科結構和基本范式完成一半以上;子課題之四:計算社會科學的學科方法及其方法體系完成一半以上;子課題之五:中國計算科學的愿景目標及其發展路徑,完成三分之一。
(2) 調查統計了中國社會學科期刊上利用大數據發表的計算社會科學類的文章數量,使用方法,研究范式等,梳理清楚了中國計算社會科學的產生、現狀和發展的文獻資料,將于2017年8月召開計算社會科學的高峰論壇,邀請了5次計算社會科學的講座,組織10次小型專家研討會。
(3) 已經出版專著一本,第二本專著正在撰寫,發表國內外期刊論文6篇,其中,英文SCI論文2篇,完成兩篇工作簡報,準備遞交;正在撰寫論文5篇。
(4) 主要存在問題:中國計算社會科學整個發展的現狀沒有像項目開始前想象那么快,學術界對計算社會科學的認識和發展前景有不同意見,對于大數據推動計算社會科學的影響有待研究觀察。
二、研究成果情況
專著一:社會影響評價:理論、方法與實證,社會科學文獻出版社2017年12月出版
內容簡介:在經濟和社會快速發展的時期 許多政策和項目在實施過程中會遇到社會問題。如何對政策或項目的社會影響進行分析和評價 已經成為當前亟待解決的發展性問題。作者認為 靠前上社會影響評價的許多研究成果可以借鑒 但很為關鍵的是 應當探索進行適合中國國情的社會影響評價研究 并建立分析框架和指標體系。史玲玲著的'社會影響評價--理論方法與實證'概述了社會影響評價的基本內容、過程和方法 總結了靠前外社會影響評價的一些經驗 并結合中國當前的發展現狀探討了社會影響評價在中國應用的分析框架 即項目嵌入與大眾反應。社會影響評價的核心內容就是分析項目嵌入的形式和強度與大眾反應的組織化程度之間如何互動 很終實現怎樣的社會效果 以及能否為地方帶來發展的機會。
論文一:大數據為社會網絡分析帶來‘黃金時代’.2018《實證社會科學》4:72-80.
論文摘要:
社會網絡分析因為其獨特的理論視角和分析方法,在社會學、經濟學、政治學、傳播學、計算科學、公共健康等領域得到廣泛關注和運用。網絡社交平臺的興起和隨之產生的海量關系數據的出現,為社會網絡分析帶來了空前的機遇。其一、海量社交數據為解答網絡分析中的經典問題提供了更高精度、更完備的數據來源;其二、網絡平臺使大規模的隨機控制實驗成為可能,有利于做出更有說服力的因果推斷;其三、推動學術界對互聯網的社會后果等諸多新的問題的提出和研究。本文通過大量實例就這三個觀點展開論述,彰顯大數據將社會網絡分析帶入了“黃金時代”。
論文二:社會關注度的新聞大數據分析-—社會、時間與空間的維度,2018.《浙江學刊》:
論文摘要:
隨著手機移動新聞客戶端的爆發式增長和個體用戶大量數據的產生,利用大數據挖掘和分析方法對網絡移動新媒體進行受眾分析尤其是社會屬性分析成為可能,這將在很大程度上推動移動傳播媒介時代的受眾分析研究。本文基于搜狐新聞客戶端2014年5月至10月的用戶行為抽樣數據,探索性地從社會、時間和空間等三個維度對移動新聞客戶端用戶的閱讀行為及其社會關注特征和影響因素進行了分析。研究發現:性別、階層群體、社會地理空間等因素在新聞關注主題的影響方面存在顯著差異;移動新聞客戶端用戶在不同時間節點所關注的新聞類別也具有明顯的差異化特征;“北上廣深”等超大城市的用戶群體在特定新聞話題上的關注度體現了鮮明了社會性特征。
論文三:中國實證社會科學的演進及使用大數據研究之現狀與挑戰,2018,《學術界》。 5:18-26
論文摘要:
我國的實證社會科學是改革開放以來在開展全國性社會調查和學習借鑒國外實證社會科學研究方法及技術的基礎上發展起來的。這些實證社會科學的數據來源包括:研究者自己組織實施的社會調查,中央和地方黨政機關公布的統計數據,以及國內外科研機構公開的數據庫,還有最近越來越受到關注的大數據。通過對中美兩國三大社會科學代表期刊使用傳統數據和大數據的實證研究論文的分析,發現中國社會科學采取實證方法研究的程度與美國相比還有一定差距,但是在使用大數據的實證社會科學研究方面,中美兩國沒有顯著的差別。使用大數據的中國實證研究論文也大多結合了傳統數據來源,采用了傳統計量模型來研究和探討因果機制。因此,使用大數據的實證社會科學的研究目前還只是傳統數據的一個有益補充,還沒有產生完全突破傳統實證研究方法的顛覆性研究方法和范式。導致這個結果的障礙主要在于大數據的不夠開放,簡易經濟的大數據獲取和分析工具的缺乏,以及大數據本身的代表性缺陷。因此,要推動大數據實證社會科學的發展,需要加強政府和大型高科技公司跟高校和科研機構的合作,積極開發大數據應用的合適工具,建立大數據實證社會科學的媒介和平臺,不斷改進使用大數據的實證研究的方法。
論文四:改革開放40年與中國社會學的本土化、發展及創新,2018,《社會科學戰線》,6:1-9。
論文摘要:
文章對改革開放40年來中國社會學的恢復、重建、發展與創新做了全面分析。提出了中國社會學恢復重建初期的四個基本特征,即具有突出的學習和開放特征,完成了中國社會學基礎建設,創建了比較完整的中國特色社會學學科體系,探討解決改革開放面對的諸多社會問題。指出中國社會學本土化發展有其學科內在的原因,同時也與改革開放事業、與注重實地社會調查的風格、與對中國現代化的探索均密不可分。深入分析了中國社會學考察社會的三大理論視角,即社會公平正義視角、社會活力視角與社會秩序視角。梳理總結了中國社會學在社會建設、民生、和諧社會、社會治理研究方面的理論創新。
論文五: Big data prediction of durations for online collective actions based on peak's timing. Physica A Statistical Mechanics & Its Applications, 2018:492.
論文摘要:
Peak Model states that each collective action has a life circle, which contains four periods of “prepare”, “outbreak”, “peak”, and “vanish”; and the peak determines the max energy and the whole process. The peak model’s re-simulation indicates that there seems to be a stable ratio between the peak’s timing (TP) and the total span (T) or duration of collective actions, which needs further validations through empirical data of collective actions. Therefore, the daily big data of online collective actions is applied to validate the model; and the key is to check the ratio between peak’s timing and the total span. The big data is obtained from online data recording & mining of websites. It is verified by the empirical big data that there is a stable ratio between TP and T; furthermore, it seems to be normally distributed. This rule holds for both the general cases and the sub-types of collective actions. Given the distribution of the ratio, estimated probability density function can be obtained, and therefore the span can be predicted via the peak’s timing. Under the scenario of big data, the instant span (how long the collective action lasts or when it ends) will be monitored and predicted in real-time. With denser data (Big Data), the estimation of the ratio’s distribution gets more robust, and the prediction of collective actions’ spans or durations will be more accurate.
論文六:Predicting durations of online collective actions based on peaks’ heights.Communications in Nonlinear Science & Numerical Simulation, 2017:55.
論文摘要:
Capturing the whole process of collective actions, the peak model contains four stages, including Prepare, Outbreak, Peak, and Vanish. Based on the peak model, one of the key variables, factors and parameters are further investigated in this paper, which is the rate between peaks and spans. Although the durations or spans and peaks鈥 heights are highly diversified, it seems that the ratio between them is quite stable. If the rate's regularity is discovered, we can predict how long the collective action lasts and when it ends based on the peak's height. In this work, we combined mathematical simulations and empirical big data of 148 cases to explore the regularity of ratio's distribution. It is indicated by results of simulations that the rate has some regularities of distribution, which is not normal distribution. The big data has been collected from the 148 online collective actions and the whole processes of participation are recorded. The outcomes of empirical big data indicate that the rate seems to be closer to being log-normally distributed. This rule holds true for both the total cases and subgroups of 148 online collective actions. The Q-Q plot is applied to check the normal distribution of the rate's logarithm, and the rate's logarithm does follow the normal distribution.
三、下一步研究計劃
1. 撰寫綜合性結題報告和專著
題目:大數據時代計算社會科學的產生、現狀與發展前景研究
第一章 中國計算社會科學的歷史
第一節 傳統計算社會科學的發展
一 什么是計算社會科學?
二 我國傳統計算社會科學的興起
三 我國傳統計算社會科學的壯大
第二節 大數據的興起
一 傳統數據的制約
二 大數據興起的背景與條件
三 大數據的獨特優勢
第三節 未來計算社會科學的發展
一 傳統數據與大數據的結合
二 大數據的應用前景
第二章 大數據的產生和發展
第一節 大數據的產生背景
一 什么是大數據
二 大數據產生的時代背景
第二節 大數據的誕生與應用
一 大數據的誕生
二 大數據的應用
第三節 大數據的未來發展趨勢
一 大數據在社會科學中的發展前景
二 大數據的風險
第三章 計算社會科學利用大數據的現狀
第一節 計算社會科學大數據的獲得
一 數據來源
二 數據可得性
第二節 中國計算社會科學期刊基于大數據的論文分析
一 社會學期刊基于大數據的論文分析
二 經濟學期刊基于大數據的論文分析
三 政治學期刊基于大數據的論文分析
第三節 美國計算社會科學期刊利用大數據的論文分析
一 美國社會學期刊基于大數據的論文分析
二 美國經濟學期刊基于大數據的論文分析
三 美國政治學期刊基于大數據的論文分析
第四章 使用大數據的計算社會科學的方法論
第一節 社會科學研究中的范式轉換與方法論變革
一 社會科學研究中的“范式”
二 新一輪的范式轉變、方法論變革與“科學革命”
第二節 尋求因果——社會科學研究中的方法論核心
一 因果推斷中的基本概念與分析標準
二 經典定量社會學研究中的因果推斷方法與現存問題
第三節 使用大數據的社會科學研究方法簡介——以量化社會學為例
一 重返“描述”與“相關分析”的潮流
二 大規模隨機控制實驗
三 數據挖掘提供參數估計,進行計算仿真模擬
第五章 大數據和計算社會科學的計算和分析工具
第一節 大數據的分析平臺和軟件介紹
一 MATLAB
二 SAS
三 SPSS
四WEKA
五 R
六 五種分析軟件的比較
第二節 大數據的分析工具和常用模型
一 大數據的分析工具
二 大數據的常用模型
第三節 大數據計算社會科學應用中的算法
一 集成算法
二 關聯規則算法
三 分類算法
四 聚類算法
五 離群點挖掘算法
六 智能優化算法
第六章 大數據與社會治理
第一節 傳統計算科學與社會治理
一 研究對象具有局部性
二 社會治理的單向性
第二節 大數據與社會治理創新
一 大數據時代社會治理的現狀
二 大數據與社會治理手段創新
三 大數據與社會治理創新案例研究
第三節 未來社會治理的新格局
一 政府職能轉變
二 信息化建設與安全
三 社會治理更加個性化
第七章 大數據與扶貧
第一節 大數據助力扶貧開發實現高精準、高效率、可持續
一 大數據思維與技術應用推動了扶貧開發的精準運行
二 大數據為實現貧困問題的科學分析提供了數據支撐
三 大數據促進了政府貧困治理手段現代化和效率提升
四 扶貧“大數據”的長期積累有助于精準扶貧的持續開展
第二節 應用大數據助力脫貧攻堅的頂層設計與實踐探索(國家政策與地方實踐)
一 大數據與國家精準扶貧戰略相結合的頂層設計與舉措
二 精準扶貧開發實踐中對大數據應用模式的實踐探索
第三節 大數據應用助力扶貧開發的模式思考
一 大數據扶貧模式的內涵
二 大數據扶貧的具體模式
第四節 我國扶貧開發實踐中大數據應用的不足與建議
一 我國扶貧開發中大數據應用的不足之處
二 深化“大數據”應用助力全國打贏脫貧攻堅戰的建議
第八章 大數據視域下傳媒研究的轉向
第一節 計算傳播學的興起:社會計算科學對傳媒研究的影響
一 大數據時代下傳播學研究的新范式
二 計算傳播學的概念及應用
第二節 大數據時代新聞學的新特點和新趨勢
一 數據新聞學的興起及特征
二 中外數據新聞的實踐探析
第三節 大數據時代網絡輿情的發展、挑戰及前景
一 網絡輿情的傳播特點及規律
二 網絡輿情的應對體系及策略
第四節 大數據時代廣告學的發展與流變
一 計算廣告學:大數據時代下廣告學的新發展
二 計算廣告在互聯網市場的實踐與探索
第九章 大數據背景下中國計算社會科學的法律和倫理
第一節 大數據應用的法律和倫理問題
一 大數據侵權現象
二 大數據侵權的原因分析
第二節 大數據應用的法律建構
一 數據采集及使用的合法性
二 數據違法使用的法律責任
第十章 大數據背景下中國計算社會科學的挑戰和對策
第一節 數據開放問題
一 數據開放問題的主要表現
二 數據開放問題產生的根源
三 國內外數據開放的實踐
四 促進數據開放的建議與對策
第二節 數據代表性問題
一 計算社會科學的數據代表性問題
二 數據代表性問題產生的原因
三 解決數據代表性問題的方法與實踐
第三節 分析工具和成本問題
一 計算社會科學分析工具的發展
二 計算社會科學分析工具遇到的主要瓶頸與障礙
三 解決分析工具障礙和成本問題的國內外實踐
第十一章 總結和展望
2. 2018年8月份召開計算社會科學高峰論壇
3. 2019年8月份召開計算社會科學學術研討會
(課題組供稿)