- +1
編譯 | ARS新文:計算社會科學和社會學
原創 Lance Political理論志
計算社會科學和社會學
摘要:
社會科學與計算機科學以及工程領域的結合產生了一個新的研究領域:計算社會科學。該領域將計算方法應用于新的媒介數據源,如社交媒體、行政記錄和歷史檔案,以此發展人類行為理論。作者通過文獻計量分析和對以下子領域的深入分析來回顧該領域在社會學中的演變:1. 社會網絡分析和群體形成;2. 集體行為和政治社會學;3. 知識社會學;4. 文化社會學、社會心理學、情感研究;5. 文化生產;6. 經濟社會學和組織;7. 人口學。研究表明,社會學家不僅是解決人類行為長存問題的前沿研究中心,而且也在發展關于數字空間的新的研究路線。最后,作者呼吁學者更多地關注社會學理論,并認為計算社會科學可能進一步融入主流社會學的新領域。
作者簡介:
Achim Edelmann: University of Bern; London School of Economics and Political Science
Tom Wolff, Danielle Montagne, and Christopher A. Bail: Duke University
文獻來源:
Edelmann, Achim, Tom Wolff, Danielle Montagne, and Christopher A. Bail. 2020. "Computational Social Science and Sociology." Annual Review of Sociology 46:61-81.

導言
近年來,互聯網的興起以及行政記錄和歷史檔案的大規模數字化,釋放了前所未有的媒介數據。與社會學家收集的傳統數據庫不同,這些新的數字資源往往提供了社會關系演變的豐富細節。與此同時,各種新技術現在可以用來分析這些大型復雜的數據庫。其中包括各種形式的自動文本分析、在線實驗、大規模協作、以及許多其他受機器學習啟發的方法。隨著媒介數據的快速增長以及分析這些數據的新方法,產生了一個新的跨學科領域,稱為計算社會科學。由于其跨學科的不同起源,作者為本文提供了以下領域的定義:計算社會科學是一個跨學科的領域,通過將計算技術應用于社交媒體站點、互聯網或其他數字化檔案來進行社會科學的研究。該定義領先于社會學理論,因為作者認為社會學的未來不僅取決于新的數據來源和方法,而且取決于它產生人類行為新理論或闡述社會世界的能力。
作者的主要結論是,計算社會科學正在迅速擴展到社會學的不同的子領域。本文中的評論集中在七個領域。這些包括:1. 社會網絡和群體形成;2. 集體行為和政治社會學;3. 知識社會學;4. 文化社會學、社會心理學和情感研究;5. 文化生產;6. 經濟社會學和組織學;7. 人口學。這些領域的研究成果出現在旗艦期刊上,在大型會議上擁有眾多討論,并有助于激發社會學的公共價值。最后,作者指出未來研究的方向,希望能給更有效地將社會學理論納入計算社會科學的研究,并呼吁加強與其他社會科學領域的合作,以確保計算社會科學繼續向主流社會學發展。
數據與方法
近年來數據數字化迅速發展的眾多領域之一是學術檔案,再加上最近在自動文本分析方面的創新,啟發作者使用計算社會科學的工具來繪制這個領域本身的發展。文章中的分析綜合了來自大型文獻計量數據庫的數據、來自該領域會議的數據以及人為編碼的多個階段。圖一呈現了2003-2016年計算社會科學在各個領域的發展。

研究發現
社會網絡與族群形成
社會學中最早出現計算社會科學的領域之一是對社會網絡和群體形成的研究。鑒于傳統的研究技術難以捕捉社會關系的演變,許多早期的研究采用了來自互聯網網站、社交媒體平臺的數據進行了相關人口水平研究。例如,Watts利用電子郵件數據演示和闡述了數字空間中的核心社會科學理論,如網絡動態和意見領袖。
最近的一些研究利用媒介數據來研究社交網絡中復雜區域的擴散。例如,Centola創建了一個在線社區以此控制社交網絡的拓撲結構。其他研究表明,網絡拓撲結構也可以影響社會習俗的采納(Centola and Baronchelli 2015)。社交媒體和媒介數據也使得對網絡的分析具有前所未有的規模。如利用Facebook的數據,確定在討論公共衛生問題的大型人際網絡中,情感和理性溝通方式之間的協同作用。在另一項研究中,研究者使用谷歌搜索數據跟蹤文化產品在全球網絡中的傳播。總之這些研究表明,個體之間的微觀相互作用可以產生宏觀層面的擴散模式。
集體行動與政治社會學
計算社會科學激發了大量關于集體行動和抗爭政治的研究。來自社交媒體和其他在線平臺的數據尤其推動了這一話題的研究。例如,對于埃及革命和占領華爾街運動的研究表明,數字工具在抗爭活動中發揮著核心作用,這些工具生成的數據可以為集體政治的研究提供豐富的信息。另外,由于Twitter提供了大量的數據集以研究信息如何在網絡中傳播,Twitter已經成為這一領域的研究熱點。更有研究通過分析Facebook的數據發現,網絡支持者對運動的投入比地面上的積極分子要少。盡管如此,其他人發現社會運動中的線上和線下活動之間存在著強烈的對應關系 (Abul Fottouh and Fetner 2018; Hanna 2013)。即使在線數據不能捕捉所有的離線過程,它們通常也是對傳統數據的有益補充。
計算社會科學研究也有助于發展社會運動中集體動員和行為改變相關的理論。Vasi等(2015) 利用社交媒體和谷歌的數據,展示了在紀錄片放映的社區關于水力壓裂的在線討論和反對這種做法的集體動員是如何形成和增長的。此外,許多研究使用在線數據、自動文本分析、線上實驗和建立仿真模型來檢驗政治兩極化。這些研究調查了政治部落是如何形成的,并強調了“回音室”在其中的作用。計算社會學家也進行了實驗,發現政治同質群體在在線博弈中能夠做出更好的決定。
知識社會學
計算社會科學已經成為知識社會學的核心部分。其中一個方向便是利用引文數據來研究科學內部的共識的達成。由于引文數據已經變得更容易收集和分析,學者們可以繪制和模擬整個科學領域形成的過程。芝加哥大學社會學家James Evans的元知識計劃 (Metaknowledge program) 就是這類研究的例證。他們追蹤團隊合作在科學領域日益占主導地位的研究表明,在社會科學領域團隊合作的傾向在過去50年中增加了一倍多。其他研究表明,小型團隊傾向于在科技領域引入新穎和顛覆性的想法,而大型團隊則傾向于進一步發展現有想法。文本分析的進步也讓學者們對學科之間的相似性和差異有了新的認識。如有研究利用文化洞 (cultural holes) 的概念,繪制領域內和領域間學科術語的差異。盡管這些基于語言的差異并不能精確地映射到引文網絡中的結構漏洞上,但它們仍然抑制了科學家之間的有效交流。
除此之外,另外的文獻探討了學術工作是如何獲得影響力和聲望的。例如在社會學領域的研究表明,跨子領域的文章能獲得更多引用,且更有可能出現在著名期刊上。計算方法也揭示了科學發現是如何由科學家個人的選擇和他們的組織環境所驅動的。最后,計算社會科學揭示了科學界的性別不平等。例如,利用Jstor(最大的學術期刊數字資料庫之一)的數據,West等人(2013) 追蹤了1545年以來自然科學、社會科學和人文學科學術著作中的性別平等狀況,結果表明即使女性和男性擁有相似的發表數量,男性仍然主導著單作者論文或享有聲望的第一作者職位。
文化社會學、社會心理學和情感研究
計算社會科學也出現在文化社會學、社會心理學和情感研究中。在文化社會學中,一些研究考察了文化變遷的廣泛過程,研究話語的承載能力和文化橋梁的作用。另外,文本數據的增長也為文化信息的表達開辟了新的研究領域,而此類研究大多涉及從Facebook或Twitter收集的大量數據。例如,有研究揭示了在Facebook上關于公共健康問題的公開討論中情緒傳染的可能性,或者說,接觸情緒化語言使社交媒體用戶更有可能自己變得情緒化,從而更有可能與情緒化內容互動。除了文本分析,學者們還開創性地使用虛擬現實、虛擬社區來進一步研究其他核心問題。
文化生產
計算社會學科經常被用來研究人們如何評價文化產品,如音樂、藝術或電影;該方法也測量了文化產品中主題的組合如何影響大眾對產品的接受。另一類研究考察了個人之間的社交網絡如何塑造文化物品的創造,此類研究通常側重于新奇和創新的角度。最后,近年來的研究考察了性別、階級和政治身份如何影響文化產品的生產。例如,Shor等人 (2015)發現,由于記者關注的是通常以男性為重點的話題,男性在媒體上的出現頻率就會高于女性。
經濟社會學和組織研究
計算方法和網絡方法的交叉也在經濟社會學中蓬勃發展。電子郵件和消息存檔在組織中創建了大型的個人動態網絡,這大大改進了通過自我報告生成的數據。信息傳遞數據還可以讓研究人員衡量員工在經濟決策過程中的協調程度。最后,網絡數據改善了對社會資本和職業結果的研究。例如,研究表明,某些網絡組成對女性的益處不同于男性 (Lutter 2015)。網絡數據不僅有助于研究交流和職業結果,而且有助于研究組織文化。Goldberg等人 (2016) 分析了一家大型公司的電子郵件信息,以衡量員工的溝通是否符合現行規范和行為,發現融入組織文化的員工會獲得各種獎勵,被解雇的可能性較小。最后,Schnable (2016) 將定性方法與自動文本分析相結合,研究宗教如何為非政府組織提供文化框架,使他們能夠贏得合法性、建立社會網絡、獲得資金和資源。
人口學
計算社會科學在人口學中出現的時間相對較晚,但正迅速普以用于產生高質量的人口估計。例如,移動電話數據被用來生產動態的人口估計,特別是在國家統計數據不可靠的地區。其他人使用谷歌街景和深度學習來估計社區的人口特征 (Gebru et al. 2017)、利用網站來繪制大規模家譜樹 (Kaplanis et al. 2018) 以及利用在線圖像數據來預測年齡等。計算方法也在發展以研究傳統人口學中的生育、死亡和移民。為了研究生育率和死亡率,某些研究采用谷歌搜索數據和Facebook數據 (Hobbs et al.2016; Kashyap and Villavicencio 2016; Ojala et al. 2017)。其他研究則使用Twitter和LinkedIn的數據,對國家內部和國家之間的移民進行更準確的估計 (Palmer et al. 2013; State et al. 2014; Zagheni et al. 2017)。
討論
作者認為這些文獻回顧表明了社會學家不僅為計算社會科學貢獻了新的方法,而且也取得了重大的理論進展,并且認為這是該領域繼續擴展到主流社會學的關鍵。通過計算社會科學可以有多種方法取得理論上的突破。首先,許多研究正在使用新的數據和方法來重新審視那些曾經被認為不可能研究的舊的社會學問題,包括社會網絡和文化變遷的宏觀理論以及人類決策的微觀理論。在作者看來,計算社會科學領域最有影響力的工作能夠將文化變革等宏觀層面的理論與微觀層面的決策過程聯系起來。計算社會科學推動社會學理論進步的第二個途徑是發展數字技術本身所創造的社會領域的新理論。其中包括全新的媒介抗議理論、文化產品的消費以及網絡知識的傳播等等,以此考察政治、網絡和通信領域的新空間。最后,社會學家可以利用計算社會科學的工具來開發創造理論本身的新方法。作者期待利用機器學習來識別社會行為的新維度、或測試現有社會的穩健性。最后,學者們還可以通過與其他領域的交流創造理論。例如,通過比較人類行為和人工智能的理論,可以發現關于社會生活本質的令人興奮的新領域。沿襲該條理論,未來也許能精確地比較人工智能和人類之間的差異進而認識社會,特別是那些不容易表達或機器難以觀察的社會過程。
政志觀察
編譯/Lance
原標題:《編譯 | ARS新文:計算社會科學和社會學》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司