▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

Science最新綜述:計算社會科學十年,反思與展望

2020-09-05 17:20
來源:澎湃新聞·澎湃號·湃客
字號

原創 D. Lazer等 集智俱樂部

導語

2009年2月6日,David Lazer、Alex Pentland為首的15位學者,標志著這一交叉領域的誕生。時隔十年,今年8月28日,David Lazer、Alex Pentland,、Duncan Watts領銜的15位學者在Science的政策論壇專欄發表文章,反思計算社會科學領域研究的不足,包括:數據分享、研究倫理以及激勵機制,同時提出五條建議:加強協作、完善新型數據基礎設施、注重倫理和法律以及社會影響、重組大學組織結構,解決實際問題。

論文題目:

Computational social science: Obstacles and opportunities

論文地址:

https://science.sciencemag.org/content/369/6507/1060

過去十年,計算社會科學 (Computational Social Science,CSS) 蓬勃發展,研究人員利用觀察數據、實驗設計和大規模仿真 (large-scale simulation) 發表了海量論文,這在之前是難以想象的。這些研究極大地提高了人們對社會不平等、傳染病傳播等重要社會現象的認知。學院中支持計算社會科學的機構也大幅增加,全球范圍內跨學科、跨數據源的會議,研討會,與暑期學校數量激增。但在一些重要方面計算社會科學尚有一些不足,許多制度性結構仍處于萌芽狀態,包括研究倫理、教學法以及數據基礎設施等方面。我們提出了解決這些不足的方法,特別針對增強大學組織與該領域的智力需求之間的協調性。

我們將計算社會科學定義為對復雜的、通常是大規模人類行為 (有時是仿真的) 數據計算方法的開發和應用[1]。該領域的知識前身包括對空間數據、社交網絡、以及人類對文本與圖像編程的研究。傳統定量社會科學橫向研究案例、縱向研究變量,且通常假設觀察值之間具有獨立性,而計算社會科學關注的則涵蓋了語言、位置與運動、網絡、圖像以及視頻多種內容,并應用統計模型來獲取數據中的多重依賴性。一個由社會科學家、計算機科學家、統計物理學家和其他領域的研究人員組成的松散的智力群體可以在計算社會科學這一領域聯合起來。

高校的失調

一般來講,多數大學在跨學科工作方面的激勵機制和結構都缺乏統一性。計算社會科學的學科訓練大多是孤立的,將計算科學融入社會科學與將社會科學融入計算科學的進展一直十分緩慢,例如:訓練社會科學家學習如何編程,計算機科學家研究設計這些方向。跨學科合作往往得不到鼓勵,甚至遭遇重重阻礙。計算研究人員和社會科學家通常在大學不同位置的不同單位工作,幾乎沒有相關機制將他們連結在一起。分散的編制模式,不利于各單位之間的協作,常常導致低效的重復。

科研評估工作,如分配研究資金的英國“研究卓越框架” (Research Excellence Framework) ,通常也都側重于單一學科內部,這就意味著多學科研究可能得不到認可和獎勵。同樣地,大學晉升制度也并不重視多學科學者。大學里的計算研究基礎設施往往不能很好地支持大規模以及敏感數據集的分析,這些工作對數據安全性、大量研究人員訪問以及計算能力都有要求。這些問題在學術界已經得到了一定程度上的解決(例如基因組數據的使用),但在計算社會科學領域中,相關解決辦法仍未付諸實踐。

不適當的數據共享范式

當前計算社會科學中用于共享大規模敏感數據的模式是一個“混合包“,在與政府合作的基礎上相關研究取得了很好的成果,特別是在經濟學領域下,分析不平等現象[2]以及勞動力市場的動態[3]。目前已經出現了一些新興的、資源豐富的行政數據研究平臺,可以在保護隱私的前提下,分析微觀層面數據[4]。這些為計算社會科學與私營公司的潛在合作,提供了重要的經驗支持,包括制定一個既能保證敏感數據的安全、又能將其用于分析研究的方案。(例如,差異性隱私方面的創新)。

然而,私營企業的價值取向與政府不同,我們可以料想到,相關的研究進展會更少。政府機構手中的數據是為公眾托管的,而企業持有的數據通常被視為重要的專利資產。對政府機構的利益相關者而言,共享數據所固有的公共責任可能被視為一種積極因素,但對私營企業的股東來說,情況就并非如此了。這樣一來,研究人員從私營企業獲得研究數據的可能性不大。即使能夠拿到數據,通常也是利用一個拼湊而成的系統,該系統中某些數據是通過公共應用程序接口 (APIs) 獲取的;或者通過研究人員在與有關企業的合作過程中獲得,這種情況下往往需要在該企業工作;還有一些是通過個人關系與一次性安排獲得。一般而言這些數據受到保密協議的約束、且可能存在潛在的利益沖突。研究人員獲取數據的另一種選擇是,購買專門為市場研究收集的專利數據 (如Comscore、Nielsen等) ,這種方法有時并不公開透明,且其定價之高也令人望而卻步。

雖然這種方法看起來很實用,但我們認為它將不再是計算社會科學領域獲取數據的主流途徑。在研究領域的起步階段,這些數據看起來包羅萬象,實際可用的資源卻非常有限。而經由這種方法獲取的數據的可得性和可及性,也是我們的擔憂。

首先,許多企業在持續減少可從其平臺抓取的數據[5]。這樣做有時是有充分理由的,例如:監管法規(歐盟通用數據保護法規 (GDPR))、公司丑聞 (Cambridge Analytica and Facebook) 等,但這樣帶來的不利影響,就是阻塞了有潛在價值的研究途徑。私人與研究人員之間的合作是完全自愿的,這樣數據的可獲得性很容易受到私人的任意性和不可預測變化的影響,使得這種獲取數據的方法在本質上并不可靠,還會導致科學研究存在潛在偏差。

其次,消費品和平臺生成的數據,并不完全適用于科學研究[6]。在線平臺的用戶和服務未必能代表普通民眾,且他們的行為也可能存在未知的偏差。因為平臺從未被設計用來回答研究問題,所以可能沒有收集到與研究最相關的數據(例如對信息擴散感興趣的研究人員會統計轉發的內容),或者數據收集會被系統中其他因素所混淆(例如:關于用戶喜好的推斷會被公司排名和推薦算法所影響)。

平臺的設計、功能、數據記錄和數據訪問策略隨時可能變化,而平臺所有者沒有理由為了研究者的利益而保持工具的一致性。由此,基于此類“已發現”數據做出的研究難以避免地會受到數據內部與外部有效性的干擾。特別是基于平臺的數據,可能會隨著平臺的變化而迅速貶值[7]。而且,出于隱私和知識產權方面的考量,研究團體往往無法獲得原始數據,或者在未來可能無法獲得,這就妨礙了研究結果的可重復性與復制性。

不足的研究規范

最后,我們目前仍未能制定出相關科研方面的“行規”。

盡管之前就曾呼吁制定此類指導,且研究中已出現重大失誤,破壞了公眾的信任,但計算社會科學領域始終未能充分闡明收集和分析人的數字數據的明確原則和機制,以及如何最大限度地減少對人傷害的可能性。極少有大學提供技術、法律法規或道德方面的指導來適當控制和管理敏感數據,機構審查委員會仍沒有普遍適應和一致應對由數字追蹤數據的帶來的獨特倫理挑戰。最近美國修改的關于研究對象為“人”的課題 (human subjects research) 倫理的共同規則 (Common Rule),也并沒有完全解決這些問題。

例如,網絡世界里,我們分享個人信息的同時,其實也提供了與自己有相關聯系的人的信息,我們該如何處理這一問題呢?圍繞 “同意”的挑戰,凸顯了管理敏感數據安全,與重塑機構審查程序和道德規范的重要性。然而,很少有大學會整合基礎設施和監督程序,來最大限度地降低安全漏洞的風險。

劍橋分析公司以及其他類似的事件,引發了一場圍繞數據主權的激烈討論。隱私權倡導者和企業之間的戰線已經拉開,前者試圖盡量減少對所有個人數據的收集和分析,而后者則想要以向消費者提供價值為基礎,來證明其數據收集策略的合理性。

在公開討論中,往往缺少對相關政策的呼吁,這些政策鼓勵或授權對私人數據以符合倫理道德的方式來使用,以維護包括隱私、自主、安全、人類尊嚴、正義與權力制衡在內的公共價值,進而實現重要的公共目標,如預測疾病傳播、關注社會公平與機會以及經濟崩潰等。此外,對學術界基礎設施的投資也是缺位的。這些投資可以推動知識生產并維護個人隱私。

建 議

對于上述問題,我們提出了五個方面的建議。

加強協作

盡管存在上述局限性,由私人企業收集的數據仍非常重要且價格不菲,無法通過任何其他方式獲取,且這些數據過于普遍,難以為公眾所用,也難以用于公共資助的研究[8]。與其回避與產業界的合作,研究社群應該圍繞研究倫理、透明度、研究者自主權、與研究結果可復制性,制定可執行的行業指導方針。我們預計,未來幾年將出現許多對利益相關方具有激勵作用的方法。最廣泛持久的模型是開放的、匯總的數據,如人口普查數據。這種模型是為共享政府數據而開發的,強調安全和隱私,也為與企業數據合作提供了前景。聯合國可持續發展目標 (United Nations Sustainable Development Goals) 呼吁在公共-私人數據源方面建立伙伴關系,以在全世界范圍內提供各種新穎多樣的逐個鄰域措施[9]。世界各個地方的國家統計局,都在默默地為達成這種關系作出努力,但由于資金缺乏,進展較為緩慢。安全的行政數據中心的發展,再加上授予訪問權、監測產出和強制要求遵守隱私和道德規則的行政基礎設施,都為計算社會科學向前發展提供了一種模式。如上所述,這一模式已經在政府行政數據領域得到證明。在少數情況下,電信公司和銀行也已經證明。

類似的模式在學術研究中很少見,但正變得越來越普遍。荷蘭的社會科學和經濟創新開放數據基礎設施就是一個例子。Facebook已通過多種模式與學術界進行合作。在最初的幾年中,它著重于一次性合作,主要是通過非正式協商。2016年大選后,Facebook啟動了Social Science One來提供可訪問的新聞消費的匯總數據。盡管資源充足,但在數據提供方面仍面臨著挑戰[10]。

2019年新型冠狀病毒 (COVID-19) 在建立研究人員和企業之間的伙伴關系方面發揮了特殊作用,這有助于我們了解疾病的發展軌跡。(包括美國在內的許多國家,COVID-19也說明了關于該疾病的許多公共數據存在斷裂性和政治偶然性。) Twitter已為獲得批準的研究人員提供了有關COVID-19的API接口,Cuebiq等位置數據公司,也提供了對匿名移動數據的訪問權限。在COVID-19被載入史冊之后,有一些問題仍懸而未決,例如:這些數據收集工作將在何種程度上繼續進行,以及如果繼續如何使它們與學術界的關鍵研究規范(如:透明度、可再生產性、復制性和同意性)保持一致等。(詳見:)

與Facebook相關的大選實例凸顯了研究人員與企業之間潛在的對抗性作用。當代計算社會科學領域的一個核心問題 (如下所述) 是特定的社會技術系統,以何種方式,在社會中發揮積極和消極的作用。如果企業認為透明地研究和預測這些問題符合自己的長遠利益,那么研究人員與企業之間緊張的對抗關系可能會得到部分(但不完全)地緩解。然而,即使在最樂觀的情況下,研究產生的見解中的公眾利益與企業利益之間也將存在分歧。

從更廣泛的角度而言,學術界需要為專業實踐提供精心制定的指導方針。企業對研究過程能有什么控制權?顯然,企業對論文內容擁有否決權顯然是不可接受的,但任何數據共享協議的現實是,研究人員與企業之間有協商的調查領域。還有很多問題,諸如被提供用于復制的數據有哪些要求、研究人員對訪問公司內部數據管理和策劃流程的需求是什么等等。

完善新型數據基礎設施

為了支持對社會具有重要挑戰的科學研究,保護隱私的共享數據基礎設施,可以 在不同人群中,收集具有科學動機的數字蹤跡,也可以讓大量個體參與到大型虛擬實驗室的設計實驗中。共享數據基礎設施建設可以貢獻他們的數據與時間來支持公共利益,也可以明確的補償或獎勵來驅動。新型數據基礎設施應使用最先進的安全技術,并需根據數據的敏感度制定不同等級的安全措施清單。這些努力需要在大學內與跨大學兩個層次進行。基礎設施應獲取并記錄描述數據收集過程的元數據,并結合合理的原則進行數據收集和使用。萊布尼茨社會科學研究所的安全數據中心,就是一個用于敏感數據研究的共享基礎設施的例子。此外,抓取主要平臺上的算法驅動行為,是很重要的[11, 12]。其一是因為算法行為愈發重要,其二因為在基于平臺的數據收集中,算法的變化會產生巨大的偽像。還有一點至關重要的,即法律框架應允許并授權以合乎道德的方式來獲取和收集有關個人數據,并對平臺進行嚴格審查。

注重倫理、法律與社會影響

我們需要制定與21世紀新出現的科學機遇與風險相適應的倫理框架。社會科學可以幫助我們理解社會的結構性不平等,計算社會科學則需要打開數據驅動算法的 “黑匣子”。這些算法做出過很多影響重大的決策,但也會帶有偏見。人類基因組計劃投入超過3億美元,作為其“倫理、法律和社會影響”計劃的一部分,“以確保社會學會只以有益的方式使用信息”。在倫理研究方面,尚未有現成的解決方案。專業協會需要致力于制定新的道德準則——互聯網研究人員協會制定的準則,就是努力解決這一問題的一個例子。同時還需要公共出資和私人基金會的大量投資,來開發針對研究人員的知情監管框架和倫理道德指導,這些也將指導政府和組織在這一領域的實踐。

重組大學組織結構

從天文學到人類學,計算科學與越來越多的領域緊密相連。為了反映上述學科特征,需要在典型的“孤島式“大學中進行機制創新,建立連接不同領域研究人員的組織結構,獎勵跨學科的專業合作。機構創新的成功范例包括任命具有多部門隸屬關系的教職員工(例如:橫跨計算機科學與社會科學)、配置由不同領域的教員組成的研究中心以及分配內部資金來支持多學科合作。為了培育新一代科學家,還需重新構思與協調本科生與研究生的課程發展。在大學內部必須要有廣泛的努力來授權和執行倫理研究實踐,如:集中協調的、安全的數據基礎設置。

解決實際問題

上述建議需要從公共與私人來源獲得資源,按照目前的社會科學資助標準,這些資源都是非同尋常的。為了證明如此巨大的投資是合理的,計算社會科學家必須證明其研究結果,將不僅僅是發表讓其他研究人員感興趣的期刊文章,而是要闡明學術、產業和政府的合作以及與專門的科學基礎設施如何結合起來,以及研究將如何解決重要的社會問題,如:保護個人人身安全、提高國家安全、促進經濟繁榮、培養社會包容性、多樣性、公平性和獲取性、增強民主等等。目前在全球應對大型流行疾病的過程中,計算社會科學呈現出自身廣闊的發展潛力。除了在學術界之外產生有意義的成果外,追求這一目標還可能帶來更多可復制、累積且連貫的科學[15]。

參考文獻:

[1] D. Lazer et al., Science 323, 721 (2009).

[2] R.Chetty,N.Hendren,P.Kline,E.Saez,Q.J.Econ.129, 1553 (2014).

[3] J. J. Abowd, J. Haltiwanger, J. Lane, Am. Econ. Rev. 94, 224 (2004).

[4] A.Reamer,J.Lane,ARoadmaptoaNationwideData Infrastructure for Evidence-Based Policymaking (2018); https://journals.sagepub.com/doi/ abs/10.1177/0002716217740116.

[5] D.Freelon,Polit.Commun.35,665(2018).

[6] M.J.Salganik,BitbyBit:SocialResearchintheDigital Age (Princeton Univ. Press, 2017).

[7] K.Munger,Soc.MediaSoc5,205630511985929(2019).

[8] Social Science Research Council, To Secure Knowledge: Social Science Partnerships for the Common Good (2018); www.ssrc.org/to-secure-knowledge/.

[9] IEAG,UN,“AWorldthatCounts—MobilisingtheData Revolution for Sustainable Development.” Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014).

[10] G.King,N.Persily,“ANewModelforIndustry-Academic Partnerships” (Working Paper, 2018); http://j.mp/2q1IQpH.

[11] A.Hanna?ketal.,inProceedingsofthe22nd International Conference on World Wide Web (ACM Press, New York, 2013), pp. 527–538.

[12] I.Rahwanetal.,Nature568,477(2019).

[13] Z.Obermeyer,B.Powers,C.Vogeli,S.Mullainathan, Science 366, 447 (2019).

[14] J. E. McEwen et al., Annu. Rev. Genomics Hum. Genet. 15, 481 (2014).

[15] D.J.Watts,Nat.Hum.Behav.1,0015(2017).

相關資料:

https://swarma.org/?p=12618

作者:D. Lazer等

譯者:茍澤鵬

審校:吳雨桐

編輯:鄧一雪

原標題:《Science最新綜述:計算社會科學十年,反思與展望》

閱讀原文

    本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 大余县| 广饶县| 福安市| 靖安县| 和硕县| 若尔盖县| 四会市| 墨江| 太仆寺旗| 沂源县| 化州市| 蒲江县| 刚察县| 循化| 西华县| 信宜市| 宣城市| 诸暨市| 南汇区| 虎林市| 新巴尔虎左旗| 精河县| 洛川县| 商南县| 万州区| 衡东县| 沂南县| 绍兴县| 巩留县| 瑞丽市| 项城市| 苏州市| 昌都县| 姜堰市| 大厂| 宝兴县| 信阳市| 永年县| 天柱县| 抚州市| 白水县|