[author]海蒂·萊德福德
[content]
伊麗莎白·西瓦克(Elizaveta Sivak)花了近十年的時(shí)間去訓(xùn)練自己成為一名社會(huì)學(xué)家。然而,在進(jìn)行一項(xiàng)研究時(shí),她發(fā)現(xiàn)自己需要重返校園。
西瓦克在莫斯科的俄羅斯國立高等經(jīng)濟(jì)大學(xué)(National Research University Higher School of Economics)從事家庭與童年的研究。在2015年,通過在一系列的采訪,她讓青少年回憶他們過去五天中去過的十個(gè)地方,從而研究青少年的出行軌跡。一年后,她完成了數(shù)據(jù)分析。一位同事給她介紹了一篇論文,使用了哥本哈根網(wǎng)絡(luò)研究(Copenhagen Networks Study)的數(shù)據(jù),她對依賴于個(gè)人采訪的局限性感到沮喪,因?yàn)樵谖鍌€(gè)月的時(shí)間里,哥本哈根網(wǎng)絡(luò)研究這個(gè)開創(chuàng)性的項(xiàng)目追蹤了約1000名學(xué)生每隔五分鐘的社交媒體通訊錄、人口統(tǒng)計(jì)數(shù)據(jù)和地理位置數(shù)據(jù)。在那之后,她知道她所在的領(lǐng)域?qū)⒁淖??!拔乙庾R到這些新的類型的數(shù)據(jù)將會(huì)永久地改變社會(huì)科學(xué),”她說。“我認(rèn)為這很酷?!?/span>
隨即,西瓦克決定學(xué)習(xí)如何編程并加入這場革命。現(xiàn)在,她和其他計(jì)算社會(huì)科學(xué)家探索著海量的不規(guī)則數(shù)據(jù)集,從社會(huì)的數(shù)字烙印中提取含義。他們追蹤人們的線上活動(dòng)、探索數(shù)字化的書籍和歷史文獻(xiàn)、解釋記錄著人們出行和聯(lián)絡(luò)的可穿戴傳感器中的數(shù)據(jù)、進(jìn)行可以收集上百萬數(shù)據(jù)點(diǎn)的線上調(diào)查和實(shí)驗(yàn)、探尋只有通過復(fù)雜的數(shù)據(jù)分析才會(huì)吐露社會(huì)秘密的巨大數(shù)據(jù)庫。
在過去的十年里,研究人員通過運(yùn)用這樣的手段拆解了社會(huì)科學(xué)家們探尋了一個(gè)多世紀(jì)的話題:從人類道德的心理學(xué)基礎(chǔ)到誤傳的影響,再到使一些藝術(shù)家比別人更成功的因素。一個(gè)研究揭露了算法里影響社保決定的普遍性的種族歧視,另一個(gè)通過移動(dòng)手機(jī)的數(shù)據(jù)測繪出了盧旺達(dá)的貧困地區(qū)。
德國科隆曼海姆萊布尼茨社會(huì)科學(xué)研究所(GESIS Leibniz Institute for the Social Sciences)的計(jì)算社會(huì)科學(xué)家馬庫斯·施特羅邁爾(Markus Strohmaier)說:“最大的成就是對數(shù)字行為數(shù)據(jù)的觀念轉(zhuǎn)變。人們現(xiàn)在認(rèn)為這些數(shù)據(jù)是有趣的、有用的。”
不是所有人都迎接了這個(gè)轉(zhuǎn)變。一些社會(huì)科學(xué)家擔(dān)心,大量涌入這個(gè)領(lǐng)域的野心勃勃的計(jì)算機(jī)科學(xué)家們對以前的研究不夠熟悉。另一個(gè)抱怨是,有些計(jì)算研究者只看規(guī)律而不思考背后的原因,或者他們從不完整的凌亂數(shù)據(jù)——通常從社交媒體平臺或其他數(shù)據(jù)清潔度不夠的來源中獲得——得出重磅結(jié)論。
凡事都可以從兩個(gè)角度看待。一些出身物理學(xué)和工程學(xué)的計(jì)算社會(huì)科學(xué)家爭論稱,很多社會(huì)科學(xué)的理論過于朦朧或定義不清以至于無法被證實(shí)。
”但是這兩個(gè)陣營正在開始合并?!坝?jì)算社會(huì)科學(xué)和傳統(tǒng)社會(huì)科學(xué)的交集正在增長,”庫什尼格指出了合辦期刊、會(huì)議、學(xué)習(xí)項(xiàng)目的激增,“相互的尊重也在增長。”
1
計(jì)算的革命
2007年,一小群有著遠(yuǎn)大抱負(fù)的科學(xué)家們聚在一起,開會(huì)探討了社會(huì)科學(xué)數(shù)據(jù)運(yùn)算的新興技能。他們希望運(yùn)用自己的技能改變世界。來自馬塞諸塞州劍橋的哈佛大學(xué)(Harvard University)政治科學(xué)家加里·金(Gary King)在他的演講中指出,數(shù)字信息的爆發(fā)“會(huì)讓人們有可能更深入地了解社會(huì),和最終開始解決——真正地解決——影響人類福祉的主要問題”。
在那時(shí),已經(jīng)有少量關(guān)于計(jì)算社會(huì)科學(xué)的研究出版了。在2006年,通過制造一個(gè)被14341人使用的虛擬線上音樂市場,一項(xiàng)研究探索了社會(huì)影響對歌曲熱度的作用。參與者下載選中的歌曲時(shí),有時(shí)他們會(huì)被告知這些歌曲在其余平臺用戶中的人氣,有時(shí)不會(huì)。研究發(fā)現(xiàn)當(dāng)用戶越被其他人的行為所影響時(shí),一首歌的人氣越將難以被預(yù)測。這也為為何一炮而紅如此難被預(yù)測提供了一種解釋。
兩年后,一個(gè)研究分析了六個(gè)月中10萬個(gè)移動(dòng)手機(jī)用戶的行蹤,發(fā)現(xiàn)人們的出行軌跡是簡單的、可復(fù)制的。研究者們可以計(jì)算個(gè)體出現(xiàn)在任意特定位置的幾率。他們提議辨認(rèn)一個(gè)社群出行規(guī)律的相似之處,可以幫助人們更好地規(guī)劃城市、了解疾病的傳播和為緊急情況做準(zhǔn)備。
“隨著時(shí)間的推移,雙方都在了解對方的語言和方法。”
同一年,技術(shù)雜志《連線》(Wired)發(fā)表了一篇文章,論點(diǎn)是大數(shù)據(jù)時(shí)代將終結(jié)所有科學(xué)理論。盡管此文章被廣泛批評為有過度簡化之嫌,它觸動(dòng)了一根神經(jīng):十多年后,社會(huì)科學(xué)家們重復(fù)性地引用《連線》的文章作為社會(huì)科學(xué)理論的相關(guān)性遭受了攻擊的信號。
但是大數(shù)據(jù)仍持續(xù)了其主導(dǎo)地位。對費(fèi)城的賓夕法尼亞大學(xué)(University of Pennsylvania)社會(huì)學(xué)教授鄧肯·沃茨(Duncan Watts)來說,社會(huì)科學(xué)的這一變化使人回想起1990年代生物學(xué)發(fā)生的事情。那時(shí),高通量技術(shù)開始生成關(guān)于DNA定序和基因表達(dá)的大量數(shù)據(jù)。“大量新數(shù)據(jù)的涌入要求人們以一種非常不同的角度重新思考數(shù)據(jù),”他說。
這場革命的最初成果并沒有在很多傳統(tǒng)社會(huì)科學(xué)家心里留下太多印象,他們認(rèn)為其中有一些方法是可疑的。懷疑者們認(rèn)為社交媒體的研究是在數(shù)千不知情、不同意的參與者身上做實(shí)驗(yàn)。2018年,英國咨詢公司劍橋分析公司(Cambridge Analytica)在未獲得用戶同意的情況下收集了百萬臉書賬戶數(shù)據(jù)的新聞爆發(fā)。丑聞的后果持續(xù)地為社交媒體研究帶來了更多的審視和懷疑。各平臺頒布的新隱私條例使一些科學(xué)家的研究受阻。
社交尷尬
這個(gè)領(lǐng)域同樣被早期討論“玩具”問題的論文污名化。在社會(huì)科學(xué)中,“玩具”問題指可以通過數(shù)據(jù)回答,但無法解決長期存在的根本性難題的問題,比如攻克不平等問題或影響輿論。同是曼海姆萊布尼茨社會(huì)科學(xué)研究所的計(jì)算社會(huì)科學(xué)家克勞迪婭·華格納(Claudia Wagner)說道:“一開始有許多推特研究,但我認(rèn)為有很多社會(huì)學(xué)家并不感到十分激動(dòng)”。
一些人認(rèn)為,對玩具問題敞開懷抱至少有一部分歸功于一個(gè)新興領(lǐng)域站穩(wěn)腳跟的結(jié)果。施特羅邁爾指出,當(dāng)分析變得更加復(fù)雜、數(shù)據(jù)來源更加多元化后,這個(gè)領(lǐng)域也開始攻克更為重要的問題,例如歧視、不平等和激進(jìn)化的源頭?!拔覀儸F(xiàn)在才開始得到那種能讓我們?nèi)ヌ剿鞔髥栴}的數(shù)據(jù)”,他說。
舉個(gè)例子,去年來自公共衛(wèi)生和行為經(jīng)濟(jì)領(lǐng)域的研究者們運(yùn)用了美國一醫(yī)保系統(tǒng)中超50000名患者的醫(yī)保記錄去分析一個(gè)常被使用的算法。該算法將額外的監(jiān)督和健康干預(yù)推薦給有復(fù)雜醫(yī)療需求的人們。研究團(tuán)隊(duì)運(yùn)用的模型顯示,此算法存在對黑人的系統(tǒng)性歧視——可能影響對上百萬人的照料。接著,研究者們運(yùn)用美國醫(yī)保不平等方面的知識追蹤該偏見的源頭,并提出了消除算法歧視的建議。例如,算法不應(yīng)該假設(shè)個(gè)體醫(yī)保的花銷可以代表他們所需照料的多少:因?yàn)楹谌烁俚慕佑|醫(yī)保資源,比起白人,通常來說更少的資金花在了照料黑人上,盡管他們有相同的醫(yī)保需求。
但是獲得好的數(shù)據(jù)并不是唯一的挑戰(zhàn):物理學(xué)或計(jì)算機(jī)科學(xué)出身的科學(xué)家被指責(zé)忽視了社會(huì)科學(xué)家用來解釋人類行為所制訂的理論?!八麄兂3ふ乙?guī)律,”朱莉亞·安德里格托(Giulia Andrighetto)說。她接受過哲學(xué)家的訓(xùn)練,現(xiàn)在是羅馬意大利國家研究委員會(huì)(Italy’s National Research Council)認(rèn)知科學(xué)與技術(shù)研究院(Institute of Cognitive Sciences and Technologies)的一位計(jì)算社會(huì)科學(xué)家?!暗撬麄兺ǔ2粫?huì)尋找那些生成該行為的機(jī)制?!?/span>
要想從事那些工作,需要對社會(huì)科學(xué)理論的堅(jiān)實(shí)理解。位于多哈的哈邁德·本·哈利法大學(xué)(Hamad Bin Khalifa University)的計(jì)算社會(huì)科學(xué)家安智善(Jisun An)在2010年開始了計(jì)算機(jī)科學(xué)博士的學(xué)習(xí),研究社交媒體上的新聞分享。那時(shí)計(jì)算社會(huì)科學(xué)的運(yùn)動(dòng)開始流行。一開始,她只和其他計(jì)算機(jī)科學(xué)家工作。他們掙扎著理解不同的社會(huì)科學(xué)理論?,F(xiàn)在,她和政治科學(xué)家一起合作研究媒體對民意的影響、民意對媒體的影響以及如何鼓勵(lì)人們增加他們新聞來源的多樣性?!半S著時(shí)間的推移,兩方都在了解對方的語言和方法,”
她說。現(xiàn)在有了雙方參與的具體跡象。第一屆將兩種途徑聚在一起的主要會(huì)議將在2021年舉行。為了減少分歧,各個(gè)大學(xué)正在創(chuàng)立將不同系的研究人員聚在一起的學(xué)術(shù)機(jī)構(gòu)。例如,位于弗吉尼亞州費(fèi)爾法克斯的喬治梅森大學(xué)(George Mason University)就有這樣一個(gè)專門的部門。一個(gè)計(jì)算社會(huì)科學(xué)夏令營在全球擁有30個(gè)校區(qū)。一大群年輕積極的學(xué)生與可供選擇崗位的增加一起,讓權(quán)力斗爭讓位與更緊密地合作有了希望。
社交
計(jì)算科學(xué)和社會(huì)科學(xué)這兩種途徑的結(jié)合可以是很有力量的。西雅圖華盛頓大學(xué)(University of Washington)的數(shù)據(jù)科學(xué)家約書亞·布魯門斯托克(Joshua Blumenstock)和他的同事運(yùn)用盧旺達(dá)上百萬人移動(dòng)手機(jī)的數(shù)據(jù),去推斷他們的社會(huì)經(jīng)濟(jì)地位,并通過與傳統(tǒng)問卷收集到的數(shù)據(jù)做比較來確認(rèn)他們的預(yù)測結(jié)果。這種方式可以讓政策制定者針對需要被干預(yù)的貧困地區(qū)做出調(diào)整,或者用于檢測已實(shí)施的政策的效果。
但是兩者間依然缺乏溝通。哈佛大學(xué)社會(huì)科學(xué)教授瓊·多諾萬(Joan Donovan)指出了一篇去年發(fā)表的研究。研究人員在臉書和VKontakte平臺上畫出了線上仇恨組織的結(jié)構(gòu)并展示了組織結(jié)構(gòu)是如何隨時(shí)間改變的。她認(rèn)為,參與此項(xiàng)研究的物理學(xué)家和計(jì)算機(jī)科學(xué)家沒有在文章中引用關(guān)鍵的社會(huì)科學(xué)文獻(xiàn),導(dǎo)致他們對研究結(jié)果的詮釋并沒有想象中豐富。當(dāng)過往的研究顯示仇恨組織在很多網(wǎng)域上追隨有領(lǐng)導(dǎo)魅力的領(lǐng)導(dǎo)者時(shí),研究人員調(diào)查的社交媒體平臺顯得太少了。研究團(tuán)隊(duì)得出的結(jié)論在她看來是危險(xiǎn)的:社交平臺可以試圖通過例如創(chuàng)造假賬號或制造仇恨團(tuán)體的內(nèi)斗的方式來引導(dǎo)仇恨組織的言論。她說這樣做會(huì)增加仇恨組織的討論量,提升搜索算法中的排名,反而弄巧成拙。她認(rèn)為一個(gè)更好的戰(zhàn)略是通過搜索引擎來限制這些組織的可見度,以達(dá)到限制仇恨言論傳播的效果。
華盛頓特區(qū)喬治華盛頓大學(xué)(George Washington University)的物理學(xué)家尼爾·約翰遜(Neil Johnson)是這篇仇恨研究的主要作者,他習(xí)慣了來自社會(huì)科學(xué)家的批評。他說他已經(jīng)引用了最相關(guān)的資料。社交媒體公司有權(quán)力去操縱搜索算法,他說:“就像他們現(xiàn)在為了抑制反疫苗和誤傳新冠病毒的頁面和群組的顯著性所做的那樣?!彼麑φ`傳、沖突和極端主義都有研究,并表示他每發(fā)表一篇受關(guān)注的論文就會(huì)收到怨言。但是他的研究觸動(dòng)了政策制定者:那些喜歡他研究成果的量化天性和預(yù)測干預(yù)手段可能導(dǎo)致的影響的能力的組織經(jīng)常向他咨詢?!拔覀兛梢杂靡环N他們與其他研究機(jī)構(gòu)溝通時(shí)沒有經(jīng)歷過的方式去看待這些實(shí)際的問題,”他說。對他來說,他擔(dān)心有太多沒有經(jīng)過恰當(dāng)訓(xùn)練的社會(huì)科學(xué)家涌入計(jì)算這一領(lǐng)域中。
約翰遜并不是唯一一個(gè)對于理論對他們研究項(xiàng)目的重要性持懷疑態(tài)度的科學(xué)家。位于瑞典韋克舍的林奈大學(xué)(Linnaeus University)的計(jì)算社會(huì)科學(xué)家吉安加科莫·布拉沃(Giangiacomo Bravo)接受過社會(huì)經(jīng)濟(jì)學(xué)家的訓(xùn)練,他說很多社會(huì)科學(xué)的理論過于朦朧以至于無法用大數(shù)據(jù)證實(shí)。例如社會(huì)資本這一概念有時(shí)被定義為在一社會(huì)中使個(gè)體一起工作的共享理解與價(jià)值觀。“社會(huì)資本這個(gè)概念的最初表述太過模糊了”,他說:“我怎么能測量這個(gè)呢?”
然而有些理論是更具體的。安德里格托研究的是社會(huì)規(guī)范,這指的是界定在社會(huì)里哪些是能被接受或不能被接受的行為的共同標(biāo)準(zhǔn)。她說,研究人員已花了十年時(shí)間為這個(gè)領(lǐng)域拼湊清晰的定義和理論。例如,一個(gè)理論表明,當(dāng)社會(huì)規(guī)范改變時(shí),它將使人們對某特定情境的反應(yīng)做出變化。社會(huì)規(guī)范也被認(rèn)為只能緩慢發(fā)生變化,且變化時(shí)伴隨著深入的社會(huì)互動(dòng)。這些可被檢驗(yàn)的陳述,使安德里格托能夠?qū)⒂?jì)算的工作與社會(huì)科學(xué)理論結(jié)合在一起:她用線上實(shí)驗(yàn)去測試是否模擬的社會(huì)規(guī)范的改變會(huì)影響行為。
她并不是唯一一個(gè)想用社會(huì)科學(xué)改變世界的人。很多時(shí)候,沃茨說,他和其他學(xué)術(shù)研究者更追求文章被出版而不是尋找現(xiàn)實(shí)世界的解決方案。“我感覺我的工作在論文發(fā)表的那一刻就結(jié)束了,”他說?!拔业墓ぷ魇前堰@些想法放在臺面上,想辦法將他們轉(zhuǎn)換為在現(xiàn)實(shí)世界中有意義的措施是其他人的工作了。”
沃茨說,為了讓這種轉(zhuǎn)變發(fā)生,來自兩個(gè)陣營的研究者們必須保持合作的勢頭。有些人已經(jīng)能感受到這正在發(fā)生了。“傳統(tǒng)的社會(huì)科學(xué)和計(jì)算社會(huì)科學(xué)實(shí)際上正在變得越來越緊密”,華格納說?!傍櫆蠈⒃?0年內(nèi)消失?!?/span>
本文刊載于《自然》2020年6月18日第582期,原標(biāo)題是《計(jì)算人性:臉書、推特和其他來源的數(shù)據(jù)是如何正在徹底變革社會(huì)科學(xué)的?》
譯者:黃淵凝,紐約大學(xué)2018級本科數(shù)學(xué)系學(xué)生
轉(zhuǎn)載自 社計(jì)未來 公眾號