- +1
富國(guó)低生育率表明富人更不愿養(yǎng)孩子?小心“區(qū)群謬誤”!
近日,幾位朋友在微信群里聊及生育率這一話題。
A君提到人口經(jīng)濟(jì)學(xué)中的一大典型事實(shí):經(jīng)濟(jì)發(fā)展水平越高的國(guó)家,其生育率越低。
B君立即追問道:“變得更富裕的人們?yōu)楹胃辉敢怵B(yǎng)孩子呢?”
“這都哪跟哪啊,即便‘經(jīng)濟(jì)發(fā)展水平更高的國(guó)家具有更低的生育率’是事實(shí),你也不能由此推出‘富人更不愿意養(yǎng)孩子’這個(gè)結(jié)論呀!”C君素來喜與B君“抬扛”。
“道理何在,愿聞其詳”,B君回懟C君,而C君一時(shí)語塞。
作為一個(gè)具有統(tǒng)計(jì)學(xué)背景且“好為人師”的大學(xué)教師,我馬上意識(shí)到,對(duì)統(tǒng)計(jì)學(xué)進(jìn)行科普的一次難得機(jī)會(huì)又被我遇上了。其實(shí),B君由“經(jīng)濟(jì)發(fā)展水平更高的國(guó)家具有更低的生育率”這一事實(shí)推導(dǎo)出“富人更不愿意養(yǎng)孩子”的結(jié)論,陷入了一個(gè)著名的統(tǒng)計(jì)學(xué)謬誤。
此統(tǒng)計(jì)學(xué)謬誤就是所謂的“區(qū)群謬誤”。聽起來,這是一個(gè)比較抽象的術(shù)語,在此我們不妨首先通過一個(gè)具體案例來理解其含義。該案例引自美國(guó)社會(huì)學(xué)家勞倫斯·紐曼的著作《社會(huì)研究入門》,梗概如下:
有兩個(gè)分別名為湯姆和瓊斯的小鎮(zhèn)。兩個(gè)鎮(zhèn)的總?cè)丝跀?shù)相差不多,但湯姆小鎮(zhèn)的平均收入水平更高,同時(shí)該鎮(zhèn)的摩托車登記數(shù)量也更多,共有4000輛。瓊斯小鎮(zhèn)有很多窮人,所以平均收入水平低,同時(shí)該鎮(zhèn)的摩托車登記數(shù)量也僅有100輛。在查看了關(guān)于這兩個(gè)小鎮(zhèn)的數(shù)據(jù)后,我們或許認(rèn)為,富人更有可能擁有摩托車。
然而,假若我們不掌握摩托車究竟是由兩個(gè)小鎮(zhèn)的哪些家庭所擁有這種微觀調(diào)查數(shù)據(jù),則根本無法由平均收入與摩托車數(shù)量這兩個(gè)宏觀變量的關(guān)系,推導(dǎo)出“富人更有可能擁有摩托車”這一微觀行為。在這里,宏觀變量的分析單位是作為整體的鎮(zhèn)子,而真實(shí)的微觀行為也許是:在湯姆小鎮(zhèn),所有中低收入家庭都加入了摩托車俱樂部,但沒有任何一個(gè)高收入家庭加入;在瓊斯小鎮(zhèn),100輛摩托車全部由低收入家庭擁有。

《社會(huì)研究入門:如何理解我們的日常社會(huì)生活》,勞倫斯·紐曼 著,劉佳昕 譯,后浪出版公司2021年3月出版。
上述案例表明,如果我們?cè)噲D了解摩托車擁有情況與家庭收入之間的關(guān)系,就必須收集以家庭而非鎮(zhèn)子為分析單位的數(shù)據(jù)。至此,何謂區(qū)群謬誤就“水落石出”了——這是一種由于錯(cuò)誤匹配分析單位而產(chǎn)生的統(tǒng)計(jì)學(xué)謬誤。更具體地說,如果數(shù)據(jù)有著高層次或聚合的分析單位,而我們卻據(jù)此對(duì)低層次或分解的分析單位做出結(jié)論性判斷,就會(huì)犯下區(qū)群謬誤。
有趣的是,雖然區(qū)群謬誤是一個(gè)著名的統(tǒng)計(jì)學(xué)謬誤,但最早卻是由美國(guó)社會(huì)學(xué)家威廉·羅賓遜提出的。羅賓遜是一位極有個(gè)性的學(xué)者,他對(duì)當(dāng)時(shí)社會(huì)學(xué)研究中充斥著區(qū)群謬誤感到十分失望,最后竟然因此而退出了學(xué)術(shù)界。關(guān)于這段歷史掌故,要從1950年羅賓遜發(fā)表于《美國(guó)社會(huì)學(xué)評(píng)論》的一篇論文說起。
在這篇論文中,羅賓遜基于美國(guó)1930年人口普查數(shù)據(jù),分析了48個(gè)州的識(shí)字率與新移民人口比例的關(guān)系。他發(fā)現(xiàn),在州層面,識(shí)字率與新移民所占總?cè)丝诒壤南嚓P(guān)系數(shù)為0.53——表明一個(gè)州的新移民比例愈高,則一般來說這個(gè)州的識(shí)字率愈高。按照人們通常的思維方式,這意味著:與本地人相比,新移民普遍具有更高的識(shí)字率。然而,羅賓遜對(duì)此推論表示懷疑,于是決定基于居民個(gè)體資料展開進(jìn)一步的研究。
羅賓遜最后揭示出的真相是,新移民的識(shí)字率要比本地居民低;之所以在州層面出現(xiàn)識(shí)字率與新移民人口比例的正相關(guān)關(guān)系,是因?yàn)樾乱泼駜A向于在識(shí)字率較高的州定居。羅賓遜指出,假若人們基于識(shí)字率與新移民人口比例在州層面的正相關(guān)性,推導(dǎo)出新移民具有更高識(shí)字率的結(jié)論,就陷入了所謂的區(qū)群謬誤。
不幸的是,由于當(dāng)時(shí)社會(huì)學(xué)研究者所掌握的數(shù)據(jù)常常是區(qū)域或者城市層面上的宏觀匯總數(shù)據(jù),區(qū)群謬誤在學(xué)術(shù)研究成果中廣泛存在。例如,有研究發(fā)現(xiàn),移民所占一個(gè)美國(guó)城市人口的比例越高,該城市的犯罪率就越高,而研究者據(jù)此推論道:移民要比本地居民更容易犯罪。但事實(shí)上,在移民多的城市,移民往往是受害者而非犯罪者,因?yàn)楹芏喾缸锇讣潜镜匕兹酸槍?duì)移民的“仇恨犯罪”。
對(duì)于社會(huì)學(xué)研究成果的科學(xué)性,羅賓遜感到疑慮重重,遂在文章發(fā)表后就毫不猶豫地放棄了學(xué)術(shù)研究。羅賓遜提出區(qū)群謬誤,不僅引發(fā)了社會(huì)學(xué)研究的危機(jī),而且對(duì)整個(gè)社會(huì)科學(xué)研究造成了不小的沖擊。這是因?yàn)椋谏鐣?huì)科學(xué)研究中,社會(huì)學(xué)研究的數(shù)據(jù)處理方式是具有代表性的。
不過,“有危才有機(jī)”,區(qū)群謬誤也成為了主要由美國(guó)密西根大學(xué)社會(huì)學(xué)系發(fā)起的“統(tǒng)計(jì)調(diào)查革命”的導(dǎo)火線。隨著統(tǒng)計(jì)調(diào)查革命的興起,學(xué)者們逐漸放棄使用一般由官方統(tǒng)計(jì)機(jī)構(gòu)提供的宏觀匯總數(shù)據(jù),越來越重視通過統(tǒng)計(jì)調(diào)查收集微觀個(gè)體數(shù)據(jù),來展開對(duì)微觀行為的學(xué)術(shù)研究。
行文至此,我們?cè)偻ㄟ^一個(gè)簡(jiǎn)單的例子來加深對(duì)區(qū)群謬誤的理解。
2016年的一項(xiàng)研究表明,在人口大國(guó)中,美國(guó)是肥胖率最高的國(guó)家,每年因肥胖問題而額外承擔(dān)的醫(yī)療負(fù)擔(dān)超過1500億美元。鑒于美國(guó)同時(shí)也是一個(gè)高收入國(guó)家,那么我們是否可由此推斷,肥胖主要是“富人的疾病”呢?
其實(shí),居民層面上的微觀數(shù)據(jù)顯示,在高收入國(guó)家,肥胖更多是“窮人的疾病”。例如,在過去四分之一個(gè)世紀(jì),美國(guó)窮人的身體質(zhì)量指數(shù)(BMI,正常值在20至25之間,高于25為超重、高于30為肥胖)始終顯著高于富人,窮人孩子的肥胖癥率要比富家子弟高出70%。
如果富國(guó)高肥胖率不表明肥胖是“富人的疾病”,那么與此道理完全相同,富國(guó)低生育率也并不表明富人更不愿養(yǎng)孩子。要回答富人是否真的更不愿養(yǎng)孩子這個(gè)問題,需收集家庭微觀數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
(作者姚耀軍為浙江工商大學(xué)金融學(xué)院教授)





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司