- +1
富國低生育率表明富人更不愿養孩子?小心“區群謬誤”!
近日,幾位朋友在微信群里聊及生育率這一話題。
A君提到人口經濟學中的一大典型事實:經濟發展水平越高的國家,其生育率越低。
B君立即追問道:“變得更富裕的人們為何更不愿意養孩子呢?”
“這都哪跟哪啊,即便‘經濟發展水平更高的國家具有更低的生育率’是事實,你也不能由此推出‘富人更不愿意養孩子’這個結論呀!”C君素來喜與B君“抬扛”。
“道理何在,愿聞其詳”,B君回懟C君,而C君一時語塞。
作為一個具有統計學背景且“好為人師”的大學教師,我馬上意識到,對統計學進行科普的一次難得機會又被我遇上了。其實,B君由“經濟發展水平更高的國家具有更低的生育率”這一事實推導出“富人更不愿意養孩子”的結論,陷入了一個著名的統計學謬誤。
此統計學謬誤就是所謂的“區群謬誤”。聽起來,這是一個比較抽象的術語,在此我們不妨首先通過一個具體案例來理解其含義。該案例引自美國社會學家勞倫斯·紐曼的著作《社會研究入門》,梗概如下:
有兩個分別名為湯姆和瓊斯的小鎮。兩個鎮的總人口數相差不多,但湯姆小鎮的平均收入水平更高,同時該鎮的摩托車登記數量也更多,共有4000輛。瓊斯小鎮有很多窮人,所以平均收入水平低,同時該鎮的摩托車登記數量也僅有100輛。在查看了關于這兩個小鎮的數據后,我們或許認為,富人更有可能擁有摩托車。
然而,假若我們不掌握摩托車究竟是由兩個小鎮的哪些家庭所擁有這種微觀調查數據,則根本無法由平均收入與摩托車數量這兩個宏觀變量的關系,推導出“富人更有可能擁有摩托車”這一微觀行為。在這里,宏觀變量的分析單位是作為整體的鎮子,而真實的微觀行為也許是:在湯姆小鎮,所有中低收入家庭都加入了摩托車俱樂部,但沒有任何一個高收入家庭加入;在瓊斯小鎮,100輛摩托車全部由低收入家庭擁有。

《社會研究入門:如何理解我們的日常社會生活》,勞倫斯·紐曼 著,劉佳昕 譯,后浪出版公司2021年3月出版。
上述案例表明,如果我們試圖了解摩托車擁有情況與家庭收入之間的關系,就必須收集以家庭而非鎮子為分析單位的數據。至此,何謂區群謬誤就“水落石出”了——這是一種由于錯誤匹配分析單位而產生的統計學謬誤。更具體地說,如果數據有著高層次或聚合的分析單位,而我們卻據此對低層次或分解的分析單位做出結論性判斷,就會犯下區群謬誤。
有趣的是,雖然區群謬誤是一個著名的統計學謬誤,但最早卻是由美國社會學家威廉·羅賓遜提出的。羅賓遜是一位極有個性的學者,他對當時社會學研究中充斥著區群謬誤感到十分失望,最后竟然因此而退出了學術界。關于這段歷史掌故,要從1950年羅賓遜發表于《美國社會學評論》的一篇論文說起。
在這篇論文中,羅賓遜基于美國1930年人口普查數據,分析了48個州的識字率與新移民人口比例的關系。他發現,在州層面,識字率與新移民所占總人口比例的相關系數為0.53——表明一個州的新移民比例愈高,則一般來說這個州的識字率愈高。按照人們通常的思維方式,這意味著:與本地人相比,新移民普遍具有更高的識字率。然而,羅賓遜對此推論表示懷疑,于是決定基于居民個體資料展開進一步的研究。
羅賓遜最后揭示出的真相是,新移民的識字率要比本地居民低;之所以在州層面出現識字率與新移民人口比例的正相關關系,是因為新移民傾向于在識字率較高的州定居。羅賓遜指出,假若人們基于識字率與新移民人口比例在州層面的正相關性,推導出新移民具有更高識字率的結論,就陷入了所謂的區群謬誤。
不幸的是,由于當時社會學研究者所掌握的數據常常是區域或者城市層面上的宏觀匯總數據,區群謬誤在學術研究成果中廣泛存在。例如,有研究發現,移民所占一個美國城市人口的比例越高,該城市的犯罪率就越高,而研究者據此推論道:移民要比本地居民更容易犯罪。但事實上,在移民多的城市,移民往往是受害者而非犯罪者,因為很多犯罪案件是本地白人針對移民的“仇恨犯罪”。
對于社會學研究成果的科學性,羅賓遜感到疑慮重重,遂在文章發表后就毫不猶豫地放棄了學術研究。羅賓遜提出區群謬誤,不僅引發了社會學研究的危機,而且對整個社會科學研究造成了不小的沖擊。這是因為,在社會科學研究中,社會學研究的數據處理方式是具有代表性的。
不過,“有危才有機”,區群謬誤也成為了主要由美國密西根大學社會學系發起的“統計調查革命”的導火線。隨著統計調查革命的興起,學者們逐漸放棄使用一般由官方統計機構提供的宏觀匯總數據,越來越重視通過統計調查收集微觀個體數據,來展開對微觀行為的學術研究。
行文至此,我們再通過一個簡單的例子來加深對區群謬誤的理解。
2016年的一項研究表明,在人口大國中,美國是肥胖率最高的國家,每年因肥胖問題而額外承擔的醫療負擔超過1500億美元。鑒于美國同時也是一個高收入國家,那么我們是否可由此推斷,肥胖主要是“富人的疾病”呢?
其實,居民層面上的微觀數據顯示,在高收入國家,肥胖更多是“窮人的疾病”。例如,在過去四分之一個世紀,美國窮人的身體質量指數(BMI,正常值在20至25之間,高于25為超重、高于30為肥胖)始終顯著高于富人,窮人孩子的肥胖癥率要比富家子弟高出70%。
如果富國高肥胖率不表明肥胖是“富人的疾病”,那么與此道理完全相同,富國低生育率也并不表明富人更不愿養孩子。要回答富人是否真的更不愿養孩子這個問題,需收集家庭微觀數據進行統計分析。
(作者姚耀軍為浙江工商大學金融學院教授)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司