- +1
“雞娃”能否決定孩子的未來?諾貝爾經濟學獎得主的思考
“雙減”之后,你是應該“躺平”還是換個方式繼續“雞娃”?這是以“海淀媽媽”為代表的“雞娃家長”們近期熱議的話題。
新科諾貝爾經濟學獎得主、美國經濟學家約書亞·安格里斯特(Joshua D.Angrist)與他已故的合作者阿蘭·克魯格(Alan B. Krueger)的研究,也許能幫助我們更好地理解這一問題。
安格里斯特和克魯格最著名的研究之一,就是在上世紀90年代運用“斷點回歸法”證明了教育年限長的人更有可能獲得高收入??磥?,似乎連諾獎得主都論證了“雞娃”有理。不過,他們在本世紀的研究又發現,與在普通公立中學學習相比,進入精英中學沒有使學生取得更優秀的高考成績。而克魯格的另一項研究結果則表明,畢業于常春藤盟校的學生與畢業于普通州立大學的學生相比,其收入水平并無顯著差異。所以更全面的結論應該是:多接受教育是有益的,但是接受精英教育的好處并不明顯。
其實,在他們之前,關于教育經歷與個人成就的研究早已汗牛充棟。而安格里斯特之所以能夠獲得諾獎,并非因為他的研究結論多么新穎,而是他運用的方法排除了很多復雜的內生性因素的影響(如個人稟賦、家庭收入等),從而證實(或證偽)了因果關系的存在。(內生性因素的影響可以簡單舉例說明:一個有錢人家的孩子更有可能受到好的教育,畢業后也容易借助父母的人脈找到高收入的工作,因此我們很難得知教育對收入的影響程度。)
古希臘哲學家德謨克利特曾說道:“找到一個事情的原因,勝過當上波斯人的國王”。因果關系為何如此重要,因為發現因果關系是如此之難。發現因果關系又為何困難呢?因為我們的生活中有太多的“障眼法”。
一、樣本的偏差
關于是否要“雞娃”的問題,其實美國人也早就關注過。上世紀40年代,《時代》雜志曾刊登這樣一則報道:對耶魯大學1924屆畢業生的調查發現,他們的平均年收入高達2.5萬美元。按照當時美元的購買力,大概相當于現在的200多萬元人民幣??雌饋恚灰敕皆O法把自己的孩子送進名校,孩子的未來就可以高枕無憂了。
其實,這個結論里的“障眼法”很多,例如每個人填報收入的時候是不是都會說實話?那些想要避稅或者不想露富的人可能少報收入,而那些虛榮心強的人則可能多報收入。再如,那些畢業于耶魯大學的政治家、企業家和知名學者顯然更容易被研究者找到,而那些流浪漢和破產的商人則不然。
再看另一個例子,1898年“美西戰爭”期間,美國海軍的死亡率是千分之九,而同期紐約市民的死亡率是千分之十六。海軍征兵部門用這個數據來說明參軍是安全的。這一不合常理的結論,也是樣本的偏差導致的:能夠參軍的,都是年輕人且都要經過體檢,大多都是身強體壯的;而紐約市民中,則包含很多老弱病殘。因此,兩個數據根本不具有可比性。
二、概念的游戲
香港中文大學李連江教授,把從樣本推斷總體的過程稱為“驚險的一躍”,就像洄游的三文魚,一不小心就會跳進棕熊的嘴里。例如,我們常常用平均情況來反映總體情況,但是“平均”的概念卻有很大的迷惑性。美國統計學家達萊爾·哈夫(Darrell Huff)在他的經典著作《統計數據會說謊》里就說,“平均數是一個經常被使用的詭計,有時出于無心,但更多的時候是明知故犯”。

《統計數據會說謊》,達萊爾·哈夫 著,靳琰、武鈺璟 譯,中信出版集團2018版
回到上面那個例子,假設我們找到了耶魯大學1924屆的全部畢業生,他們也都愿意填報自己的真實收入,我們得出的平均收入是可靠的嗎?顯然,就像網友們經常調侃的,把我跟中國首富平均一下,我也是億萬富翁了。平均數計算起來更為方便,而中位數更能反映總體情況。
除了“平均”的概念之外,生活中“玩概念”的例子還有很多。例如,從一些企業發布的數據來看,網約車司機、外賣員的薪水比很多公司白領更高。其實,白領的工作時間是按工作日計算的,所以網友把在公司洗手間方便戲稱為“帶薪如廁”;而網約車司機和外賣員等待接單的時間卻并沒有被計算在內,他們如廁的時間更不可能有薪水。
再如,美國醫保機構曾以患者出院后30天內計劃外再次住院的指標(即“二次入院率”)來作為衡量醫院治療水平的指標之一,于是有些醫院就將再次入院的病人劃為“門診”或者“急診”而非“住院”,從而偷換了概念。
又如,假設有一家公司聲稱,他們家的商品利潤率只有1%??雌饋?,這是一家一心為消費者著想的良心公司。可是,把錢投給這家公司還不如存在銀行里利息高,這家公司的投資人都是傻子嗎?其實不然。假設我每天早上都花100元買一個商品,下午101元賣出去,利潤率確實只有1%,可是我一年的投資回報率卻高達365%。這里玩的就是“利潤率”和“投資回報率”的概念。
三、誤導性的宣傳
“歷史是任人打扮的小姑娘”,數據也是如此。利用統計數據所做的宣傳,就像修圖時的“眼睛放大”和“瘦臉瘦身”模式一樣,常常刻意突出一些東西、隱藏一些東西。
例如,我們知道,老年人在醫療方面的支出一般比年輕人要高,有過病史的人購買商業保險往往比沒有病史的人貴。如果有一家保險公司告訴你,不分年齡大小、不限健康狀況、不需要體檢報告,任何人只要花一兩百塊錢就可以買他家的醫療險,最高能賠幾百萬。是不是我們撿到了大便宜?其實,仔細閱讀保險條款我們也許會發現,這款保險的起付線設定得非常高,也就是說大多數人都得不到賠付。
關于交通安全的宣傳更有意思。假設有人說,去年死于空難的人數是1980年的100倍。難道現在的飛機比以前的更不安全?顯然不是,而是因為現在坐飛機的人數比1980年要多得多。再如,假設統計數據顯示去年死于火車事故的人有數千人之多,難道坐火車并沒有我們想象的那么安全?其實有可能這幾千人里面大部分是穿越鐵道被撞死的,或者扒火車摔死的。假設有統計數據告訴你,無人駕駛汽車發生的車禍數量只有普通汽車的千分之一。我們能否得出結論:無人駕駛更安全呢?不能。因為無人駕駛汽車的數量原本就比普通汽車要少得多。
四、錯誤的歸因
發現因果關系很難,發現錯誤的因果關系卻很容易。錯誤的因果歸因,常常有以下幾種情況:
一是倒果為因。假設有研究表明,抽煙的學生通常學習成績更差,我們能否得出結論:抽煙影響學習?其實未必。也有可能是成績差的學生由于心情郁悶而學會了抽煙。假設有研究表明,女博士“大齡未婚”的比例既高于男博士,也高于女碩士,我們能否得出結論:讀博士不利于女性找對象?其實未必。也許是因為知識水平更高的女性更能接受晚婚或者獨身。達萊爾·哈夫書中提到的一個更有趣的例子是:一個太平洋島國的居民發現健康人身上大多有虱子,于是他們相信虱子有利于健康,其實是因為虱子更喜歡健康人,這也是顛倒因果關系帶來的謬誤。
二是混淆相關關系與因果關系。同樣是面對“抽煙的學生學習成績更差”這樣的統計數據,我們既可能犯倒果為因的錯誤,也可能把共變關系誤認為因果關系(共變關系就是看起來有聯系的兩件事都是第三件事的結果,例如喜歡“混社會”的學生可能成績更差同時也更容易抽煙)。達萊爾·哈夫的書中還舉了一個例子:有人發現美國馬薩諸塞州長老會牧師的工資與古巴哈瓦那的朗姆酒價格密切相關。難道牧師們漲工資之后大量采購了朗姆酒?或者教會因為倒賣朗姆酒獲利所以提高了牧師的工資?其實二者之間并沒有因果關系,而是當時全球物價上漲帶來的結果而已。
三是擴大因果解釋的范圍。前面提到,安格里斯特和克魯格證明了教育年限長的人更有可能獲得高收入。然而真理往前多走一步有可能就是謬誤。他們的研究對象僅限于義務教育階段。也就是說,碩士的收入未必高于本科生,博士的收入也未必高于碩士。
四是把無關誤認為有關。2020年1月,《柳葉刀》雜志上發表了兩篇關于新冠肺炎的流行病學報告,從統計數據看似乎男性更容易感染新冠病毒。而進一步的研究發現,上述結論只是因為樣本數量較小而且性別數據比其他數據更容易獲得,是否易感其實與性別無關。再如,如果我們發現,愛喝牛奶的歐美人比不愛喝牛奶的非洲人患癌癥的比例高得多,我們能否得出結論說喝牛奶易患癌?未必,可能只是因為非洲人均壽命很短,大多數人還沒來得及得癌癥就死于其他疾病,是否喝牛奶(也許)與是否患癌無關。同樣的,耶魯大學的畢業生更有錢,也可能是因為他們本來就有錢,而與他們受到的教育無關。
在《統計數據會說謊》一書中,達萊爾·哈夫引用了英國前首相本杰明·迪斯雷利(Benjamin Disraeli)的話:“世界上有三種謊言:謊言、彌天大謊和統計數據”。其實,除了那些造假或有誤的數據之外,大多數數據能夠幫助我們彌補經驗直覺的不足,從而更好地了解這個世界。但是,對于拓展人類的知識與智慧而言,我們不僅需要數據,更需要對數據的科學的因果解釋,以及獨立思考、拒絕盲從的精神。正如啟蒙運動的格言“勇于求知”(Dare to Know),要找到真相,只有靠我們自己。我想,這是安格里斯特等人的研究給我們最重要的啟示。
(作者王翔為復旦大學數字與移動治理實驗室研究員、主任助理,主要研究方向:數字時代的公共治理、公共部門人力資源管理。)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司