- +1
綠色果凍豆會導致粉刺?濫用p值引發的統計偏差

文1499字 閱讀時間約4分鐘

有科學家利用p值證明了在果凍豆中,食用綠色的果凍豆會導致粉刺的產生。你相信這個證明么?今天,小編為讀者們帶來關于試圖證明”綠色果凍豆會導致粉刺”的論述,希望得到對p值更加全面的認識。
彩色的果凍豆,英文名叫Jelly Bean,它在美國是一種非常流行的多味彩色糖果。但是近些年,有人用p值證明了食用綠色果凍豆會導致粉刺,你會相信嗎?如果此人接著告訴你,20個顏色的果凍豆中,只有綠色的會導致粉刺,你還會相信嗎?

統計學中有個著名的漫畫,講的就是這樣一個故事:有人提出,果凍豆會導致粉刺,而統計學家用p值檢驗反駁了果凍豆和長粉刺的相關性;接著,她又提出只有某種顏色的果凍豆會導致粉刺,于是統計學家測試了20個顏色的果凍豆,發現只有綠色的果凍豆和長粉刺p值小于公認的閾值0.05,于是得出結論:綠色果凍豆(以下簡稱糖豆)會導致粉刺!
注釋:閾的意思是界限,閾值又叫臨界值,是一個效應能夠產生的最低值或最高值。

這個滑稽的故事旨在諷刺一些科學家濫用p值來“證明”一些事物之間本不存在的聯系。那么,這個神奇的“萬靈藥”——p值,到底是什么呢?
我們先來了解一些相關的概念。統計學里的“假設”是指一個可客觀驗證的說法,比如“吃糖豆會導致粉刺發生”,而“零假設”則和該假設相反,比如“吃糖豆不會導致粉刺發生”。如果零假設(H0)成立的可能性(概率)足夠小,我們就可以說,這個實驗支撐原假設(H1)。

有了這些定義之后,我們就能很容易理解p值。我們已知原假設H1和它對應的零假設H0,以及一些觀測數據D(比如100個人吃糖豆前后,得粉刺的人的數量)。H1假設的p值就是如果零假設 H0成立,那么我們能觀測到D的概率,寫成P(D|H0),讀作“給定H0,D發生的概率”。比如,假定“吃糖豆不會導致粉刺”這個零假設 H0 成立,那么觀察到數據D的概率,就是原假設的p值。
這樣得到的p值有什么用呢?我們可以想象一下,如果有且只有兩個平行的宇宙A和B,宇宙A滿足H1,另一個宇宙B滿足H0,而如果B宇宙觀察到數據D的概率很小,但我們又確實觀察到了D,我們就可以說,我們所在的這個宇宙是A。也就是說,p值越小,H0成立的概率就越小,所以H1成立的概率也就越大。

在進行實驗之前,我們需要定一個閾值,如果計算出的p小于這個值,也就是說H0成立的概率足夠小,我們就可以拒絕這個零假設,從而為原假設提供依據。
那么這個p該如何計算呢?我們需要根據D來算出幾個相關值:吃糖豆前實驗者總體的粉刺平均數μ,以及吃糖豆后樣本中實驗者的粉刺平均數 x? 和標準差SD。假設我們采的樣本遵從正態分布,那么很容易計算出p<0.05。
值得注意的是,如果p值大于等于閾值,我們并不能據此推斷零假設成立,我們能得出的結論只是零假設也可能成立而已。同時,就算p值小于閾值,我們也不能確定地說原假設成立。

回到之前的那個故事,隨著越來越多的研究—醫藥學、儀器學等等,都廣泛使用p值作為驗證假設的工具,確實出現了很多濫用p值的案例,最常見的就是剛才提到的,由p值小于0.05就推出原假設成立,還有就是像故事里這樣硬要從無關觀察出有關,而忽略統計學中的固有偏差。
就在今年,一群科學家聯名在多本科學雜志中呼吁大家謹慎使用p值,不要墨守成規地把0.05作為“黃金值”,更不要用p值推斷零假設成立。本文旨在展示p值的正確使用方法,同時提醒大家,不要理所當然地接受所有的“科學發現”,而應該至少略讀一下,它的研究背景是什么,得到的數據到底能不能支撐最終的結論。

(本文原載于“羅博深數學”公眾號:LuoboshenMath)
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司