- +1
諾獎科學家最新成果:通用模型預測任何地區新冠疫情走勢
原創 小文、Kai 世界頂尖科學家論壇 來自專輯全球抗疫

每個人都想知道,這場百年一遇的新冠疫情,將何時結束;科學家們為此徹夜攻關、“捻斷數莖須”。
年屆73歲的世界頂尖科學家協會副主席、2013年諾貝爾化學獎得主、計算機大師邁克爾·萊維特,帶領團隊歷時5個月的數據搜集和研究、經過90天的攻堅,甚至萊維特本人親自編程計算,終于發布了最新的科研成果,“野心勃勃”用一條最佳擬合線“通吃”所有地區的新冠疫情預測。
一個數學模型,真的可以做到預測每個地方新冠疫情何時結束,以及確診人數和死亡人數嗎?
萊維特團隊開放了所有的研究數據,乃至計算機運算代碼。他們說,歡迎全球對他們的成果進行檢驗,發起挑戰!
以色列當地時間6月30日,世界頂尖科學家協會(WLA)副主席、2013年諾貝爾化學獎得主、美國斯坦福大學結構生物學系教授邁克爾·萊維特向世界頂尖科學家論壇(WLF)發來由其領銜的科研團隊,在科學預印本平臺medRxiv上最新發表的論文——《通過最佳擬合直線預測某地區新冠肺炎(COVID-19)疫情發展軌跡》(Predicting the Trajectory of Any COVID19 Epidemic From the Best Straight Line)。

研究團隊以美國約翰·霍普金斯大學、中國JOBTUBE和印度Rajkumar的統計數據為數據采集源,經過5個月對全球3546個不同國家地區的疫情數據追蹤,和長達90天的科研攻堅,發現在許多地點,雖然疫情開始時間不同、具體情況不同,但是對已知數據利用統計學模型進行計算分析后發現線性趨勢相似,疫情從高峰回落“曲線變平”的速度相似。
研究團隊因此提出假設“是否有可能通過對累計新冠確診病例或死亡數的數據整合,從而歸納出它的走勢規律,在一些新冠疫情爆發早期的地區預測出疫情什么時候會結束爆發?”
帶著這樣的假設,研究團隊進行了一波運算操作,發現可以借助統計學領域的Gompertz曲線函數(編者備注:Gompertz曲線以英國統計學家和數學家B.Gompertz命名。描述現象特點是:初期增長緩慢,以后逐漸加快,當達到一定程度后,增長率又逐漸下降,最后接近一條水平線。該曲線被廣泛應用于現象的趨勢變動研究。)來驗證這個假設,用Y(t) o ?ln(ln(N / X(t)) 公式來將確診人數、死亡人數等數據集全部擬合成一條直線,并因此得出一種新的計算方法,研究團隊這稱之為最佳擬合線(Best-Line Fitting ,簡稱BLF)。通過計算機編程對大量數據進行運算后,研究團隊很幸運地發現這一假設是成立的。




“百年一遇”的新冠疫情,截至本周初在全球已造成了超過1000萬確診病例和50萬人死亡;在這種全球性的大流行性疾病中,如果能夠提前預測可能會造成的病例數和死亡率,那么對于決策者在制定政策以控制病原體和優化醫療資源分配時都會有非常重要的意義。
來自世界各國的眾多科研小組都在嘗試設計出可靠的疫情預測工具,他們的方法通常都是基于一系列數學和統計模型、綜合不同類型的數據,如疾病數據、人口的流動細節和信息以及干預措施的影響(社會疏遠、口罩使用以及衛生狀況)等。
但這些變量可能因國家而異,即使在同一國家的不同地區,在檢測新冠病例的確診和死亡時候的標準都有可能不一樣。所有這些因素都使得開發出一個適合全世界通用、可以預測新冠疫情軌跡的方法變得復雜。

萊維特是計算生物學家,2013年因“發展復雜化學體系多尺度模型”獲得當年諾貝爾化學獎,擅長通過各種數據運算方法來尋找普遍規律。研究團隊的成果則更像一種“純粹”的“數字游戲”,從統計數據中去大膽假設,并驗證線性回歸規律。對萊維特這樣的計算機生物學家來說,全球新冠疫情爆發提供了大量的數據供分析,也充分提供了施展的空間和舞臺。數據越多越準確,研究結果的可靠性越高。
自12月底中國爆發新冠疫情以來,萊維特連續追蹤中國的新冠疫情發展,并對新冠疫情發展進行大膽預測(詳見文末往期報道),在國內外引發巨大反響。
這位已經73歲的精力旺盛的科學家畢生癡迷數據,此次更用“打雞血”般的熱忱投入到對新冠數據的挖掘分析中。2月2日至3月5日期間,萊維特一共迭代了30份中國地區疫情分析報告,在國內外引發巨大反響和爭議。他本人也在國外社交媒體Twitter上持續發聲,并接受了包括中國中央電視臺、CGTN以及美國??怂剐侣劸W等在內的多國媒體的專訪,來闡述他的研究方法和理論。

根據最新的研究披露,雖然他的研究合作伙伴Dr. Scaiewicz用科學家更常用的Python語言來計算大量的數據,萊維特仍然用他從1980年就開始用的一種“老派”的名為Mortran的Fortran系計算機編程高級語言來編寫程序,并用f2c轉換工具轉換成C語言進行運算,把運算效率提升了100倍。研究團隊也開放了代碼,“這非常易于一個熟練的程序員操作,也歡迎大家來驗證我們的公式和模型來反對我們?!痹谘芯繄蟾嬷?,研究團隊寫道。
萊維特的研究和他大膽的預測,引起了很多爭議和批評,主要來自于實驗派科學家和流行病學家等,實驗派科學家信奉“實驗出真知”,而流行病學家則更多考慮在流行病學領域存在的各種變量,但萊維特并不懼怕這樣的批評,在前日參加林道諾貝爾得主大會線上科學日活動的圓桌討論環節時,萊維特就頗為激烈的抨擊一些批評者:“他們只是叫我‘停止發聲’,卻從不研究我的數據。”
萊維特對WLA表示,研究團隊選擇第一時間將研究成果在預印平臺上發布,是“我們以前從未做過的事情”;這樣做有兩個原因:一是在目前新冠疫情仍在全球蔓延,團隊將發現提供給所有人,希望對后期的防控有所幫助;另一個原因則是征求對于科研來說至關重要的廣泛批評。
目前,研究團隊研究仍在持續,包括更好地理解最佳擬合直線的相關參數,并且希望能夠理解不同地點的人口規模、人口年齡/健康程度、地理位置面積、社會距離或封鎖措施等是否會影響疫情的預測等等。
萊維特本人在最后結語中寫道,“科學是一種極端保守主義的奇怪混合體,為的就是防止錯誤和激進的范式變化。但我們認為,我們在不到120天的時間內,已經開發了一些重要的分析工具”。研究團隊也希望通過更多的全球討論、交叉檢查和合作,可以達成三個月前提出的這一發現,并能以此及時防止世界范圍內的許多錯誤。
關于以上研究所有的表格和數據都可以通過以下APP查詢:
1、不同國家最近更新的數據和圖片分類顯示 :http://levitt1.herokuapp.com/2、最佳直線預測表圖表:http://levitt.herokuapp.com/
(備注:研究以英文原文為準,如文中有因翻譯理解不到位產生的錯誤,歡迎大家后臺留言指出。特別感謝小羽、Dora對本文的貢獻)
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司