- +1
AI大數據搶人飯碗?是什么讓人類產生了AI無所不能的錯覺

你相信以某地天氣數據可以預測美國總統大選嗎?
你相信半個地球外的虔誠祈禱可以治療癌癥嗎?
你相信智能手環的大小可以評定償債能力嗎?
你一定認為這些問題的邏輯關系太荒謬了,但對于人工智能來說,所有的大數據只是數據,如果你拷問數據的時間足夠長,選取的數據量足夠大,沒有任何邏輯關系的數據也會告訴你期待的答案。這也正是經濟學教授加里·史密斯希望通過《錯覺:AI如何通過數據挖掘誤導我們》一書傳達的核心思想——大數據并非是理性決策的靈丹妙藥,人工智能尚無法超越人類智慧。目前的“人工智能”距離可與人類相媲美的通用智能還相去甚遠,“只有理解所要表達的意思才能稱其為智能”,這才是人類智能和計算機智能的本質差別。

讓我們回到2012年12月,當時大數據研究權威之作《大數據時代》出版,該書作者維克托稱其最具洞見之處在于:明確指出大數據分析不再拷問“為什么”的因果關系,而是快速嘗試各種可能模型,尋找“是什么”的相關關系。這種通過大數據挖掘“相關關系”而作出快速決策的方式顛覆了千百年來人類思維的固有模式。
現在的很多互聯網購物公司普遍利用大數據挖掘技術,已經可以根據用戶消費習慣和瀏覽網頁留下的數據痕跡預測用戶下單的可能性,并且提前發貨至前置倉,以便在用戶訂購當日即可收貨,為用戶提供了極致的購物體驗。然而,這種數據挖掘真的能稱得上是智慧嗎?同樣是2012 年的美國,一名男性顧客怒氣沖沖地來到全美第二大零售超市Target 投訴,理由是Target 給他還在讀高中的女兒郵寄嬰兒和孕婦用品的優惠券。由于故事極其具戲劇性——親生爸爸居然比不上一臺電腦更了解自己的女兒,相信不少人都聽過這個刊登在《紐約時報》上的荒謬新聞。是的,這就是大數據分析的結果,但最終數據只是告訴Target該顧客可能懷孕了,卻并沒能判斷出這僅僅是一名高中女生。很明顯,大數據分析只是分析設定好的數據,而忽略現實中其他需要考量的事情,籍此提醒人們:這是“大”數據的傲慢,而非聰慧。

也許你可能會想這是多年前的事了,當時的數據分析可能還沒那么精準,現在應該就不會這么荒唐了吧。那你可知道全球最大的搜索引擎公司——谷歌曾經發布的 “谷歌流感趨勢” 預警系統么?其利用網絡檢索關鍵詞的大數據分析預測流感,多年的預測結果與美國疾病預防控制中心的監測報告相比對后,其結果被《自然》雜志判定為失敗的。深究其原因,只能說大數據太具欺騙性了。且不說數據本身的質量如何,哪怕輸入的數據是精心整理過的有效數據,但問題的根源在于,復雜精美的數據模型根本不知道搜索關鍵詞和流感之間有何關聯,而谷歌工程師也并沒有去挖掘數據關聯背后的因果關系,僅僅是在一堆紛繁復雜的數據中找出了具有統計特征的相關性:很多關鍵詞只是看似與流感相關,但實際上卻并無關聯。谷歌這次失敗的預測正是典型的因“數據為先,理論靠后”所導致的“得州神槍手謬誤”。關于這個謬誤,諾貝爾獎得主羅納德·科斯的評論最為一針見血——“只要拷問數據的時間足夠長,它就會屈打成招。”

為了將“得州神槍手謬誤”這一理論所展現的荒唐邏輯夸大到極致,本書作者史密斯教授做了一些“惡作劇”。他發了幾張股價圖給一名股票技術分析師,請他幫忙判斷哪些股票是好的投資。經過一系列高級又復雜的技術分析,這名分析師欣喜地發現利用這些股票模型賺大錢的機遇。而極具諷刺意味的是,這幾張股價圖只是史密斯教授讓學生以拋硬幣的形式捏造的一堆虛假數據偽裝而來的。善于惡作劇的史密斯教授還曾在課堂上給學生列出了三個完全符合1980-2016 年10 次美國總統大選結果的統計模型,其中第一個是以候選人的背景信息作為解釋變量,比如候選人是否擔任過美國副總統、是否擔任過美國參議員,這都讓這個模型看似十分合理,甚至讓學生相信史密斯教授找到了預測大選結果的神器。而第二個模型則是教授挑選的自己喜歡的城市天氣數據,第三個就加荒唐了,純粹是計算機生成的隨機數據。而最終看似有理有據的第一組模型,與后兩組莫名其妙的模型一樣,僅能符合這10次的美國大選結果,對之前和之后的大選結果都無能為力。
正如便利店領頭者7-11所推崇的“假設-執行-驗證”的單品管理方式,恰恰是邏輯判斷指導數據分析的最佳例證。7-11的店員無論是在訂貨還是貨架陳列之前,都要被要求先根據往期銷售數據以及近期的天氣、活動信息等實際情況對顧客心理進行預判,再以此為依據上貨,然后再根據當天銷售業績來驗證假設,調整假設,如此循環往復。同時7-11 也非常重視相關關系的應用,比如當面包、三明治等即食食品銷量上升時,咖啡、牛奶等配套飲品的訂購量也會隨之增加。足以見得已經營50 余年的7-11 的成功的確離不開數據分析的支持,但其長盛不衰的零售秘訣還是在于洞察人心的人類智慧。

書中使用如此多的事實、案例和實驗,列舉了許多反面例證,但史密斯教授并不是為了將大數據分析批判得一無是處,他積極肯定了計算機算力的提升和算法的優化對數據分析的極大助益。史密斯教授傾盡多年研究想要說明的是:大數據分析、人工智能被越來越多地應用于重大決策,極大地提升了社會效率,這是好事,但不應被奉為圭臬,不能凌駕于人類的邏輯思維之上,更不應該對人類智慧做出的獨立價值判斷失去信心。
歸根結底,筆者認為這仍是邏輯推理中關于歸納法和演繹法的辯證分析。顯然人工智能可以快速從大數據中尋找出某種相關關系,這是歸納法得出的“知識發現”。而人類智慧無可替代的可貴之處正是在于對相關關系的辯證思考。天氣是否真的能預測總統大選?這是一個具有思想的“人”才能提出的假設。用數據去驗證假設是否成立,則是在演繹法指導下方可得出的信度更高的結論。
本書的最后,史密斯教授也再次強調對計算機能夠出色完成指定任務的肯定,并承認自己也很癡迷數學模型的迷人之處和計算機的高性能,但仍然希望能夠通過這本書來驚醒世人切勿盲目沉迷于具有迷惑性的數據模型中。盡管在這看似是大數據時代下,對一大部分科學家奉為圭臬的數據分析的批判可能顯得吃力不討好,然而我們也必須承認數據的智能至少在這個時代還無法離開人類辯證思維下的價值判斷。

本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司