- +1
“理解選擇”之六:分類思維,簡單的決策可能勝過復(fù)雜的選項(xiàng)
說到選擇或者決策,我們大都把注意力放在“選”這個(gè)動作以及選擇過后所產(chǎn)生的結(jié)果上,很容易忽略掉構(gòu)成選擇的關(guān)鍵要素——選項(xiàng)。有的時(shí)候,選項(xiàng)顯而易見,就像菜單上的小吃和甜點(diǎn),但大部分生活中的選項(xiàng)都隱藏在伊西斯的面紗之下,而這些選項(xiàng)是自然給我們設(shè)下的陷阱還是憑人類自身的理智所構(gòu)建出來的路徑的區(qū)別,也是困擾了哲學(xué)家多年的決定論與自由意志之爭。

姑且放下形而上的爭執(zhí),如今越來越多的人認(rèn)識到好的問題比答案更重要,也可以由此擴(kuò)展到,好的選項(xiàng)比選擇本身更關(guān)鍵。那么什么又是洞見選項(xiàng)的基本能力呢?說起來并不復(fù)雜,它就跟我們?nèi)粘5纳罹o緊的關(guān)聯(lián)在一起,那就是——分類。
想要將某個(gè)人歸入某一類別(朋友或敵人:值得信任或不值得信任)是人類與生俱來的天性,對事情的歸類也是如此,這種渴求為智力發(fā)展提供了基礎(chǔ)。如果我們不去構(gòu)成類別,我們就只能注意到個(gè)例,而觸及不到任何總體性思考。

可以設(shè)想,如果一個(gè)常人缺乏分類的能力,他就會迷失在浩如煙海的日常事務(wù)中——他無法識別朋友和敵人,甚至都不會構(gòu)建“朋友”這樣的詞語,他身邊只能是一個(gè)個(gè)獨(dú)特的個(gè)體;他也無法識別蘋果,他只能認(rèn)識到一個(gè)個(gè)長得略有不同的能吃的東西。以此類推,在在他的頭腦里,是無法想象“人類”、“世界”、“宇宙”這樣的存在的,因?yàn)橹挥蟹诸悾拍茏屛覀兘栌蓚€(gè)體達(dá)到總體。
從形式上看,選項(xiàng)就是在某一些規(guī)則之下的分類。所以在做選擇之前,學(xué)會更好的分類,可能比在選項(xiàng)之間比來比去更加重要。在《分類思維:不確定情境中合理決策的科學(xué)與藝術(shù)》這本書中,作者就將最佳選擇的探索延伸到分類上,探究在不確定的世界里構(gòu)建一種好的分類方式以獲得優(yōu)秀決策的方法。

“分類是指根據(jù)線索使用分類規(guī)則將個(gè)體分配到各個(gè)類別”。不過分類并不是看起來這么簡單,當(dāng)我們深入去體會這個(gè)概念,即可找到分類的兩種層次動作:一種是構(gòu)建分類規(guī)則,另一種是根據(jù)分類規(guī)則將具體的事物分配到各個(gè)類別當(dāng)中。很明顯,構(gòu)建分類規(guī)則相對來說更基礎(chǔ),也更重要。
如果我們能夠找到最佳分類方法,那么就可以避免掉大多數(shù)因?yàn)檫x項(xiàng)錯誤所導(dǎo)致的決策失誤。比如,如果我們希望車輛可以在紅綠燈前面自動決策的話。那就要根據(jù)紅綠燈的規(guī)則來構(gòu)建一系列的決策分類,這個(gè)相對來說比較簡單,考慮到直行、左轉(zhuǎn)和右轉(zhuǎn)在三個(gè)燈下的狀態(tài),無非也就是九種分類而已。但問題在于現(xiàn)實(shí)世界中任何一個(gè)路口,都不會僅僅只有紅綠燈,還有著眾多的交通參與者,這樣規(guī)則就變得復(fù)雜起來,即便不考慮所有情況,規(guī)則也會乘法級的增長。

所以近些年自動駕駛的研發(fā)逐漸放棄了規(guī)則算法,轉(zhuǎn)而尋找適應(yīng)性更強(qiáng)的方式。本質(zhì)上就是在現(xiàn)實(shí)情境中,未來可能以不可預(yù)知的方式不同于過去,最佳分類規(guī)則是不可知的。在一個(gè)穩(wěn)定、可控的世界中,根據(jù)過往的經(jīng)驗(yàn)進(jìn)行微調(diào)的規(guī)則很可能會成功。微調(diào)往往會導(dǎo)致統(tǒng)計(jì)數(shù)據(jù)和機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)庫提供復(fù)雜的分類規(guī)則。相反,在動態(tài)、不穩(wěn)定的現(xiàn)實(shí)環(huán)境中,變化可能會突然發(fā)生,對過往經(jīng)驗(yàn)進(jìn)行微調(diào)可能會導(dǎo)致巨大的預(yù)測錯誤。在這里,規(guī)則的復(fù)雜性可能需要在一定程度上減少而不是增加:現(xiàn)實(shí)情境中,簡單規(guī)則表現(xiàn)良好。
在分類思維這本書中,就提出了一個(gè)鮮明的觀點(diǎn):簡單規(guī)則反而在現(xiàn)實(shí)情境中表現(xiàn)良好。在國際象棋、圍棋或人臉識別等穩(wěn)定的情況下,如果有大量數(shù)據(jù)可用,復(fù)雜算法的表現(xiàn)優(yōu)于快速節(jié)儉啟發(fā)式。相比之下,在現(xiàn)實(shí)情境中,未來是不確定的,而且未來可能以一種不可預(yù)測的方式不同于過去,無論可用數(shù)據(jù)規(guī)模是大是小,簡單的啟發(fā)式都可以勝過復(fù)雜的方法,并稱此為“不穩(wěn)定世界原則”。

“啟發(fā)式”這個(gè)詞源自于古希臘,意思是“積極主動地發(fā)現(xiàn)或探索”。18世紀(jì)被引入到英語中,是指代解決那些難以用邏輯和概率論加以處理的問題、有用甚至不可缺少的認(rèn)知過程。分類思維這本書關(guān)注兩類啟發(fā)式,這兩類啟發(fā)式開發(fā)了人類智力的兩個(gè)核心能力:計(jì)數(shù)和排序。計(jì)數(shù)啟發(fā)式只計(jì)算將個(gè)體分配至某一類別的原因。快速節(jié)儉樹對原因進(jìn)行排序,并使得使用者基于其中一個(gè)或幾個(gè)原因就能做出快速決策。
這聽起來可能有些學(xué)術(shù),可以通過例子來分別理解計(jì)數(shù)法和快速節(jié)儉樹。

看一個(gè)快速節(jié)儉樹的例子。在美國快速的HIV篩查一般分為三步,先做一次酶免疫測試,陰性則停止,并確認(rèn)無HIV,陽性則繼續(xù)再做一次酶免疫測試,陰性則確認(rèn)無HIV,陽性則再進(jìn)行一次蛋白質(zhì)測試,陰性則確認(rèn)無HIV,陽性則確認(rèn)HIV感染。

其實(shí)這并不是一種“最佳”的規(guī)則,如果“最佳”的定義是最大化的檢測出HIV感染者以及最小化誤診。因?yàn)榈谝淮蚊该庖邷y試,一定有一些沒有被檢測出來的HIV感染者,最后被宣布無HIV。但是,因?yàn)檫@個(gè)概率比較低,如果為了找出那些遺漏的HIV感染者,將會耗費(fèi)大量的人力物力。所以最終采用了一種更為“節(jié)儉”的決策樹。
如果用符號K表示線索(檢測次數(shù))的數(shù)量,這里K等于3。如果一條線索只有兩個(gè)值,如“正/負(fù)”(即陰性陽性),則這條線索稱為二元線索。快速節(jié)儉樹中,可以進(jìn)行分類的空間稱為“出口”,一個(gè)快速節(jié)儉樹正好有K+1個(gè)出口,跟完整決策樹的檢索出口數(shù)量即2的K次方相比,當(dāng)K大于2的時(shí)候,節(jié)儉樹就有優(yōu)勢,K越大,優(yōu)勢越大。所以使用快速節(jié)儉樹來替代完整決策樹?可以大大減少檢測上的時(shí)間,減少醫(yī)療系統(tǒng)所承受的負(fù)擔(dān),同時(shí)可以用相對較少的漏報(bào)為代價(jià)保護(hù)大量個(gè)體不被誤診。

在此補(bǔ)充一些醫(yī)療檢測當(dāng)中的關(guān)鍵定義。首先大前提是,任何一種針對性的檢測,都不是百分之百準(zhǔn)確的,這意味著有一部分真實(shí)的病人未被檢測出來,同時(shí)還有一部分健康的人被誤診。所以針對真實(shí)陽性和真實(shí)陰性情況,對應(yīng)檢查出來陽性和陰性,就會有四種情況:
真實(shí)陽性被檢測出陽性稱為命中,也叫做真陽性;真實(shí)陽性被檢查出來陰性則成為漏報(bào),也叫做偽陰性。命中與命中和漏報(bào)的總和的比稱為命中率或靈敏度。真實(shí)陰性被檢查出陰性稱為正確拒絕,也叫做真陰性;真事陰性被檢查出陽性稱為誤報(bào),也叫做偽陽性。誤報(bào)與誤報(bào)和正確拒絕之和的比例被稱為誤報(bào)率。

當(dāng)我們再聽到,比如一個(gè)乳腺癌檢測命中率為75%時(shí),先不要著急下結(jié)論說這個(gè)檢測很管用,看看它的誤報(bào)率,比如平均誤報(bào)率為46%,意味著大約每隔一個(gè)人就會出現(xiàn)沒有患乳腺癌的女性被該測試診斷為患有乳腺癌的情況。這種高命中率的代價(jià)是將更多的為患病的人誤報(bào)作為基礎(chǔ)的。相比之下,正常的乳房X光檢測篩查的命中率約為80%,但誤報(bào)率在10%以下。

這是一個(gè)小小的題外話,分類思維這本書,核心就要告訴我們的是,真實(shí)世界中存在著線索的不確定性,線索權(quán)重的不確定性以及最佳分類規(guī)則的不確定性。因此,如果去構(gòu)建一個(gè)“最佳”分類規(guī)則去盡可能準(zhǔn)確地描述過往的分類,就可能會引起錯誤的判斷,于此相反,我們認(rèn)為,簡單啟發(fā)式(例如計(jì)數(shù)和快速節(jié)儉樹)可以在現(xiàn)實(shí)情境中表現(xiàn)良好,因?yàn)樗鼈円蕾囉诜€(wěn)定的原則來減少錯誤。
快速節(jié)儉分類最典型的特征是簡單。簡單是由兩種方式實(shí)現(xiàn)的:首先,分類使用的線索相對較少;其次,各條線索以簡單的方式組合。因此,分類可以快速進(jìn)行,要理解和解釋分類背后的邏輯推理也很簡單,考察了兩種最簡潔的方法,第一種方法稱為“計(jì)數(shù)”,在同一時(shí)間使用各條線索,賦予他們相等的權(quán)重。第二種方法稱為“快速節(jié)儉樹”,按順序使用各條線索,一次使用一個(gè),對線索施加優(yōu)先級順序。

雖然這本書中陸續(xù)介紹了很多計(jì)數(shù)法和快速節(jié)儉樹的構(gòu)建方法,但很多都需要過硬的數(shù)學(xué)功底和相應(yīng)的計(jì)算工具的輔助,對程序開發(fā)可能有比較大的幫助,但對于普通人來說,只需要記住,它反對了一種普遍的觀念,即復(fù)雜的分類方法總是更好,更多的數(shù)據(jù)總是導(dǎo)致更高的準(zhǔn)確性,盡管在確定的和完全控制的情況下(未來和過去相似),這種觀念是正確的,但是在不確定的和缺乏控制的情況下,這種觀念就不見得成立了。在這樣的情況下,簡單的規(guī)則可以根據(jù)較少的信息進(jìn)行更準(zhǔn)確的預(yù)測,并且,簡單的規(guī)則更加透明、更易懂,以便啟動操作。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司