- +1
中國羽毛球隊曾如何用“田忌賽馬”的智慧打敗印尼?
田忌賽馬的博弈對局存在一個(混合策略)均衡,就是雙方都會以相同的概率選擇每種賽馬出場順序。如果雙方都采納這個均衡策略,每六場比賽,齊王大概能贏五場,而田忌大概只能贏一場。

田忌賽馬是一個家喻戶曉的故事。齊國大將田忌和齊王賽馬,每方派出上等馬、中等馬和劣等馬各一匹,同等級的馬各賽一局,采用三局兩勝的規則判定雙方勝負。田忌的三匹馬各自都略遜于齊王同等級的馬,因此田忌在比賽中通常以零比三的結局告負。田忌的門客孫臏出了一條計策,用田忌的劣等馬對陣齊王的上等馬,田忌的上等馬對陣齊王的中等馬,田忌的中等馬對陣齊王的劣等馬,最終田忌以兩勝一負的結果贏了齊王。
不難看出,孫臏建議采用的賽馬順序其實是唯一能讓田忌取勝的策略,使用其他任何一種排序都無法戰勝齊王。可以這么說,史書上記載的田忌賽馬的故事,田忌之所以能贏齊王,是因為他率先意識到更多的排序對陣選擇并采用了對付齊王的最優應對策略。
最近幾年網上有不少文章質疑田忌的這種以劣等馬替換上等馬的做法破壞了游戲規則,違反契約精神,甚至上升到中國人的“劣根性”而加以抨擊。問題是,一個合理的游戲規則應該建立在可以明確驗證的信息之上。例如,女子輕量級跆拳道比賽只允許體重59-63公斤的女性參加,這里的性別和體重是很容易驗證的信息。但賽馬的品級不是可以輕易驗證的信息,通常只有馬的主人才了解,以這一難以驗證的信息作為比賽規則本身就未必很合理。就算在原定為劣等馬的比賽中出現了一匹明顯跑得更快的馬,對手也難以舉證說明這匹馬不是劣等馬。我們認為,孫臏的智慧在于洞察到了比賽規則中可以靈活掌握之處,利用它制定出最優的應對策略,進而在處于全面劣勢的情況下贏得了比賽。
田忌賽馬這個故事所展現出的智慧兩千多年來不斷啟示著后人,被廣為應用。例如,在某些體育比賽中,一個有經驗的教練通過巧妙的排兵布陣,適當地選擇隊員的上場順序,有可能讓自己的隊伍戰勝一個總體實力更強的對手。1986年男子羽毛球湯姆斯杯中國對印尼的決賽就是一個例子。面對實力更強的印尼隊,中國隊教練侯加昌排出了出乎對手意料的出場順序。前兩場單打比賽中與對方1:1打平。第三場的單打,中國隊派出了防守型選手熊國寶對陣印尼名將林水鏡,意在消耗對手的體力,使其在最后一輪的雙打比賽中處于下風。熊國寶不負眾望,不僅在體力上拖垮了對手,還爆冷贏得比賽。剩下的兩場雙打比賽印尼選手的總體實力其實都略占優勢。這時,中國隊再施妙計,在第四場雙打中通過主動讓球的方式快速輸掉了比賽,使得林水鏡只有短暫的休息就不得不參加最后一場雙打比賽。中國隊最終以3:2的結果贏得了整場比賽的勝利,可以說是活學活用田忌賽馬智慧的一個經典案例。就是遠在英倫的英超保級弱隊似乎也深諳田忌賽馬的精髓。在圣誕魔鬼賽程,每個球隊每周要踢2-3場比賽。保級弱隊經常采用的策略是對陣強隊時盡量派替補隊員出陣,讓主力球員得到充分休息,就是考慮到即使派主力球員上場贏面也很小。而在對陣其他球隊時,則派已得到充分休息的主力球員上場,讓球隊贏球的幾率大增。
我們回到田忌賽馬的歷史場景。齊王不鈍,意外地輸掉比賽后,想必會意識到原因所在,因而也會考慮所有的排陣可能。為簡潔起見,上等馬、中等馬和劣等馬分別記為上、中、劣。這樣所有可能的賽馬出場順序就是:上中劣、上劣中、中上劣、中劣上、劣上中、劣中上(一共六個)。如果是這樣的話,下一場比賽,田忌還能再次出奇制勝嗎?更進一步,如果田忌和齊王他們一直比下去(按史書的說法,他們的確是經常賽馬),我們能否評估一下他們各自總體上的勝率呢?
首先,我們可以推定雙方都不太可能堅持用一個固定的排序(博弈論上的術語就是“單純策略”)。原因很簡單,就是一旦讓對方注意到了,對方總能想到最佳的應對順序而取勝。比如說,如果齊王堅持用“中上劣”,田忌可以用“上劣中”應對而取勝;反之,如果田忌堅持用“上劣中”,則齊王可以用除了“中上劣”之外的任何其它出場順序取勝。簡單的驗證可以揭示,田忌賽馬的博弈對局不存在任何一對互為最優反應的單純策略:給定任何一對排序,輸的一方總能找到新的排序反敗為勝。
存在一對互為最優反應的策略在博弈論分析中至關重要。只有當已經互為最優反應時,對局中的各方才不會有動機單方面去改變或調整策略。正因為這個原因,互為最優反應的策略也為我們提供了對博弈結果比較可靠的預測依據。在博弈論分析中,一對互為最優反應的策略被稱為納什均衡(Nash Equilibrium,對,納什就是電影《美麗心靈》的主人公,1994年經濟學諾貝爾獎三位得主之一)。
回到田忌賽馬,上面的分析排除了單純策略(納什)均衡的存在。那有沒有其它的均衡呢?答案只能從混合策略中找。混合策略,簡單地說,就是按一定的概率來選擇一些單純策略。可以證明,田忌賽馬的博弈對局存在一個(混合策略)均衡,就是雙方都會以相同的概率選擇每個單純策略(每個單純策略或排序被選中的概率為1/6)。如果雙方都采納這個均衡策略,可以驗證,每一場賽馬,齊王和田忌應各有5/6和1/6的取勝概率;換一句話講,每六場比賽,齊王大概能贏五場,而田忌大概只能贏一場。

仔細想想,這個結論其實很直觀。大家小時候應該都玩過石頭剪刀布的游戲。在這個游戲里,均衡就是以相同的概率(1/3)出石頭、剪刀和布。你我雙方都這么玩,各自的勝率就都是1/2。兩個教訓:第一,堅持用一種單純策略(石頭、剪刀或布)不會是好主意;第二,隨機選擇石頭、剪刀和布的概率一定得大致相同。偏離太多,比如說,你用高于1/2的頻率出石頭,我注意到后就可以通過大大提高出布的頻率來提高勝機。其實只要想通了石頭剪刀布的游戲怎么玩,也就差不多能想通田忌賽馬的奧秘了。主要的區別是,在石頭剪刀布的游戲你我是完全對稱的,在均衡中誰也占不了誰的便宜;而在田忌賽馬的對局,博弈雙方“實力”明顯不對稱,所以在均衡(當齊王跟田忌具有同等的“理性(Rationality)”時),田忌的勝率應遠比齊王低。這也是為什么田忌贏了是意外,為人津津樂道二千年。
最后一個問題是關于均衡的唯一性。除了上面描述的均衡,田忌賽馬的博弈還有別的均衡嗎?有點煩瑣但可以驗證,上面描述的混合策略均衡是田忌賽馬對局里唯一的均衡。因為均衡的唯一性,對博弈各方采用策略的預測也是確定的,那就是,博弈各方都會以同等概率隨機選擇每一種賽馬排序。
假設田忌賽馬存在多個均衡,我們又該如何預測賽馬的結果?這個問題其實是博弈論分析的一個軟肋。如果存在多個均衡,究竟哪一個均衡,能在所有的均衡中“脫穎而出”,成為博弈各方的選擇呢?由于不確定性,多個均衡的存在往往會使得博弈分析的預測能力大打折扣。
下面這個笑話說的就是多均衡的“麻煩”。有兩個好朋友經常逃課,馬上要考試了才意識到什么都還沒準備好,急中生智想出一招,臨考前給教授發出一封電子郵件,說是路上輪胎爆了,沒法趕到學校考試。教授也不多問,改日補考,兩人被安頓到不同的教室。打開卷子,第一道題,5分,出奇的簡單,很快就答完了。翻過第二頁,第二道題,95分,差點沒暈過去,問的是“爆了的是哪只輪胎?”
教授設置的這個考“局”其實有四個均衡,分別對應著四個輪胎。只要兩個學生答的是同一個輪胎(協調到同一個“均衡”),95分應該就到手了,教授應該也不會去為難他們。問題是兩個難兄難弟被隔離在不同的教室,無法溝通,只能靠蒙。分別瞎蒙,都蒙對同一個輪胎的概率能有幾何?扯遠了,還是田忌賽馬省事,只有一個均衡。
本文發表于微信訂閱號“經濟學漫談”(微信號:TalkEcon),原標題為《從田忌賽馬談起》,澎湃新聞經授權轉載。作者葉立新為斯坦福大學經濟學博士,現任俄亥俄州立大學經濟系教授,作者毛亮為北京大學經濟學博士,現任深圳大學經濟學院講師。






- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司