天才隕落 詳解納什均衡為何如此牛

>>>  民初教育及人才培養  >>> 簡體     傳統


撰文|燕子飛時

來源|關天茶舍


2001年環球公司出品的電影《美麗心靈》,取材于同名傳記,藝術地再現了數學天才、1994年諾貝爾經濟學獎得主之一、罹患妄想型精神分裂癥三十多年又奇跡般恢復的小約翰·福布斯·納什傳奇的人生故事。這部分別獲得2002年金球和奧斯卡四項大獎的影片,連同銀幕背后的人物原型,深深震撼了全世界人們的心靈。為納什帶來諾貝爾獎之殊榮的、他對博弈論發展的巨大貢獻,以及他的坎坷生平,也再次引起人們極大的反響和關注。

  

什么是博弈論?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 著數中理性化、邏輯化的部分,并將其系統化為一門科學。換句話說,就是研究個體如何在錯綜復雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生于古老的游戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最“理性” 的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法…

  

面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼于20世紀20年代開始創立,1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經濟行為》,標志著現代系統博弈理論的初步形成。對于非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,凈獲利為零。在這里抽象化后的博弈問題是,已知參與者集合(兩方) ,策略集合(所有棋著) ,和盈利集合(贏子輸子) ,能否且如何找到一個理論上的“解” 或“平衡” ,也就是對參與雙方來說都最“合理” 、最優的具體策略?怎樣才是“合理” ?應用傳統決定論中的“最小最大” 準則,即博弈的每一方都假設對方的所有功略的根本目的是使自己最大程度地失利,并據此最優化自己的對策,諾伊曼從數學上證明,通過一定的線性運算,對於每一個二人零和博弈,都能夠找到一個“最小最大解” 。通過一定的線性運算,競爭雙方以概率分布的形式隨機使用某套最優策略中的各個步驟,就可以最終達到彼此盈利最大且相當。當然,其隱含的意義在於,這套最優策略并不依賴于對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。

  

雖然二人零和博弈的解決具有重大的意義,但作為一個理論來說,它應用于實踐的范圍是極其有限的。不提耽于游戲的玩家,可以說除了軍事競爭,幾乎難再有用武之地。二人零和博弈主要的局限性有二,一是在各種社會活動中,常常有多方參與而不是只有兩方;二是參與各方相互作用的結果并不一定有人得利就有人失利,整個群體可能具有大於零或小于零的凈獲利。對於后者,讓我們來看一個歷史上最經典的有趣個例: “囚徒困境” 。話說警方抓到兩個盜竊犯,惜證據尚不足,遂寄希望于嫌犯自己招供。警方把兩個犯人隔離起來,分別審問,交代政策如下:坦白從寬,抗拒從嚴!如果你招了,另一個人沒招,那么就將你釋放,另一人判20年;同樣如果你不招,另一個人招了,那么你得被判20年,另一個人被釋放。如果兩個人都招,警方證據就足了,兩人都判10年。至於兩個人都不招的情況,不用警方交代,兩個人都得判,但因證據不力,判得都要輕許多,比如1年。警方最后說,那邊還有個警察,對你的同伙交代一模一樣的政策呢。罪犯心里打起小九九,如果對方招了,我招是10年,不招是20年,是招劃算;如果對方不招,我招是無罪釋放,不招是1年,還是招劃算。於是乎,招!兩個“精明” 的小偷都招了,都被判了10年,正中警方下懷。聰明的讀者,其實如果兩個小偷都不招,就會被各判1年,對他們來說豈不更好?在這個囚徒困境問題中,參與者仍是兩名(兩個盜竊犯) ,但這不再是一個零和的博弈,人受損并不等於我收益。兩個小偷可能一共被判20年,或一共只被判2年。

  

對於多人參與、非零和的博弈問題,在納什之前,無人知道如何求解,或者說怎樣找到類似于最小最大解那樣的“平衡” 。而找不到解,下面的研究當然無法進行,更談不上指導實踐了。納什對博弈論的巨大貢獻,正在於他天才性地提出了“納什均衡” 的基本概念,為更加普遍廣泛的博弈問題找到了解。納什均衡的基本思想是,在這個解集中所有參與者的策略都是對其他參與者所用策略的最佳對策,沒有人能夠通過單單改變自己的策略提高收益。以前面的囚徒困境為例,如果小偷甲相信小偷乙招供,那么他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那么他的最佳策略仍是招供。這就是一個納什均衡,它是“自確定” 的。在囚徒困境中,只存在一個納什均衡。但若將條件改變一下,在許多其它的具體問題中,納什均衡可能不止一個。納什巧妙地運用數學技巧,證明了如下納什定理:對於任何一個n人參與,非合作博弈(零和或非零和) ,如果每個參與者都只有有限條策略,那么一定存在至少一個納什均衡解集。象許多科學上最杰出的思想一樣,這一概念以極簡潔明了的方式解決了懸而未解的難題。看似簡單,似乎屬於那種“本來我也能想到” 的東西,然而那時除了納什,一代宗師諾伊曼也沒有想到。納什均衡的提出,對博弈論的發展產生了革命性的影響,納什均衡的概念已成為現代博弈論的基石和中心(雖然在少數博弈理論家中此點仍有爭議) 。納什的好友,普林斯頓大學經濟學教授迪克西特曾說,“如果每次有人說起或寫下納什均衡這幾個字,納什都能拿到一塊錢的話,那么他現在會是個大富翁了!”

  

上面提到的博弈理論試圖解決的都是非合作型問題,也就是參與者之間除了決策結果相互影響,沒有其它形式的信息交流。通過囚徒困境一例可以看出,如果參與者兩個小偷之間能夠彼此商議,他們做出的策略決定會截然不同(當然是兩人一起抵賴劃算) 。誠然,在各種生活行為中,人與人之間除了競爭關系,還存在合作關系,常常是兩種關系并存,合理的合作能夠給雙方帶來共同利益。這是合作型博弈論研究的范疇。諾伊曼在《博弈論與經濟行為》一書中建立了合作型博弈論的基本模型,但是對於其中及其重要的雙向協商問題(即參與者如何“討價還價”) ,沒有能給出一個確定的解。納什對這一領域同樣做出了卓越貢獻,他不僅提出了討價還價問題的公理化解法,直接裨益勞動經濟和國際貿易,還在理論上利用這個解法良好的預測性進一步提出納什方案:將合作型博弈中的協商轉化為一個更廣泛的非合作型博弈的一個步驟--協商的目的最終仍是最大化自己的利益。此外,在測試博弈論的行為實驗學上,納什也是一名先驅。他曾展開討價還價和聯盟形成的實驗,并曾敏銳地指出,在其他實驗者的囚徒困境實驗里,反復讓一對參與者重復實驗實際上將單步策略問題轉化成了一個大的多步策略問題。而后一思想初次提示了后來發展起來的在經濟和政治領域起重要作用的重復博弈理論中緘默共謀的可能性。

  

這些也許看起來略顯枯燥的理論,以邏輯推理為工具對人們日常生活中的競爭和合作行為進行嚴謹有序的數學歸納,當數學家們孜孜不倦地將直覺上升為科學,再反作用于生活時,其影響之深遠難以盡述。今天,納什為之做出基礎性貢獻的現代博弈理論經過許多專家的不斷發展,不僅自身理論體系日臻成熟和完善,而且被廣泛應用于經濟學、政治學、軍事學甚至生物學等各個領域。在生物學領域,博弈論被用于研究種族遺傳學和進化生物學中種間和種內的競爭,以及單個基因之間的競爭,并反過來推動博弈論的思想發展。在政治、軍事學領域,博弈論被用于分析選舉策略、戰爭起因、立法議程安排等等重大事宜。在經濟學領域,博弈論更是已經融入整個學科的主流,經濟學教材和雜志無不收入博弈論的內容,經濟學家們已經把研究策略相互作用的博弈論當作最合適的分析工具分析各類經濟問題,諸如公共經濟、國際貿易、自然資源經濟、工業管理等等,等等。就博弈論應用于經濟學的直接效益,舉個實例,如《美麗心靈》一書中提到,1994年美國政府向商家拍賣大部份電磁波譜。這一多回合拍賣由一批博弈論專家本著最大化政府收益和各商家的利用率原則精心設計,取得極大的成功。政府獲得超過一百億美元的收入,各頻率的波譜也都找到了滿意的歸宿。與此相對映的是,新西蘭一個類似卻沒有經過博弈理論設計的拍賣會慘遭失敗。政府只獲得預計收入的15%,而被拍賣的頻率也未能物盡其用。譬如因為無人競爭,一個大學生只花1美元就買到了一個電視臺許可證!正因為博弈論對現代經濟學具有如此重大的沖擊和影響,1994年瑞典皇家學院宣布該年全世界科學家的最高榮譽諾貝爾獎之經濟學獎頒發給包括納什在內的三位數學家,以表彰他們對非合作型博弈論的開拓性分析。

  

世界終于因為博弈論而承認了納什的天才,這一年,他已是66歲的老人。與其在科學上令人眩目的杰出貢獻相比,他用幾十年漫長的歲月書寫的充滿才華和激情、充滿磨難和苦痛、交織理性和瘋狂的傳奇人生,竟也毫不遜色,教人無限感慨和敬仰。納什出生于1928年一個電子工程師家庭,少年時代一方面性格孤僻,一方面顯示出非凡的數學才能。17歲進入今卡耐基梅隆大學時原專業是化學工程,但是在慧眼識珠的老師的建議下,轉行專攻數學。在此期間他選修了一門國際經濟學課程,從而引發了對經濟學命題的興趣,后來發表的關于合作型博弈討價還價問題的論文就是源于這時的一些想法。20歲時納什在卡耐基拿到數學學士和碩士學位,接受了普林斯頓大學優裕的獎學金,成為這里的一名研究生。他對許多數學學科都表現出興趣,如拓撲學、代數學、幾何學、博弈論和邏輯學等。著手準備博士論文時,他決心獨創一個屬於自己的嶄新課題。最終過去曾思考的討價還價問題引導他建立非合作型博弈論的基本原理。1949年,21歲的納什寫下一篇著名的論文《多人博弈的均衡點》,提出了納什均衡的概念和解法、整個現代非合作型博弈論中最重要的思想之一,也奠定了44年后他獲得諾貝爾獎的基礎。1950年納什曾帶著他的想法去會見當時名滿天下的諾伊曼,遭到斷然否定,但是在普林斯頓大學寬松的科學環境下,他的論文仍然得到發表并引起了轟動。同年他以論文《非合作型博弈》獲得數學博士學位。

  

以純數學家自居的納什,畢業后在蘭德研究所和普林斯頓大學工作期間,證明了一個反直覺的等距嵌入定理,并引入全新的方法證明困難得多的高維等距嵌入定理,強有力地推動了對偏微分方程存在性、唯一性和連續性定理的證明。對於純數學家來說,數學是精神的藝術體操,評判一項研究的優劣,標準在於其數學深度及是否引入了數學新思想、新方法,或是解決了長期懸而未解的難題。從這一角度,納什的這一成果,以及數年后于麻省理工學院工作時的更加艱深的數學研究,比他的納什均衡還要讓數學同行們信服。確實,1958年納什因其在數學領域的優異工作被美國《財富》雜志評為新一代天才數學家中最杰出的人物。然而,天有不測風云,人有旦夕禍福,就在納什春風得意、事業就要達到頂峰時,卻突然遭受命運無情的重重一撞,從云端墜下地獄。納什在他的而立之年患上了精神分裂癥。

  

他不是一個完美的人,早在1952年,納什懈逅了一位大他5歲的姑娘,與之交往,次年有了個私生子,此后仍一直與她保持若即若離的關系。1956年他的父母發現了兒子的風流韻事,不久后他的父親就去世了,不知是否與此打擊有關,也不知納什是否曾為此自責。1957年他與麻省理工學院年輕美麗的女學生愛莉西婭結婚,此后四十多年患難與共的愛情和親情可以見證,這或許是他的個人生活中最完美、最幸運的一刻。1958年愛莉西婭身懷有孕,尚未分娩,納什的精神狀況就開始惡化。他的舉止越來越古怪,一步步走向心智狂亂。

  

納什所患的是妄想型精神分裂癥,所有精神疾病中最可怕的一種。病人被時斷時續不切實際的瘋狂念頭充斥頭腦,并且會產生幻視、幻聽,同自己假想出來的人交談。納什會著對空氣說,某份報紙里藏有來自另一個星球的只有他能破解的信息;會突然辭去在麻省的職位,只身跑到歐洲,要放棄美國國籍,還是愛莉西婭跟去把他拖回來;在家中,他不斷地威脅著妻子愛莉西婭。萬般無奈之下,愛莉西婭于1962年和納什離婚。但是她對他的忠誠愛情并沒有就此消失。70年納什的母親去世,而他的姐姐無法負担他,就在納什孤苦無依、就要流落街頭的時候,善良的愛莉西婭接他來與自己同住。她不僅在起居上關心他,而且以女性特有的細心敏感照料著他的心情。她體貼他不肯去醫院封閉治療的愿望,并把家搬到遠離喧囂的普林斯頓,希望寧靜熟悉的學術氛圍有助于穩定納什的情緒。

  

這是一場奇特的博弈。納什,這個研究理性策略的數學天才,猝然間失去了賴以自傲的理性思維,身不由己地在清醒和瘋狂之間來回掙扎徘徊,是永遠墜向深淵還是走回家園?在那個無人能解的世界里,他始終沒有放棄的對數學的熱愛。我們無法知道納什所承受的所有痛苦,但是足可以揣摩意愿和能力之間的巨大沖突是怎樣漫長的精神災難。幸運的是,在這場博弈里,還有一個忠貞不渝的參與者,當他喃喃自語說著誰也聽不懂的話時,當他象幽靈似的逡巡于綠色校園時,總是一雙溫存的眼睛和手臂勇敢地陪伴著他。世上最堅強的兩樣東西,意志和愛情,結合在一起,創造出一個最優策略,那就是 - 奇跡。是的,世界目睹了這場博弈的喜劇性結局,在納什罹患精神分裂癥三十余年后的九十年代,他的精神逐漸恢復了正常。1994年納什博士在為諾貝爾獎撰寫的自傳中沒有提及精神疾病給他帶來的痛苦,倒是說精神失常使他擺脫了常軌思維的束縛,可以幫助他創造全新的理論。結尾處他寫道,“從統計上說,任何數學家或科學家在66歲時,都似乎已經不可能再有大的建樹。但我仍在努力著,那25年異型思維的‘假期’ 本來就是不正常的。這樣我就還有希望,也許通過目前的研究或將來產生的新思想,我還能夠做出一點有價值的東西。” 讀到此處,不能不為之一嘆,嘆這個博弈論大師非凡的天才,嘆他頑強的意志,和對科學毫無保留的執著之心!或許,這些也是愛莉西婭愛的源泉罷?

  

世事如棋局局新。前一輩人的輝煌和辛酸俱已成為歷史,未來掌握在后來者的手中,取決于他(她) 們的每一個決定。我們的人生,又將會是一場什么樣的博弈呢?



天涯觀察 2015-08-23 08:53:09

[新一篇] 休學創業,一場游戲一場夢?

[舊一篇] 從孩子的表現看父母的缺點,震驚了所有人
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表