博弈論是指個人或組織,面對壹定的環境條件,在壹定的規則下,依靠所掌握的信息,選擇並實施自己的行為或策略,並從中獲得相應的結果或利益的過程。博弈論是經濟學中壹個非常重要的理論概念。
什麽是博弈論?古語有雲,事如棋。生活中的每個人都像壹個棋手,每壹個動作都像在無形的棋盤上放壹枚硬幣。聰明而謹慎的棋手,相互揣摩,相互牽制,大家都力爭勝,下了許多精彩多變的棋局。博弈論就是研究棋手“下棋”的理性和邏輯部分,並將其系統化為壹門科學。換句話說,就是研究個體如何在復雜的互動中獲得最合理的策略。實際上,博弈論來源於古代的遊戲或棋牌等遊戲。數學家通過建立壹個完備的賦木易來抽象具體問題?↓烹剎帝羌?妳擔心嗎?宰壹畝?妳知道怎麽誇乃雲官婆嗎?脆寫?好喝嗎?香蕉季節?回到米月,韓頭答應照顧妳。棋手下棋時,為了贏得比賽,他不得不仔細考慮B的想法,而B下棋時也不得不考慮A的想法,所以A不得不考慮B的想法,B當然也知道A想到了他的想法…
面對這樣的大霧,博弈論如何開始分析和解決問題,如何找到最優解將抽象的數學問題作為現實的歸納,從而在理論上為指導實踐提供可能?現代博弈論是由匈牙利數學家馮·諾依曼在20世紀20年代創立的,他與經濟學家奧斯卡·摩根斯坦合作於1944年出版的巨著《博弈論與經濟行為》標誌著現代系統博弈論的初步形成。對於非合作、純競爭的博弈,諾依曼只解決兩人零和博弈——就像兩個人下棋或打乒乓球,壹個人贏了壹局,另壹個人輸了另壹局,凈利潤為零。這裏的抽象博弈問題是,在給定參與者集合(雙方)、策略集合(所有棋步)和利潤集合(贏家和輸家)的情況下,是否以及如何找到壹個理論上的“解”或“平衡”,即對於雙方參與者來說最“合理”和最優的具體策略。什麽叫“合理”?應用傳統決定論中的“最小-最大”準則,即博弈的每壹方都假設對方所有的優缺點的根本目的都是使自己最大程度地吃虧,並據此優化自己的對策,諾依曼從數學上證明了通過壹定的線性運算,每壹個二人零和博弈都可以找到壹個“最小-最大解”。通過壹定的線性運算,兩個競爭者以概率分布的形式隨機使用壹組最優策略中的每壹步,從而最終為對方實現最大且相等的利潤。當然,言下之意是,這個最優策略並不依賴於對手在博弈中的操作。通俗地說,這個著名的極大極小定理所體現的基本“理性”思想就是“抱最好的希望,做最壞的準備”。
雖然二人零和博弈的解意義重大,但作為壹種理論,其在實踐中的應用極其有限。更別說沈迷遊戲的玩家了,可以說除了軍事比賽幾乎不可能使用。兩人零和博弈的局限性主要有兩個。第壹,在各種社會活動中,往往有多方參與而不是只有兩方;第二,參與各方互動的結果並不壹定意味著壹部分人會損失,整個集團可能會有大於或小於零的凈利潤。對於後者,我們來看壹個歷史上經典而有趣的案例:“囚徒困境”。據說警察抓到了兩個小偷,但是證據不足,所以希望嫌疑人自首。警察隔離了兩名囚犯,並分別審問他們。政策是:坦白從寬,抗拒從嚴!如果妳坦白,對方不坦白,那麽妳就被釋放,對方判20年;同樣,如果妳不坦白,另壹個人坦白,那麽妳要被判20年,另壹個人被釋放。如果兩人都招供了,警方就有足夠的證據,兩人都會被判10年。至於兩人都沒有坦白的案子,兩人都要在沒有警察的情況下判刑,但是因為證據不足,判刑輕了很多,比如1年。最後警察說那邊還有壹個警察跟妳搭檔解釋了壹模壹樣的政策。罪犯心中有事業。如果對方坦白,我就招10年,不招就是20年,很劃算。如果對方不招,我就無罪釋放。如果我不招,就是1年,還是劃算的。所以,招!兩個“聰明”的小偷供認不諱,兩人都被判了10年,這正是警察想要的。聰明的讀者,其實兩個賊不招供,就各判1年。對他們來說不是更好嗎?在這個囚徒困境中,仍然有兩個參與者(兩個小偷),但這已經不是零和博弈了,人的損失不代表我的收獲。兩個小偷可能被判20年徒刑,或者只判2年徒刑。
在納什之前,沒有人知道如何解決多人非零和博弈問題,或者如何找到壹個類似於最小-最大解的“平衡”。沒有解,後面的研究就無法進行,更不用說指導實踐了。納什對博弈論的巨大貢獻在於,他天才地提出了“納什均衡”的基本概念,找到了對更壹般、更廣泛的博弈問題的理解。納什均衡的基本思想是,這個解集裏所有參與者的策略都是對其他參與者所用策略的最佳回應,沒有人能簡單地通過改變自己的策略來提高收益。以囚徒困境為例。如果賊A相信賊B的坦白,那麽他的最佳策略是坦白,而如果賊B相信賊A的坦白,那麽他的最佳策略仍然是坦白。這是壹個納什均衡,是“自我決定”的。在囚徒困境中,只有壹個納什均衡。但如果改變條件,在很多其他具體問題中可能存在不止壹個納什均衡。納什巧妙地運用數學技巧證明了如下納什定理:對於任何壹個有n個參與人的非合作博弈(零和或非零和),如果每個參與人只有有限個策略,那麽至少有壹個納什均衡解集。像科學中許多最傑出的想法壹樣,這個概念以非常簡潔明了的方式解決了未解決的問題。看似簡單,似乎屬於那種“我本可以想到”的事情,但當時除了納什,壹代宗師諾伊曼都沒有想到。納什均衡的引入對博弈論的發展產生了革命性的影響,納什均衡的概念成為了現代博弈論的基石和中心(盡管這壹點在少數博弈論家中仍有爭議)。納什的好朋友、普林斯頓大學經濟學教授迪克西特曾說:“如果每次有人談論或寫下納什均衡這幾個字,納什都能得到壹塊錢,那麽他現在就是百萬富翁了!”
上面提到的博弈論試圖解決非合作問題,即參與者之間除了決策結果之外,沒有其他形式的信息交換。通過壹個囚徒困境的例子可以看出,如果兩個賊可以互相商量,他們的戰略決策會完全不同(當然,他們壹起否認是劃算的)。誠然,在各種生活行為中,人與人之間除了競爭,還有合作,而且往往是兩種關系並存。合理的合作能給雙方帶來* * *共同利益。這是合作博弈論研究的範疇。諾依曼在《博弈論與經濟行為》中建立了合作博弈論的基本模型,但對於極其重要的雙向談判問題(即參與者如何“討價還價”)卻未能給出確定的解決方案。納什在這個領域也做出了傑出的貢獻。他不僅提出了直接有利於勞動經濟和國際貿易的討價還價問題的公理化解決方案,而且在理論上利用這個解決方案進壹步提出了納什的方案:將合作博弈中的談判轉化為更廣泛的非合作博弈中的壹個步驟——談判的目的最終是實現自身利益的最大化。此外,納什還是檢驗博弈論的行為實驗的先驅。他進行過討價還價和聯盟形成的實驗,並敏銳地指出,在其他實驗者的囚徒困境實驗中,反復要求壹對參與者重復實驗實際上把壹步策略問題變成了壹個大的多步策略問題。後壹種思想首次在重復博弈理論中提出了沈默的可能性,這種理論在經濟和政治領域發揮了重要作用。
這些看似有些枯燥的理論,是以邏輯推理為工具,對人們日常生活中的競爭與合作進行嚴謹有序的數學歸納。當數學家孜孜不倦地將直覺上升為科學,然後反作用於生活,其深遠的影響難以言表。今天,在眾多專家的不斷發展下,納什為之做出基礎性貢獻的現代博弈論,不僅成熟和完善了自己的理論體系,而且被廣泛應用於經濟、政治、軍事科學甚至生物學等各個領域。在生物學領域,博弈論被用於研究物種間和物種內的競爭,以及種族遺傳學和進化生物學中個體基因之間的競爭,並反過來促進博弈論的發展。在政治和軍事科學領域,博弈論被用來分析選舉策略、戰爭原因、立法議程等重要問題。在經濟學領域,博弈論已經融入了整個學科的主流,所有的經濟學教科書和雜誌中都有博弈論的內容。經濟學家已經把研究策略相互作用的博弈論作為分析各種經濟問題最合適的分析工具,如公共經濟、國際貿易、自然資源經濟、產業管理等等。至於將博弈論應用於經濟學的直接好處,比如《美麗心靈》壹書中提到,1994年,美國政府將大部分電磁頻譜拍賣給商家。這場多輪拍賣是由壹群博弈論專家本著政府收入最大化和各項業務利用率最大化的原則精心設計的,取得了巨大成功。政府賺了100多億,每個頻率的頻譜也找到了滿意的歸宿。相比之下,新西蘭壹場並非由博弈論設計的類似拍賣卻慘敗。政府只得到預計收入的15%,被拍賣的頻率沒有得到充分利用。舉個例子,因為沒有競爭,壹個大學生只花了65438美元+0就買了壹個電視臺牌照!正是因為博弈論對現代經濟學產生了如此巨大的沖擊和影響,英國皇家瑞典學院於1994年宣布將全世界科學家的最高榮譽諾貝爾經濟學獎授予納什等三位數學家,以表彰他們對非合作博弈論的開創性分析。
今年的諾貝爾經濟學獎是博弈論在經濟學中的應用。