從著名的“囚徒困境”開始了解博弈論。
壹位富翁被殺死在自己的別墅中,傑克和亞當是案件的兩位嫌疑人。
拘留所裏面,兩人都否認自己殺過人,警察決定將兩人隔離分開審訊。
警察告訴傑克:“盡管妳們不承認,但是我知道人就是妳們兩個殺的,現在我給妳壹個坦白的機會,如果妳坦白了,亞當拒不承認,那妳就是主動自首,同時協助警方破案,妳將被立即釋放,亞當則要坐10年牢;如果妳們都坦白了,每人坐8年牢;都不坦白的話,以入室盜竊罪判妳們每人1年,如何選擇妳自己想壹想吧。”同樣的話,警察也說給了亞當。
壹般人可能認為傑克和亞當都會選擇不坦白,這樣他們只能以入室盜竊的罪名被判刑,每人只需坐1年牢。這對於兩人來說是最好的壹種結局。可結果會是這樣的嗎?答案是否定的,兩人都選擇了招供,結果各被判了8年。
事情為什麽會這樣呢?當警察把坦白與否的後果告訴傑克的時候,傑克心中就會開始盤算坦白對自己有利,還是不坦白對自己有利。傑克會想,如果選擇坦白,要麽當即釋放,要麽同亞當壹起坐8年牢;要是選擇不坦白,雖然可能只坐1年牢,但也可能坐10年牢。雖然(1,1)對兩人而言是最好的壹種結局,但是由於是被分開審訊,信息不通,所以誰也沒法保證對方是否會選擇坦白。選擇坦白的結局是8年或者0年,選擇不坦白的結局是10年或者1年,在不知道對方選擇的情況下,選擇坦白對自己來說是壹種優勢策略。於是,傑克會選擇坦白。同時,亞當也會這樣想。最終的結局便是兩個人都選擇坦白,每人都要坐8年牢。
“囚徒困境”是博弈論中最出名的壹個模式。為什麽傑克和亞當都選擇了對自己最有利的策略,最後得到的卻是最差的結果呢?這其中便蘊涵著博弈論的道理。
囚徒困境(Prisoner'sDilemma)是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。或者說在壹個群體中,個人做出理性選擇卻往往導致集體的非理性。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。