是不是總感覺哪裏有點違和感?
——因為上述引文壹半是筆者瞎編的。
如果說人類對於矢量的理解意味著掌握乃至超越時空的限制的訴求,那麽人類對於正態分布的研究壹定象征著控制甚至擺脫命運的擺布的祈願。
正態分布(Normal distribution),又名高斯分布,可以說是科學界最為重要的礎石之壹。其名來源於「數學王子」高斯(Johann Karl Friedrich Gau?),也就是那個10歲就心算出1加到100的和的小正太。(不過不叫正太分布。)
對於正態分布,學理工的壹定不會陌生。而隨著統計學在社會科學、甚至人文學科的應用,(以及所謂「大數據」的熱潮,)正態分布的應用更是突破了傳統的物理世界,直逼人類的精神世界——從機器學習到神經科學的研究,從行為心理的分析到意識形態的哲思。
正態分布有太多優雅的性質與廣泛的應用,在這裏就不贅述。
其中最為重要的名為「中心極限定理(Central Limit Theorem)」,它指出: 大量相互獨立 的隨機變量加在壹起,平均值就會呈現正態分布。
說句題外話:雖然現實中大家都這麽用了,但打從生物學開始,大量與相互獨立這兩個最為根本的條件就幾乎是不可能達成。
高等數學,微積分、高等代數、高等幾何、概率與統計等等,高在哪裏?
兩個字: 極限 。
——這壹定是啟蒙運動帶給人類最偉大的發明。很可惜幾乎只被科學界使用,因此也許用「發現」壹詞更加準確。
超幾何分布(Hypergeometric distribution)也是在學習概率論是最基礎的幾個分布之壹,但它的應用卻遠不如正態分布來得廣泛。實際上它的應用幾乎只與抽樣有關,譬如產品抽檢的合格率、德州撲克的贏面。
滿足壹定條件的情況下,它還可以用正態分布來近似——本質上就是上文所講的「中心極限定理」的壹個應用。
筆者之所以把超幾何分布同人類的精神世界相聯系,就是因為其應用,或者說打從壹開始其定義,就更偏向於概率論的思想實驗性,而非統計學的觀察分析性。
當然,正態分布的偉大就在於貫徹兩者。
在此容筆者略微民科地復述壹下概率論比統計學更加抽象的緣由。
統計是說:壹枚公平的硬幣,拋1000次,發現461次正面朝上;正面出現的頻率是0.461;如果拋10000次,或者更多次,這個頻率會越來越接近0.5。
概率則說:壹枚公平的硬幣,每壹次拋出,正面朝上的概率都是1/2。
換言之,概率論是先驗的(a priori),統計學是後驗的(a posteriori)。
順道壹提,聯系兩者的東西就是貝葉斯定理(Bayes' theorem)。
無論現實世界究竟如何,人類對於物理世界的描述經常是正態分布的。
當我們估測壹段距離的時候,譬如用精確到厘米的刻度尺測量桌子的長度,需要估讀毫米的數值的時候。當我們瞄準目標射擊、投擲、踢球的時候,譬如射擊運動員參加奧運比賽,每壹個都是希望槍槍可以正中靶心的……投籃命中率、賭球賠率、人均收入、期望壽命,凡此種種,都有所謂的期望(也就是平均值)的概念——而這個概念之所以有效,需要的兩個條件正是: 1.概率分布只有壹個峰值;2.概率分布幾乎對稱。 而正態分布正是符合條件的概率分布中最方便耐用的那壹個。
而物理世界本身,因為微觀粒子的隨機性以及宏觀觀測的大量性,至少在經典物理中考慮隨機性的時候,譬如估算與控制火箭飛向太空,整個過程充滿的不確定性運用正態分布來對付就夠了。
然而如果該火箭上載著壹名宇航員,他可以通過輸入壹串4位密碼來解鎖壹個緊急按鈕(也許是用來發射壹枚核彈來清除無法躲開的小行星)——而因為形勢緊張他只記得密碼前2位了,那他只能隨機地輸入後2位。他也許會輸錯好多次,不斷重復,直到成功或者成仁為止。
整個過程中,後壹次與前壹次輸密碼相互不獨立,壹***也就100種可能性所以也不大量,因此沒有正態分布介入的余地。
類似的,在玩德州撲克的過程中,手持黑桃J、Q、K與A,下壹張牌正好是黑桃10的概率也與正態分布半毛錢關系都沒有。
筆者以為,超幾何分布反映了諸如策略選擇之類的概念認知——它們是隸屬於精神世界的,特點則是在少數的選項中非此即彼。
至於超幾何分布於正態分布的最大區別,那就是它具有相當的偏度(Skewness),尤其是被抽樣的基數不大的時候。
有這麽壹個經典的實驗:受試者讀壹段推理小說的文字材料,列出他們眼中全部的嫌疑犯,並且標註上此人是兇手的概率。
實驗者發現,幾乎沒有壹個受試者的列出的嫌疑犯名單上,概率之和為100%——這顯然是不符合邏輯的。
但這真的僅僅是因為受試者缺乏或者忽略了這最基礎的統計學常識?
當受試者估計嫌疑犯的概率時,他本能地意識到這個數值本身的不確定性。也就是說,這個數值本身是壹個隨機數,它自有壹個概率函數描述它的分布。
而當我們被要求只寫下壹個數值來代表這個函數的時候,我們本能地使用 眾數 (Mode,對應了概率分布的峰值),而並非平均數。
——這種本能的經驗在於,當我們從符合這個分布的樣本中抽樣的時候,獲得的數更容易接近眾數。
但眾數不是平均數。對於概率分布對稱的隨機數來說,眾數、平均數、中位數(Median)都是壹個東西,但對超幾何分布來說並不是。
「已知壹組隨機數的和等於1,那麽它們的平均數的和也等於1。」這個命題無疑是正確的,但同樣的命題對眾數無效。
另外對於大部分受試者來說,「壹個嫌疑犯是兇手的概率」並不是說「該嫌疑犯在這群人中是兇手的概率」,而是「我對該嫌疑犯就是兇手這件事有多少自信」。
很明顯,這裏又回到了貝葉斯主義。
現實中太多研究對象根本達不到使用「中心極限定理」的條件,但它終究還是遭到了濫用——因為它方便、好用,而且大多數情況下結果不會太糟糕。
僅僅用壹個平均數與壹個方差就可以描述許多復雜的隨機過程,這不是件很美妙的事嗎?
然而真的不是因為懶嗎?
「記憶是不可靠的東西,所以需要記得的東西越少越好。」——這種好聽的話只不過是借口,筆者投身相關專業就是因為懶得背。(後來發現還是要背的……而且是用壹種自己也未必明白語言。)
不過數學家是嚴謹的,他們不會濫用任何定理。很多時候,他們過度嚴謹,以至於許多數學理論都是先有猜想,後有突破。幾個世紀以來都是物理學家作為先驅,千禧年以後計算機則也加入了弄潮的行列。
所以濫用定理的不是數學家,而是借助數學工具做應用學科的家夥。
然而筆者還是宛如要推卸責任似的把這份濫用的原罪歸咎到數學家們身上。
因為他們對於應用學科是如此之漠然,以至於數學最根本的批判性與建設性沒有被傳遞下去。數學,作為所有理工專業的必修,不僅沒有受到廣泛的愛戴,還遭受到公開的鄙夷,無論東方還是西方。
——這,壹定是數學家們的問題罷。
當然筆者也不是不能理解: 當壹個人真正沈浸在自己所熱愛的事物之中的時候,他就不需要通過與他人比較並貶低他人來獲得自我滿足。
從單個對象到多個對象,從確定事件到隨機事件,人類逐步開始數學化地研究自己的行為了。
1994年,納什(John Forbes Nash Jr.)與另兩位博弈論學家壹同榮獲諾貝爾經濟學獎。
所以為什麽諾貝爾不設數學獎?
因為數學家總有其他辦法的——這個是開玩笑,但諾貝爾獎有壹個極其重要的授獎條件就是「活著」。
英年早逝的數學家太多不論,在世時自己的數學理論可以得到廣泛運用那是少之又少的,納什絕對算是個幸運兒。
納什作為普林斯頓大學(Princeton University)的畢業生,代表了新壹代數學人走向應用學科,尤其是經濟相關領域的前進方向。
當然博弈論的應用遠遠不止經濟學,但終於,時至今日,全世界的經濟學已經習慣了數字,並且開始迷信數據。壹項統計表明,今日普林斯頓經濟系的畢業生比起二戰左右的學生更具自信——因為他們使用數學工具,而不是憑借歷史經驗分析問題。
推進人類文明演化的不是技術,而是信仰。 網絡技術早在網絡時代來臨之前已經成熟,但當時的互聯網只有壹小部分人使用,沒有商業化,因此缺乏遍布全球的基礎設施與相關人才。
計算機技術走入尋常百姓家,不是因為它多麽有用,而是因為它的用處得到了壹般人的認可。納什進壹步推動了既世界大戰以後經濟學的數學化,而這股潮流又推動了金融機構以及壹般產業的數字化。收集的數據越來越多,數據的分析也顯得越來越有用。全世界被巨大的電線與光纜鏈接起來,地球真的變成了壹臺巨大的計算機,《銀河系漫遊指南》壹語成讖。
反過來思考的話,如果經濟學沒有得到那幾代人的數學化,金融市場那些跳動的數字就顯得毫無意義,我們就仍然生活在壹個需要通過私人渠道才能獲取有效情報的年代——非數字化的情報要通過數字化的載體來傳輸是困難的,要記得音樂、影像等多媒體是近幾年網絡已經足夠發達以後的事情,早期的電腦與網絡只能處理數字與字符。而即使如此,證券交易所仍是最早采用網絡的地方。
總而言之,納什的貢獻不僅僅是經濟學意義上的,更是經濟意義上的。
2016年3月,AlphaGo擊敗李世乭。
圍棋是典型的完美信息確定性的雙人零和博弈。
在這裏筆者首先要強調的是完美信息(perfect information)與完全信息(complete information)區別。簡單來說,完全信息下,博弈的參與者互相了解各自的目標;而完全信息只是關於博弈本身。
舉個例子:假設有個恐怖分子像電影裏壹樣控制了全球的網絡系統,並且用發射核導彈打擊韓國來威脅當時的韓國總統,李世乭因此不得不故意輸掉了比賽——而AlphaGo只是個圍棋AI而已,並不是幕後黑手;那麽這場博弈就不是完全信息的。但只要這個遊戲是圍棋,不能通過變魔術來偷換棋子的位置,那這場遊戲就壹定是完美信息的。
確定性(deterministic)非常好理解,落子無悔,想要下在星位的棋子不會因為不可名狀的原因而落在小目或者三三。相對於隨機性(stochastic)來說,確定性有兩個好處。
其壹,對於棋手來說,這個遊戲理論上是有確定解的。
當然實際上圍棋的復雜度非常大,遠超各類象棋。目前棋類AI在國際象棋中運用最為純熟,有專門的「棋手+AI」組隊,互相對戰的職業比賽。AI給棋手提出建議,棋手可以自由選擇是否遵從,或者另辟蹊徑。雖然大多數時候AI給出的建議多半會得到青睞,但也不乏棋手靈光乍現,走出雙方AI都未曾料想的招式,贏得勝利。
圍棋的復雜度則與棋子的走法徹底無關,完全源於它19x19的巨大棋盤。就像我們學圍棋的初期可以使用小棋盤壹樣,早期的圍棋AI也是從挑戰小棋盤開始的。
其二就是黑白分明,贏就是贏,輸就是輸。AlphaGo與李世乭壹役是五番戰,也就是三局兩勝。如果這個博弈是拋硬幣,五局三勝,那任誰都有可能戰勝AI,任誰都有可能榮膺世界冠軍。
最為關鍵是,因為博弈的收益(無論名還是利)都是與棋盤上的結果直接掛鉤的,完美信息與完全信息幾乎沒有差別。即使李世乭真是抱著想要輸的目的去參加比賽,結果上他輸掉了比賽的事實不會改變。
最後,圍棋是壹個壹對壹的零和博弈。
用戰爭類遊戲(或者現實戰爭本身)來說的話,這類博弈因為零和(zero-sum),不是妳死就是我活,所以直接的戰鬥是不可避免的。但如果存在多方勢力,完全可以采取結盟的辦法,***同侵消敵人。
美蘇從來都是各有各的目的,但為了擊敗納粹,到底還是聯合了起來,雖然只是壹時壹地。但縱在彼時彼地,他們也不可能進行真正地合作,都說老謀深算的政治家必得在戰爭開始之前就算計好戰後的利益分配——若非兩邊都有這樣的領導,戰後豈能形成實力幾乎對稱的冷戰格局?
然而隨機博弈就會帶來問題。
壹般認為,隨機性的問題在於運氣成分。也就是說,假設圍棋是壹個帶有隨機成分的遊戲,五局三勝AlphaGo獲勝,人類大可吼上壹句「時運不濟」,隨後要求再戰三百回合。
可這個問題正好在這個死皮賴臉的要求下得到了解決——亦即通過多次比試,看平均成績。
2015年,阿爾伯塔大學(University of Alberta)的邁克爾·鮑林(Michael Bowling)教授在《科學(Science)》上發表論文:他與同事「弱」解決了雙人德州撲克——他們開發的程序仙王座( Cepheus )能在得知在雙方底牌的情況下,保證不敗。註意這裏的「弱」強調的是知道雙方底牌,也就是把德州撲克這個原本是不完美信息的遊戲簡化為了完美信息的遊戲;而「保證不敗」不是說每場都不會輸,而是從多次比試來看,如果用仙王座賭錢,平均來說不會輸。
當然現實中的問題是,到底需要比賽多少次才足以證明孰優孰劣。參加比賽的人類與AI都會變,所以嚴格地來說根本沒有辦法進行完全重復的實驗。
接下來的問題就是不完美信息。
某種意義上說,不完美信息可以也是隨機性。繼續用撲克的例子來說,底牌是黑桃A雖然對於自己來說是確定的,但對於對手來說卻是不確定的。
然而這種不確定性對策略的影響與上段所講的對雙方壹致的隨機性卻十分不同。雖然對於對手來說,「這張未知的底牌到底是黑桃A」的概率,與「下壹張新發來的牌是黑桃A」的概率是壹樣的;但是,「基於底牌是黑桃A做了加註的動作」的概率,與「基於底牌不是黑桃A而壹樣做了加註的動作」的概率卻是截然不同的。底牌本身的不確定性復合上基於底牌可能的所有策略的不確定性,才是現在真正面對的不確定性。
回歸理論的話,這樣的不確定性無非只是增加了計算量——但毋庸置疑,AI破解隨機博弈,因此變得難上加難。
最後就是多人博弈的問題了。
在不完美信息遊戲的前提下,多人博弈首先增加了未知的底牌,也就是從數量上直接增加了不確定性。
同時上節已經提過,多人博弈在現實中是存在結盟的可能的,而博弈各方相互之間未必清楚類似約定的有無——亦即,多人博弈加重了信息的不完美,再次從結構上復合了多層不確定性。
最為關鍵的問題是,我們如何測試某個(或該類)AI與人類相比誰更優秀?假設有壹個團隊研發出了壹款極其優秀的麻將AI,讓兩個AI與兩個人類進行比試,有意義嗎?人類會不會為了人類的尊嚴,相互竄通?AI之間是不是也可以作弊?
把這樣壹個AI設置在網絡遊戲平臺上或許是合理的:進入遊戲的玩家無法根據對手ID判斷對方是否是AI;比賽的場次足夠多。——但為求勝利,提前研究對手的牌路(棋路),本來就是職業選手應該做的。這樣的匿名性是不是原本就對人類壹方不公平呢?就譬如AlphaGo集合了許多經典的棋譜,裏面理所當然地包括李世乭本人,但AlphaGo本身的棋譜卻少得可憐,李世乭在遊戲開始前就已經處於了不利的局面。
在介紹不完美信息隨機多人博弈的過程,筆者舉了撲克與麻將這兩個典型的例子。
筆者的疑問是:為什麽這類博弈總是與賭博直接相關?
這個疑問看上去有點沒來由。可只看定義的話: 幾乎所有體育運動都是隨機博弈。
譬如射擊,優秀的選手可以讓每壹槍都很接近靶心,但不可能保證每壹槍都正中靶心,所以比賽不是決鬥,壹槍定勝負。再如徑賽,成績壹定會受選手的身體狀況、天氣場地等等因素的影響,尤其短跑還有「壓槍戰術」,更是為比賽增添了許多看點。而團隊項目諸如足球,更是受太多或自然或人為的隨機因素影響。
並不是說體育項目就與賭博無關,諸如賭球的陰雲永遠揮散不去。但運動員本人只要不賭自己輸,他終歸是試圖獲得勝利的,也就是說原則上這項運動可以與賭博無關,只為榮譽而戰。然而德州撲克與麻將就算比賽完全去賭博化,終究是必須使用籌碼之類的道具來表示輸贏的額度。
另外不完美信息也不是問題,這在團隊項目中非常常見:棒球教練給出的壹連串花裏胡哨的動作,排球二傳手在隊友發球時在背後比劃的手勢,06年世界杯1/4決賽點球大戰前萊曼獲得的小紙條……
至於多人項目,體育競技中似乎沒有類似撲克或者麻將這樣單獨作戰為主的項目。諸如F1、長跑、自行車之類的,均十分強調團隊合作,阿姆斯特朗連拿7次環法冠軍,可不光是靠嗑藥的。而類似的配合在撲克或麻將中卻很容易被看作是作弊行為。這種觀念的區別在這裏不作深究,因為很可能是因為賭博在前,才催生了團隊配合的禁忌,而非相反。
以中國與日本為基點,全世界範圍內麻將的競技化正在緩步推進。
國內有關團體正在推行類似「重復橋牌(Duplicate bridge)」的規則,既不同牌桌的每壹局牌山的構成與東南西北四家的配牌是壹樣的。與橋牌壹樣,目的自然是為了降低隨機性。
然而我不覺得通過增加不同牌桌相同座位選手的相關性的方式來降低隨機性有什麽太大的意義——或者說根本就是適得其反吧,隨機生成的牌山變少了,實際上減少了樣本容量,反而增大了方差。
當然,因為該比賽完全在電腦上進行,並在比賽同時由計算機記錄選手的牌效率,所以還是有相當的意義。
為了降低隨機性,日本的頂級比賽采用「競技ルール」也叫「A rule」,與壹般日麻沒太多不同,主要就是減少了寶牌的數量。
說起來考慮降低隨機性的話,鷲巢麻將大概是個好方法:
最後壹條當然就不用了。
當筆者宣稱體育運動是隨機的時候,相信很多人雖然同意,卻不想同意,至少不想完全同意。
——只要不斷提高自己水平,終歸能碾壓弱小的對手。但這樣的比賽不是觀眾,甚至不是頂尖的運動員所渴望的,我們打從心底裏渴望壹場足以名留青史的巔峰對決。
沒錯,這正是競技的魅力所在:兩個勢均力敵的高手,劍戟招招奪命的威脅,剎那之間,毫厘之際……
而像撲克或者麻將之類純粹靠運氣的遊戲,就算是新手也有可能戰勝世界冠軍。
只比壹局的話,那是當然,但比上壹整場的話?頂級比賽,尤其是冠軍爭奪戰,可是要比上壹整天,甚至兩天?——這樣的情況下新手都能取得冠軍的話,真的不是其他選手有問題嗎?
整體的泱泱洪流輔以細節的不確定性,這是我們的思維定式。
我們的祖先憑它躲過了野獸的襲擊,渡過了湍流,在生殖崇拜的古老時代,多就是好,多就是神聖,多就是贊美詩。
但不知從何時起,「物以稀為貴」已經不僅僅是因為供需關系而達成的自然均衡,而更為直接地刻印在了我們的文化與基因裏。
我們把這套法則賦予我們發明的壹切遊戲,戰爭、狩獵、體育、棋牌——最不容易得到的,最具價值。
試問:棋牌與其他例子最大的不同在哪裏?
——那就是棋牌規則由我們制訂,不受物理法則的約束。
正態分布的物理世界是我們習慣的,超幾何分布的精神世界中我們卻只是青澀的頑童。而對於不受約束的,管教的方法古已有之:
賭博,這種通過讓參與者背負物質材料輸贏的方式,正是讓參與者負起責任的最好方法。
回答完了本章開頭的問題,最後再講講兩種分布,或者說兩個世界的區別。
物理世界中,我們掙紮於平均值與方差的負相關。較大的回報往往意味著昂貴的成本以及高額的風險。
並不是說由我們所制訂的遊戲規則裏就不存在這樣的情況,把超幾何分布的對象直接對應成精神世界也是筆者的極端。
但正態分布是基於事物本身,超幾何分布則是基於組合,也就是事物之間的關系——這樣的總結應該是足夠中肯的。
物理世界的對象,以及我們的壹般經驗,來源於事物的重復與堆砌。而在生物誕生之日開始,或者更早地,從生物大分子出現之時開始,演化催生的復雜性就不只是數量意義上的,更是結構意義上的。而人類社會更是所謂「上層建築」——就像生物作為物理存在必然遵循所有物理法則,但沒有必要用量子力學與相對論去研究貓犬的毛色壹樣——我們的精神世界是構築於物理世界的基礎上,不代表兩個世界的法則互相通用。
最後,筆者想要向整個啟蒙時代致以最真摯的敬意與最沈痛的惋惜。
啟蒙運動推崇理性——不應只是在科學研究之中,更應是在人性的自我發現與整個社會文明之中——但壹切都只是空想,人類終究只會用最老套的辦法來讓自己負起責任。