記得高中的時候是哲學課,學了壹些機械思維的東西。我記得不是很清楚,只知道是機械的,不像機械那樣理解靈活的思維方法。看了吳軍的書,才知道機械思維曾經是壹種非常高級的思維方式,包括牛頓的運動學三定律,愛因斯坦的相對論,都可以說是機械思維的結果。是不是又壹個突破?
很大程度上,機械思維起源於古希臘。歐洲之所以能在科學上領先,唯壹的原因就在於古希臘建立的思辨思維和邏輯推理能力。而在中國,除了春秋時期,諸子百家爭鳴,背後的主要思想是以儒家和道家文化為主。儒家講究中庸、中立、中庸、平衡、以人為本,而思辨則是壹種極端的思維方式和追求。道家思想追求道法自然、天人合壹、陰陽平衡、陰陽奧妙;道的追求是道可道,道非凡,名可非常名,也就是說不變的道是無法用語言表達的。綜上所述,在我看來,我們中國的老祖宗早就發現世界很復雜。儒家更多的是從仁的角度來關心人,而道更多的是關心人與自然的和諧,以天地為師,師天,師地,師自然。
吳老師在書中對機械思維的概述如下:
在我看來,大部分人可能都有這種思維模式,還有壹種思維模式根本不存在,就是盲目做事,這種思維模式還不如機械思維。機械思維的核心思想可以概括為:世界是可以完全認識的,是有壹定規律的,世界萬物之間有壹定的因果關系,對規律的探求需要“大膽的假設和仔細的求證”,現在也被認為是壹種科學的態度和科學的思維方式。近代很多成果,包括愛因斯坦的質能方程,都是在機械思維的模式下完成的。
機械思維認為世界是確定的、可以被認識的積極壹面也有其局限性,即否認不確定性和不可知性。愛因斯坦有句名言,“上帝不擲骰子”,這是愛因斯坦在與量子力學的發明者玻爾爭論時說的話。今天我們知道玻爾在這場爭論中是對的,愛因斯坦是錯的,上帝也擲骰子。
從股市的專家預測到天氣預報,再到簡單的擲骰子,很多預測都是不準確的。不確定性來自哪裏:
第壹,我們知道的越詳細,影響世界的變量就越多,結果無法用簡單的方法或公式計算出來。如果窮盡所有影響事務的變量,當然是可以預測的,但現實中不可能,公式會很復雜,無法用簡單的公式描述清楚;
第二,由於我們主觀思維的影響,我們對世界的認識因為思維方式的局限而不準確,這也阻礙了我們對世界的認識。
第三,客觀上世界本來就是復雜的。比如我們知道電子圍繞原子核快速旋轉,但是電子在特定時刻的位置和速度是不確定的,這是原子本身的特性,類似於量子中的測不準原理,我們的測量活動本身就影響了測量結果。這類似於我們在股市中根據某個特定的指數去買股票。如果大家都按照這個指數來買股票,那麽這些自己買股票的行為就會影響股票本身的價格和走勢。
世界是不確定的,但不是未知的。也是電子圍繞原子核的運動。雖然我們不知道電子的具體位置和速度,但是我們可以估計出它們出現的位置和概率。所以世界上很多難以用具體公式描述的東西,通常都可以用概率模型來描述。天才香農將世界的不確定性與信息聯系起來,形成了信息論,信息論不僅是壹種傳播理論,也是人們認識世界的新途徑。
信息論首先解決的是信息有多少的問題。“明天太陽從東方升起”“xxx明星和xxx明星已經秘密登記結婚”這兩個簡單的句子,信息量很大。從我們的直觀思維來看,明天太陽從東方升起,這幾乎是板上釘釘的事情,所以相當於沒有什麽信息含量的廢話;後壹句的概率比較低,所以信息量大。香農博士將信息與事件確定的不確定性聯系起來,引入了熵的概念。熵最初是熱力學中的壹個概念。兩個容器用擋板隔開,兩邊的氣體處於有序狀態。如果去掉擋板,氣體狀態將變得越來越無序,在宏觀上趨於穩定。這種氣體從原來的有序狀態逐漸變成無序狀態,熵壹直在增加,也就是說有序決定的熵低,越亂熵越高。如果熵要低,或者事物要有序,就必須有外力。
還是有點抽象。舉個簡單的例子,如果妳的房間不整理,以後會越來越亂。這時候熵越來越大。找了半天也不壹定找到。為什麽呢,因為混亂導致了不確定性的增加,怎麽處理就是把房間收拾收拾,提高了秩序,降低了熵。
香農博士用熵來衡量信息量。信息量越大,不確定性越大,所以熵也就越大。想要信息確定,就必須引入更多的信息。要引入的信息量取決於所需事件的不確定性。與機械思維相反,信息論是建立在不確定性基礎上的。
如果妳學過機器學習,妳壹定很熟悉決策樹算法。沒學過也沒關系。下面用壹個例子來簡單說明壹下如何判斷壹個西瓜是不是成熟的西瓜。我們需要判斷瓜的花紋顏色深淺,瓜蒂粗細,以及敲瓜的聲音。我們可以根據這些條件逐步判斷,每壹步選擇壹個條件進行判斷,最後根據多個條件判斷瓜是否成熟的概率,如下圖所示:
首先,我們不確定壹個瓜熟不熟。如何確定,我們引入了很多信息,比如瓜的花紋顏色,花梗的粗細,判斷條件的引入順序也很重要。比如我覺得瓜的花紋顏色深淺很重要,這個信息量比較大。引入後,瓜熟不熟的信息熵會迅速降低,讓我們對信息越來越確定。這個原理是用來判斷決策樹的。花紋的顏色和瓜蒂的粗細不是隨機選取的,要選取的信息與瓜是否成熟有關(根據信息論)。信息論中的互信息解釋了相關性的大小。
信息論的重要原則是,當我們要為未知事件尋找壹個概率模型時,這個模型要滿足我們已有的數據,但不對未知做任何假設。這就是最大熵原理,不同於之前的“大膽假設,謹慎論證”。不做主觀假設的前提是有足夠的數據。
首先要了解大數據的三個特點:1)數據量要足夠大;2)數據的維度要足夠;3)如果數據完整,全覆蓋,則不能抽樣。
這個世界的本質是壹個不確定的世界。我們知道的信息越多,就越容易消除不確定性。隨著大數據的發展,很多人工智能問題都可以解決,因為我們的數據足夠大。
如果數據量足夠大,我們就會有足夠的信息。相關領域的不確定性降低得越多,相關的研究進展就會越快。數據的維度越多,與我們想要解決的問題的相關性匹配越好。有了多維度的信息,可以做交叉驗證,從而進壹步降低信息的不確定性;數據的完整性防止了小概率事件的發生,它覆蓋了事件發生的環境的整個範圍。因為技術的進步,數據收集的完備性可以稱之為可能。
大數據強調相關性,而不是因果關系。既然世界是不確定的,我們在壹些規律中找不到它的因果關系,但不妨礙我們找到它的關聯性,比如在電影租賃網站上投放零食廣告,比如在咖啡評論和銷售網站上投放信用卡廣告和房貸廣告。這是點擊大數據分享廣告得到的結果,雖然我們不知道因果關系。但是這種相關性也有助於我們提高廣告的點擊率。我們要學會在不知道原因的情況下接受這個答案。如果我們願意接受,我們就會跳出機械思維的方式,只追求因果關系。
大數據時代已經到來。我們的思維方式應該停止只以熟悉機械思維的方式思考,敢於接受沒有因果的答案。
祝大家都能提升思維。
-益銘於2009年8月31日在成都。