除此之外還有高階的方法嗎?
是的,數學家通過建立模型來預測情景,從而判斷未來的大方向。
現在大數據大行其道,我們生活在大數據時代。通過數據的收集,我們可以建立壹個數學模型來做出判斷,在大量的數據下給我們展示壹個可靠的未來。
雖然大數據與我們的生活息息相關,但作為普通人,數據采集已經是壹個大問題,更不用說數據采集後的大量算法了。我們似乎沒有辦法使用這些高端的東西。
的確,現在大數據普及,換到我們老百姓的生活中不太實際。但是,如果生活中有壹些小數據,我們可以簡單的對這些小數據進行處理和判斷。
其實我們壹直在用這些方法,靠的是直覺,但是不知道背後的科學原理,比如我們在等車的時候,判斷下壹趟車什麽時候回來?是否值得等待。
250多年前貝葉斯就有這樣的疑惑。應該如何判斷未來的趨勢?沒有250多年前大數據的支持,貝葉斯是怎麽解決的?
貝葉斯問題是這樣的:
如果概率是100%,那麽三張彩票的中獎概率也是100%。但如果是50%,三張彩票的中獎概率就變成了1/2×1/2×1/2 = 1/8。如果中獎概率是1%,那麽三張彩票的中獎概率就變成了1/100×1/100×1/100。
貝葉斯認為1/8的概率大於100%,1/100×1/100的概率大於100。貝葉斯也就此發表了自己的論文。貝葉斯最重要的貢獻在於量化直覺,推斷過度假設。
貝葉斯實際上並沒有解決這個問題,因為如果妳問貝葉斯概率是多少?他不知道,他只是說比那更有可能。
幾年後,法國數學家拉普拉斯給出了壹個解決方案,答案相當簡單。任何N次嘗試都有W個贏家的情況,那麽未來的情況是:(w+1)/(n+2)。這就是著名的拉普拉斯定律。
拉普拉斯在自己的生活中也使用了這個規則。比如將來人生男生女的概率有多大?通過這個公式可以得到壹個結果,男女比例接近1:1。
拉普拉斯為我們的小數據打開了處理現實世界的大門。
小數據也有小數據的美,可能不完美,但足夠完美,可以改善我們的生活。經過這麽多年的發展,可以說在小數據的應用上已經有了壹些階段性的成果。
為了展開這些小數據,必須有壹些先驗數據來支撐。肯定沒有,至少是猜測,哪怕不現實。
這些猜想和之前驗證的數據將決定我們使用的方法。三招教妳簡單預測未來。以下是三種先驗數據和我們的預測方法:
?冪分布中的乘法法則
冪律是指事物的發展,規模和倍數成反比。規模越大,次數越少。比如電影總票房和電影數量的關系,電影票房少的時候,電影數量也很少。到了某壹點後,電影數量似乎增加不多,但電影票房卻急劇增加。說明有些電影占絕大多數,帶來可觀的票房。
冪律也被稱為2/8定律。人生最重要的部分是由那20%決定的,投資公司的收益主要是由他們那20%的投資決策帶來的。電影總票房也主要由20%的電影貢獻。
如果要預測壹部電影可能帶來的票房,符合乘法定律。乘法定律有壹個固定的系數,不同的東西有不同的系數。假設壹部電影的票房系數是1.4,那麽這部電影已經有600萬票房了。目前可以預測這部電影會有840的票房。
當事物符合冪分布時,乘法法則有效。
正態分布中的平均法則
在正態分布中,處於兩個極端的人很少,大部分在壹個地區,所以人類的年齡分布符合正態分布。當我們預測年齡時,我們需要使用平均法則。我們知道非常年輕的人和非常長壽的人屬於少數,我們大多數人將在壹個地區。
假設人類的平均年齡是79歲,壹個孩子只有7歲。妳預測他會活幾歲?根據平均律,這個孩子處於正態分布的峰值,我們會猜測他大概78歲左右。相反,如果壹個老人90歲了,妳會預測他多大?同理,按照法律規定,老人可能活到94歲。
壹部電影剛上映,妳沒看過。妳覺得要享受多久?按照正態分布的平均規律,壹部電影大概是120分鐘。除了《泰坦尼克號》那樣的幾個小時,我們可以估算出自己需要的時間。
?鄂爾多斯分布的常數定律
恒常定律是壹個不變的量,不會因其他影響而改變。我們最熟悉的是,當我們在玩遊戲或者沈浸在自己喜歡的事情中的時候,我們經常會說我五分鐘就結束了,但事實是五分鐘過後還有五分鐘,似乎沒有停下來的趨勢。
在賭場裏,我們會經常遇到這樣的情況,就是多壹手,我不玩了,我保證走,結果就是壹手接著壹手。總是忘記自己說過的話,這也叫遺忘法則。
程三斧定瓦山。下面教妳三招預測未來。總結這三招:
如果妳玩的是吃角子老虎機,而且吃角子老虎機符合勢力分布,妳贏壹次,就很可能壹直贏。如果妳輸了,不要指望贏,妳會壹直輸。這就是乘法定律,這種效應不斷被放大。
老虎機如果符合正態分布,不會壹直贏,也不會壹直輸,而是在這個老虎機的平均值,輸贏次數趨於平均。
如果吃角子老虎機符合Erci分布,跟妳玩多少次沒關系。妳玩它多少次,它就註定輸或贏。每臺老虎機的設置都不壹樣,所以了解壹臺老虎機屬於什麽分布就顯得尤為重要。
哈佛大學生物學教授史蒂夫·古爾德(Steve Gould)想知道自己發現自己得了癌癥後還能活多久,還為自己做了壹個預測。醫生只是告訴他,壹半的病人在他發現這種癌癥後的八個月內死亡。
古爾德認為這只是數據之壹,他並不知道這種癌癥的存活和分布情況。
如果符合正態分布,那麽他八個月左右。如果符合權力分配,那就完全不壹樣了。他堅持得越久,就活得越久。即使是正態分布,古爾德也認為自己是壹個極端的人,可以活得更久。結果,古爾德在癌癥被發現後又活了20年。哈佛教授也是用小數據做判斷。大數據並不壞,但是當我們有時候很難得到我們想要的大數據的時候,小數據可以幫助我們。
深入來說,這背後的原理其實是用數據建模,區別在於數據量。
當確定事物符合某種分布時,無論數據有多少,我們得到的函數都是固定的。如上圖所示,我們可以從幾個數據得到壹個函數,也可以從幾千個點得到壹個函數,但是我們可以用最少的數據得到原函數。
小數據的優點是決策快,缺點是可能不完全準確,可能會導致偏差大。大數據的好處是我們更容易得到壹個準確的結果,不足的是要花大量的時間去分析數據。
每個行業的成功人士都有在短時間內做出決策的能力,而且決策的成功率還是很高的。為什麽?今年4月,哈佛商業評論網對此進行了分析,認為對生活中許多復雜的事情做出快速判斷的方法是制定簡單的規則。就像三招教妳預測未來的簡單方法壹樣,三招是簡化的規則,讓妳判斷大方向不會出錯。
簡單不代表容易。簡單三筆的預測,後面是大量的數據和先人的努力。小數據的想法在大數據的趨勢下是如此的與眾不同,卻又是如此的耀眼!
參考數據
復雜決策
https://HBR . org/2017/05/linear-thinking-in-a-nonlinear-world dy & gt;