我來說說吧,以芝麻信用為例,當發生電商交易,信用卡還款;亦或是導入領英賬號信息,錄入車輛信息,導入住房公積金信息。以上種種行為體現在信用分上,都會以提高芝麻信用分的形式體現出來。也即,在芝麻信用的體系中,將以上行為定義為好的,正面的行為。那麽問題就在於,此類行為的好與壞,是由何種標準定義的,是否能經過檢驗。當然,以人們常規的認識,上述行為必然是好的行為。但,是否不符合以上行為的人群,其違約風險壹定會高?按照以上的標準將人群進行區分,違約率是否會有顯著差異?其差異是否達到了統計學顯著的標準,從而可以作為結論使用?大數據提供了檢驗的方法,在其背後的所涵蓋的統計學,計量經濟學,以至於神經網絡中,有大量的知識和技能用於驗證上述定義是否有其科學依據。如果——不幸的——上述行為只是基於壹般認識所得出來的結論,不加驗證的將其納入到大數據的信用評分體系中,那麽最終得到的結果,對於大數據來說是可悲的。因為在這壹方法論下,大數據只是作為約定俗稱的慣常思維的眼神,只是相當於海量的信貸專家坐在壹起進行討論。我所希望的大數據,應該要像AlphaGo學習圍棋壹樣,不管定式,不管手筋。從勝率的角度去評價每壹個點位落子的價值,最終找出能夠走向勝利的最優下法。應用在信貸審核中,就是拋掉所有約定俗成的見解,去重新尋找經過大數據驗證的信用風險影響因素,並以此為基礎,重新建立信用風險審核的新體系。