在詐騙分子眼裏,網貸行業就是壹塊大蛋糕。如今,無論是線下的貸款機構包裝,還是線上的黑產等類似的黑產從業者,都盯上了網貸。能否做好反欺詐,是網貸行業的壹條生死線。
首先簡單普及壹下行業知識。詐騙模式可分為壹方詐騙和三方詐騙:壹方詐騙通常是指申請人對自己的信息進行包裝,無意還貸,導致違約,而三方詐騙是指詐騙者冒用他人身份或協助他人偽造申請信息。三方詐騙通常以團夥犯罪的形式出現,給網貸機構造成嚴重損失。而且團夥詐騙往往會有意識地分析網貸機構的反詐騙策略,不斷升級詐騙手段,就像病毒變種壹樣。如果沒有有效的手段,他們很容易突破反欺詐體系。
對於詐騙團夥來說,利用大數據進行防範是有效的。下面重點介紹數據科學在識別三方欺詐中的應用:“關系網絡發現”用於識別集團成員。
制定反欺詐策略有壹個基本假設,就是“騙子的朋友是騙子”的概率更大,要識別不良貸款中介。因為中介騙子會通過提供虛假、偽造、打包的申請資料來幫助很多不願意還貸的人,也會教會申請人如何應對。通過中介(或團夥本身)申請集中貸款的風險很大,是壹種常見的詐騙類型。研究發現,社會網絡分析等交叉檢驗方法可以有效識別上述欺詐模式。
我們定義用戶之間如果使用壹些核心信息,如手機設備、電話號碼、身份證、銀行卡號、郵箱地址等,就存在密切關系。將這些信息作為點,將信息之間的關系作為邊,可以構建類似於以下的圖形網絡:
如上圖,有兩個用戶通過手機申請貸款,壹個貸款成功,壹個貸款失敗。通過用戶應用中提供的信息,將核心信息構建成網絡圖,可以看出兩個用戶關聯了三個手機號和三個手機設備,兩個用戶通過壹個共同的手機設備聯系在壹起。上圖中真實的業務場景是,後綴為979的用戶申請時,發現與之強相關的用戶貸款成功,通過圖中的關系,發現後綴為979的用戶申請了之前的貸款。如果後綴為979的貸款申請被批準,兩人的整體債務將會增加,因此貸款申請將在終審中被駁回。
以上是壹個簡單的例子。在現實商業中,欺詐和反欺詐是壹個博弈過程。簡單的反欺詐策略容易被真正的欺詐者發現和規避,簡單策略的效果會不斷下降。事實上,欺詐很難被徹底解決。反欺詐的壹個重要思想就是在保證策略準確性的同時,不斷提高欺詐者的欺詐成本,使反欺詐策略更加智能和復雜。
在這種思維方式下,反欺詐也是通過社交網絡進行的。我們需要更全面地描述每個用戶之間的關系。用戶之間的關系定義不僅僅是上述的強關系,還有很多弱關系,比如用戶之間的電話,同壹單位的用戶,同壹地區的用戶家庭住址,曾經是QQ好友的用戶等。這些更多的關系和關系的疊加,很容易導致用戶之間出現以下非常復雜的關聯網絡。
同時可以賦予每個點不同的屬性,用於後續的特征工程提取。比如圖中用戶身份證類型的頂點,可以設置多個屬性,比如黑名單、用戶資產、住房等。在後續的特征工程中,可以根據頂點屬性導出具體的特征,比如曾經關聯的身份證被列入黑名單的頂點的個數。構建用戶關系網絡圖的最終目的是提高詐騙團夥識別的準確率,實現反詐騙決策自動化,即提高詐騙識別的有效性和效率。我們希望通過社交網絡挖掘出用戶更多的特征,用於訓練反欺詐模型和策略,所以對於這個復雜的用戶關系網絡圖,接下來需要做兩件事。首先,我們需要提取用戶特征。第二,點屬性標簽的完成。
用戶特征提取
每個用戶都可以通過手機、身份證等關鍵信息點獲得單個用戶網絡的連通圖(實際上10億節點的圖的查詢效率很低,響應時間的問題需要通過實時決策場景下的算法優化來解決,比如圖存儲的鎖問題、異常點的超時查詢等)。對於每個點,計算其在圖中的公共屬性特征,如度、鄰近中心性、頁面等級中心性和中間中心性。這個過程可以看作是通過圖形數據對給定用戶的特征工程。大部分策略和模型的效果往往是由特征工程的好壞決定的,甚至特征工程方法也成為了公司不能透露的核心內容,於是數據算法工程師的艱苦生活開始了...舉幾個例子,除了簡單的與點中心性相關的直接特征,我們還可以直接想到很多特征,比如與用戶N度關聯點關聯的手機號數量,與用戶關聯的設備號占所有關聯點的比例,與用戶關聯的黑名單ID號數量。上述特征計算的例子大多可以標準化,通過開發單獨的特征工程模型,可以實現數萬個特征的衍生計算。這樣可以大大提高模型開發的效率。
點屬性標簽的補充
在策略分析和特征計算中,我們需要很多標簽屬性,比如某個身份證是否被列入黑名單,身份證是否有房,身份證信用卡額度是否超過3萬等等。然而,事實上,對於大多數用戶來說,標簽屬性往往是缺失的。比如應用中途用戶流失,用戶最後放棄,我們無法精準的收集這些標簽。我們做什麽呢我們使用圖相關的社區發現算法來完成標簽,如最常用的標簽傳播算法LPA(Lable PropagationAlgorithm),以及類似的算法,如SLPA,HANP,DCLP等。
鑒於行業最新發展,酸街征信推出的反欺詐雲服務全面升級。根據其提供的欺詐評級和欺詐判斷的補充信息,信貸機構可以結合自身已有的欺詐策略同時部署應用,從而達到欺詐防範效果的最優化。在合作機構前期運營過程中,反詐騙雲服務已經建立了信貸行業反詐騙聯盟,在實現行業聯防聯控、打擊詐騙團夥多機構逃匿攻擊等方面取得了理想的效果。
據統計,反欺詐雲服務上線半年來,已為70余家合作機構的數百萬筆信貸申請提供欺詐預警服務,幫助信貸機構發現欺詐損失數千萬元。
在原有的基礎上,反欺詐雲服務的三大產品優勢將更加明顯,即海量的征信資源數據、優秀的關系網絡算法和優秀的中文模糊匹配功能。反欺詐雲服務可以有效地建立算法優秀的關系網絡,因為我們使用了直接基於“點”和“線”存儲的圖形化建模方法,結合DMR網絡關系發現算法,大大提高了欺詐關系發現的能力和效率。該系統具有發現欺詐網絡無延遲、實時檢測和計算、覆蓋每壹個欺詐應用的特點。更重要的是,它定義了多個相關關系,從而發掘團夥案件的潛在聯系,使其無處藏身。