金融的本質是風險管理,風險控制是所有金融業務的核心。抵押貸款、消費貸款、P2P、供應鏈金融、票據融資等典型的金融借貸業務,都需要數據風控來識別欺詐用戶,評估用戶的信用等級。
傳統金融的風險控制主要使用信用屬性強的金融數據,壹般使用20個緯度左右的數據,用分數來識別客戶的還款能力和意願。信用相關性強的數據大概是十個緯度,包括年齡、職業、收入、學歷、工作單位、貸款情況、房產、車、單位、還貸記錄等。金融企業參考用戶提交的數據進行評分,最終得到申請人的信用評分,並根據評分決定是否放貸以及貸款額度。其他信用相關數據包括地區、產品、融資方式、行業、支付方式、支付記錄、金額、時間和頻率。普惠在線
互聯網金融的大數據風控並沒有完全改變傳統風控,實際上是豐富了傳統風控的數據緯度。在互聯網風控中,首先通過信用屬性強的金融數據判斷借款人的還款能力和意願,再輔以信用屬性弱的行為數據。壹般通過數據的相關性分析來判斷借款人的信用情況,通過數據模型揭示某些行為特征與信用風險之間的關系。
互聯網金融公司在利用大數據進行風險控制時,都是利用多維度的數據來識別借款人的風險。借款人風險評估中使用的信用相關數據越多,借款人的信用風險就會揭示得越充分,信用評分也就越客觀,越接近借款人的實際風險。
常用的互聯網金融大數據風控方法如下:
核實借款人的身份
核實借款人身份的五大要素是姓名、手機號、身份證號、銀行卡號、家庭住址。企業可以用國政通的數據驗證姓名和身份證號,銀聯數據驗證銀行卡號和姓名,運營商數據驗證手機號、姓名、身份證號和家庭住址。
如果借款人是欺詐用戶,這五條信息都可以買。這時候就需要人臉識別了。人臉識別的原理是調用國政通/公安局的API接口,用客戶在公安局預留的身份證實時識別申請人拍攝的照片/視頻,通過人臉識別技術驗證申請人是否為借款人本人。
其他核實客戶的方式包括要求客戶出示其他銀行的信用卡和信用卡記錄,或者核實客戶的學歷和身份認證。
分析提交的信息以識別欺詐。
大部分貸款申請都從線上搬到了線上,尤其是互聯網金融領域。消費貸和助學貸主要是線上申請。
網上申請時,申請人會根據貸款公司的要求,填寫戶籍地址、居住地址、工作單位、單位電話、單位名稱等多維度信息。如果是欺詐用戶,填寫的信息會有壹些規律,企業可以根據異常的填寫記錄識別欺詐。比如在不同城市填同壹個小區名,在不同城市填,在不同單位電話號碼相同,在不同單位地址和街道相同,單位名稱相同,甚至樓層和門牌號相同。還有壹些假的小區、地址、單位名稱、電話。
如果企業發現壹些重復的信息和電話號碼,申請人將有很大的可能被欺詐。
分析客戶的在線應用行為以識別欺詐
詐騙用戶往往提前準備好用戶的基本信息,快速填寫申請,批量作業,在很多網站申請,通過增加申請量獲得更多貸款。
在SDK或JS的幫助下,企業可以收集申請者各方面的行為,計算出客戶閱讀條款、填寫信息、申請貸款等的時間。如果這些申請時間比正常客戶短很多,比如填寫地址信息不到2秒,閱讀條款不到3秒,申請貸款不到20秒。用戶申請的時間也很關鍵。壹般11 pm之後申請貸款的申請人,欺詐違約比例較高。
這些異常的申請行為可能揭示了申請人有欺詐傾向,企業可以結合其他信息判斷該客戶是否為欺詐用戶。
使用黑名單和灰名單識別風險
互聯網金融公司面臨的主要風險是惡意欺詐,約70%的信用損失來自申請人的惡意欺詐。客戶的逾期或違約貸款至少有30%左右可以收回,其他部分可以由催收公司催收,M2的逾期貸款回收率在20%左右。
市場上從事個人征信的公司有近百家,主要業務模式有反欺詐識別、灰名單識別和客戶信用評級。在反欺詐識別中,壹個重要的參考就是黑名單。市場上領先的大數據風控公司有近654.38+00萬的黑名單,大部分是過去十年積累的老套名單,真正有價值的黑名單在200萬左右。
黑名單來自民間借貸、網絡P2P、信用卡公司、微貸等公司的歷史違約用戶,其中很大壹部分已經不再有借貸行為,參考價值有限。另壹個主要來源是催收公司,催收成功率壹般不到30%(m3以上),會產生很多黑名單。
灰名單是指逾期但尚未達到違約的客戶(逾期3個月以內的客戶)。灰名單也意味著多頭借貸,申請人從多個借貸平臺借款。貸款總額遠遠超過其還款能力。
黑名單和灰名單是很好的風控手段,但每個征信公司擁有的名單只是整個市場的壹部分。很多互聯網金融公司為了提高搜索率,不得不接入多個風控公司獲取更多黑名單。央行和上海市經信委正在和多家互聯網金融公司聯合建立統壹的黑名單平臺,但是很多互聯網金融公司不願意貢獻自己的黑名單,這是用真金白銀總結出來的教訓。此外,如果外界知道自己平臺上黑名單的數量,會影響其聲譽,降低其估值,讓投資人質疑其平臺的風控水平。
使用移動設備數據識別欺詐
其中壹個特殊的行為數據是移動設備數據的反欺詐。公司可以利用移動設備的位置信息來驗證客戶提交的工作、生活地點是否真實,此外還可以根據設備安裝的主動應用來識別多頭借貸風險。
詐騙用戶壹般使用模擬器申請貸款,移動大數據可以識別貸款人是否使用模擬器。詐騙用戶也有壹些典型特征,比如很多設備聚集在壹個區域,壹起申請貸款。詐騙設備不安裝生活類和工具類的app,只安裝與貸款相關的app,還可能安裝壹些密碼破解軟件或其他惡意軟件。
詐騙用戶也有可能不斷更換SIM卡和手機,利用SIM卡和手機的綁定時間和頻率,可以識別部分詐騙用戶。此外,欺詐用戶還會購買壹些被淘汰的手機。機器上的操作系統已經過時很久了,安裝的App版本都很舊。這些特征可以識別壹些欺詐用戶。
用消費記錄打分。
會議數據風控不僅可以識別壞人,還可以評估出借人的還款能力。傳統金融過去是以收入來判斷借款人的還款能力,但有些客戶是有工資以外的收入的,比如投資收益、咨詢收益等。其他客戶可能從父母、伴侶、朋友那裏獲得其他經濟支持,支付能力較高。
按照傳統的理財慣例,不在家工作照顧家庭的家庭主婦,還款能力可能較弱。不能提供貸款,但是丈夫收入很高,妻子決定家庭日常開支。在這種情況下,需要消費數據來證明其還款能力。
常用的消費記錄有銀行卡消費、電商購物、業務支出記錄、商品消費等。也可以參考航空記錄、手機話費、特殊會員消費等。比如頭等艙乘坐次數、物業費、高爾夫俱樂部消費、遊艇俱樂部會員費、豪華會員、豪車4S店消費記錄等消費數據都可以作為其信用評分的重要參考。
互聯網金融的主要客戶是屌絲,其電商消費記錄、旅遊消費記錄、加油消費記錄都可以作為評估其信用的依據。壹些互聯網金融公司專門做個人電商消費數據分析。只要客戶授權他們登錄電商網站,就可以借助工具抓取所有客戶歷史消費數據,進行匯總和評分。
參考社會關系評估信用狀況。
物以類聚,人以群分。壹般來說,壹個信用好的人和他的朋友有很好的信用。信用不良的人朋友的信用評分低。
借款人的信用狀況可以參考借款人經常聯系的朋友的信用評分來評估。壹般以經常打電話的朋友為樣本,對經常聯系的幾個人(不超過六六個人)的信用評分進行評估,去掉最高分,去掉最低分,取平均值來判斷借款人的信用。這種方式很有挑戰性,僅僅依靠手機號來判斷個人信用的可信度不高。壹般只用於防騙識別,其經常撥打的手機號碼用於黑名單數據庫中的匹配。如果命中,這個申請人的風險很大,需要進壹步調查。
參考借款人的社會屬性和行為來評估信用。
參考以往互聯網金融風控經驗,發現有伴侶和子女的借款人貸款違約率較低;老年人的違約率高於年輕人,50歲左右的貸款人違約率最高,30歲左右的貸款人違約率最低。貸款用於家庭消費和教育的貸款人貸款違約率低;申報月收入3萬以上的人,貸款違約率比申報月收入1.5萬以下的人高。借款次數多的人的貸款違約率低於首次借款的人。
經常不交公用事業費和物業費的人,貸款違約率更高。經常換工作、收入不穩定的人,貸款違約率更高。經常參加社會公益活動,成為各種組織成員的人,貸款違約率低。經常換手機號的人貸款違約率遠高於壹直用壹個電話號碼的人。
經常半夜上網,很晚發微博,生活不規律,經常跑各個城市的申請者,違約率比其他人高30%。故意隱瞞過往經歷和聯系方式,填寫簡單信息的人比填寫豐富信息的人違約的可能性高20%。長期借款的人比短期借款的人逾期和違約的概率更高。有車的貸款人貸款違約率比沒車的貸款人低10%左右。
利用司法信息評估風險
涉毒、涉賭、被治安處罰的人信用情況不太好,尤其是涉毒、涉賭人員。這些人是高危人群。壹旦他們獲得貸款,他們的貸款用途是不可控的,貸款可能無法償還。
尋找這些涉毒涉賭嫌疑人,可以利用當地公安數據,但難度較大。移動設備的位置信息也可以用於某種程度的識別。如果設備經常在深夜出現在澳門等賭博場所或賭博區域,則申請人涉賭風險較高。此外,在中國的壹些特定地區,壹些當地人從事賭博或賭博行業。壹旦申請人填寫的居住地址或移動設備位置信息涉及到這些區域,也要引起註意。涉賭涉毒人員壹般工作不穩定或無固定收入。如果應聘者經常跳槽或者在某個階段經常沒有收入,這種情況就需要註意了。參與賭博和涉毒活動的人有壹個特殊的規律,經常半夜在外面活動,也經常住在當地的賓館裏。這些信息可以參考移動大數據進行識別。
簡而言之,互聯網金融的大數據風控采用了用戶社交行為和社交屬性的數據,在壹定程度上補充了傳統風控數據維度的不足,能夠更全面的識別欺詐客戶,評估其風險等級。互聯網金融公司通過分析申請人的社會行為數據來控制信用風險,將資金貸給符合條件的出借人,保證資金安全。