為了準確描述用戶的特征,可以參考以下思路,從用戶微觀畫像的建立到用戶畫像的標簽建模再到用戶畫像的數據架構,從微觀到宏觀逐層分析。
首先,從微觀的角度來看,我們如何對用戶的微觀畫像進行分級?如下圖所示
總體原則:在壹級分類的基礎上,逐步細分以上分類。
第壹類:人口屬性、資產特征、營銷特征、興趣愛好、購物愛好、需求特征。
市場上用戶畫像的方法很多,很多企業也提供用戶畫像服務,用戶畫像的升級非常困難。金融企業是最早開始用戶畫像的行業。金融企業因為數據豐富,在做用戶畫像時,無法從很多緯度的數據入手。他們總是認為用戶畫像數據的緯度越大,畫像數據就越豐富。有些輸入數據還設定了權重,甚至建立了模型。用戶畫像是壹個龐大而復雜的工程。但是,我費了好大勁,發現只留下了用戶的畫像,離業務很遠。沒有辦法直接支撐企業運營,投入巨大但回報很小。可以說得不償失,無法向領導交代。
實際上,用戶畫像涉及的數據緯度需要結合業務場景,要簡單幹練且與業務關聯性強,便於篩選,便於進壹步操作。用戶畫像需要堅持三個原則,即人群屬性和信用信息、強相關信息和定性數據。下面分別進行解釋和分析。
描述壹個用戶的信息很多。信用信息是壹個用戶畫像中的重要信息,信用信息描述了壹個人在社會中的消費能力。任何企業做用戶畫像的目的都是為了找到目標客戶,目標客戶必須是有潛在消費能力的用戶。信用信息可以直接證明客戶的消費能力,是用戶畫像中最重要、最基礎的信息。壹句玩笑話,所有信息都是征信,就是這個道理。它包含消費者的工作、收入、教育、財產等信息。
我們需要引入強相關信息和弱相關信息。強關聯信息是與場景需求直接相關的信息,可以是因果信息,也可以是關聯度高的信息。
如果將相關系數的範圍定義為0到1,則0.6以上的相關系數應定義為強相關信息。例如,在其他條件相同的情況下,35歲左右的人的平均工資高於平均年齡30歲的人,計算機專業畢業的學生的平均工資高於哲學專業的學生,在金融行業工作的人的平均工資高於在紡織行業工作的人,上海的平均工資高於海南省。從這些信息可以看出,人的年齡、學歷、職業、所在地對收入的影響很大,與收入水平有很強的相關性。簡單來說,對征信影響大的信息就是強相關信息,反之亦然。
用戶的其他信息,如用戶的身高、體重、姓名、星座等信息,很難從概率上分析其對消費力的影響。這些弱相關的信息不應該在用戶畫像中分析,對用戶的信用消費能力影響不大,沒有太大的商業價值。
在進行用戶畫像和用戶分析時,應考慮強相關信息,不考慮弱相關信息,這是用戶畫像的壹個原則。
比如客戶可以分年齡段,18 -25歲定義為年輕人,25 -35歲定義為年輕人,36-45定義為中年人。可以參考個人收入信息,把人定義為高收入、中等收入和低收入人群。參照資產信息也可以將客戶定義為高、中、低三個層次。定性信息的類別和方法,財務可以從自身業務出發,沒有固定的模式。
用戶畫像的另壹個原理是將金融企業的各種定量信息集合起來,對定性信息進行分類和表征,有利於快速篩選用戶和定位目標客戶。
以下內容將詳細介紹如何根據用戶行為建立模型輸出標簽和權重。壹個事件模型包括三個要素:時間、地點和人。每壹個用戶行為本質上都是壹個隨機事件,具體可以描述為:什麽用戶,什麽時間,什麽地點,他做了什麽。
什麽用戶:關鍵在於用戶的識別。用戶識別的目的是區分用戶並在單點定位用戶。
以上列舉了互聯網上用戶識別的主要方法,獲取方式由易到難。根據企業的用戶粘性不同,可以獲取的識別信息也不同。
什麽時間:時間包括兩個重要信息,時間戳+時間長度。時間戳,為了標識用戶行為的時間點,如1395121950(精度到秒),1395121950.05438+02(精度到微秒),通常采用精度。因為微秒時間戳精度不可靠。瀏覽器時間精度,精度最多只能到毫秒。時長,以此來標識用戶在壹個頁面上停留的時間。
什麽位置:用戶接觸點,接觸點。對於每個用戶接觸點。潛在地包含兩層信息:URL+內容。網址:每個url鏈接(頁面/屏幕)定位壹個互聯網頁面地址或壹個產品的特定頁面。可以是PC上某個電子商務網站的頁面網址,也可以是手機上微博、微信等應用的功能頁面,或者是某個產品應用的特定屏幕。比如長城葡萄酒單品頁面,微信訂閱號頁面,某遊戲的清倉頁面。
內容:每個url的URL(頁面/屏幕)中的內容。可以是單品的相關信息:類別、品牌、描述、屬性、網站信息等等。比如紅酒、長城、幹紅,對於每個互聯網接觸點來說,URL決定了權重;內容決定標簽。
註:接觸點可以是網站,也可以是產品的某個特定功能界面。比如同樣壹瓶礦泉水,超市賣1元,火車賣3元,景區賣5元。商品的銷售價值不在於成本,而在於銷售地點。標簽都是礦泉水,只是接觸點不同反映的重量不同。這裏的重量可以理解為用戶對礦泉水的不同需求。也就是他們願意付出的價值不壹樣。
標簽重量
礦泉水1 //超市
礦泉水3 //火車
礦泉水5 //景區
同樣,用戶在JD.COM商城瀏覽葡萄酒信息與在尚品葡萄酒網瀏覽葡萄酒信息是不同的,顯示了他們對葡萄酒的偏好。這裏的重點是在不同的網站上,權重是有區別的。權重模型的構建需要根據各自的業務需求來構建。
所以URL本身就代表了用戶的標簽偏好權重。對應於URL的內容反映了標簽信息。
這是什麽?用戶行為類型對於電商來說有以下幾種典型行為:瀏覽、添加購物車、搜索、評論、購買、點擊喜歡、收藏等等。
不同的行為類型對於由接觸點的內容生成的標簽信息具有不同的權重。比如購買權重為5,瀏覽權重為1。
紅酒1 //瀏覽紅酒
紅酒5 //買紅酒
基於以上分析,用戶畫像的數據模型可以概括為以下公式:用戶身份+時間+行為類型+接觸點(網站+內容),用戶在何時何地做了什麽。所以才會貼上* *的標簽。
例如,用戶A昨天在尚品葡萄酒網上瀏覽了壹瓶價值238元的長城幹紅葡萄酒。
標簽:紅酒,長城
時間:因為是昨天的行為,假設衰減因子為:r=0.95。
行為類型:瀏覽行為記錄為權重1。
地點:JD.COM葡萄酒菜單頁面網站的子權重為0.9(相比之下,尚品葡萄酒菜單頁面的子權重為0.7)。
假設用戶真的喜歡紅酒,會去專業的紅酒網購買,而不是在綜合商城購買。
那麽用戶偏好標簽為:紅酒,權重為0.95*0.7 * 1=0.665,即用戶A:紅酒0.665,長城0.665。
以上模型權重的選取只是壹個可供參考的例子,具體權重需要根據業務需求進行兩次建模。這裏強調的是如何從整體的角度建立用戶畫像模型,然後逐步細化模型。
本文不涉及具體算法,而是闡述壹種分析思路,可以為妳在規劃建立用戶畫像時提供壹個系統化、框架化的思維指導。
核心在於對用戶接觸點的理解,接觸點的內容直接決定了標簽信息。內容地址、行為類型、時間衰減決定了權重模型是關鍵,權重值的二次建模本身就是自然的推進。比如模型強調電商,但實際上可以根據不同的產品重新定義接觸點。
比如影視產品,我看了壹部電影《英雄本色》,可能的標簽是:周潤發0.6,槍戰0.5,港臺0.3。最後,接觸點本身不壹定有內容,也可以概括為某個閾值,某個行為超過了多少次,用了多長時間等等。
比如遊戲產品,典型的接觸點可能是,關鍵任務,關鍵指標(分數)等等。比如分數超過10000,就會被標記為鉆石用戶。鉆石用戶1.0。
Percent目前已經在推薦引擎中全面應用了用戶畫像技術。在某電商客戶和活動頁面新訪客的應用中,依托用戶畫像產生的個性化效果,與熱賣榜相比,推薦效果得到了顯著提升:推薦欄目點擊率提升了27%,訂單轉化率提升了34%。
金融企業內部的信息分布在不同的系統中。壹般來說,人口統計信息主要集中在客戶關系管理系統,信用信息主要集中在交易系統和產品系統,也集中在客戶關系管理系統。消費特征主要集中在渠道和產品體系上。
愛好和社會信息需要從外部引入。比如客戶的行為軌跡可以代表他們的興趣愛好和品牌愛好,移動設備的位置信息可以提供更準確的愛好信息。社交信息可以借助金融行業本身的文本挖掘能力進行收集和分析,也可以借助廠商的技術能力直接在社交網站上獲取。社交信息往往是商業價值高、轉化率高的實時信息,是大數據預測的主要信息來源。比如,用戶在社交網站上提出羅馬哪裏好玩的問題,說明用戶未來可能有出國旅遊的需求;如果客戶是在比較兩款車的優秀程度,那麽客戶更有可能買車。金融企業可以及時介入,為客戶提供金融服務。
客戶畫像數據主要分為五類,包括人口統計屬性、信用信息、消費特征、興趣愛好和社交信息。這些數據分布在不同的信息系統中,金融企業都在數據倉庫(DW)中在線。所有與畫像相關的強相關信息都可以從數據倉庫中進行整理和集中,並根據畫像的業務需求,利用批處理操作和處理數據,生成用戶畫像的原始數據。
數據倉庫已經成為用戶畫像數據的主要處理工具,根據業務場景和畫像需求對原始數據進行分類、過濾、歸納和處理,生成用戶畫像所需的原始數據。
用戶畫像的緯度信息並不是越多越好。只需要找到關聯性強、與業務場景關聯性強、與產品和目標客戶關聯性強的五大類畫像信息即可。根本沒有360度的用戶畫像信息,也沒有豐富的信息去全面了解客戶。此外,還應考慮數據的有效性。
根據用戶畫像原理,所有的畫像信息都應該與五大類強相關。強相關信息是指與業務場景強相關的信息,可以幫助金融行業定位目標客戶,了解客戶的潛在需求,開發所需產品。
只有強大的相關信息才能幫助金融企業有效結合業務需求,創造業務價值。比如姓名、手機號、家庭住址是可以觸達客戶的強人口統計信息,收入、學歷、職業、資產是客戶征信的強關聯信息。遊客、海外遊客、汽車用戶、遊客、母親、嬰兒是消費特征的強相關信息。攝影愛好者、遊戲愛好者、健身愛好者、電影人群、戶外愛好者是客戶興趣愛好的強關聯信息。在社交媒體上發布的出行需求、出行攻略、金融咨詢、用車需求、房產需求等信息,代表了用戶的內心需求,與社交信息場景應用有很強的關聯性。
金融企業內部信息很多,在用戶畫像階段不需要使用所有信息,只需要使用與業務場景和目標客戶強相關的信息,有助於提高產品轉化率,降低投資回報率(ROI),有助於簡單找到業務應用場景,在數據實現過程中也容易實現。
不要把用戶畫像工作做的太復雜,和業務場景關系不大。這會讓很多金融企業,尤其是領導者,對用戶畫像失去興趣,看到用戶畫像的生意,不願意投入大數據領域。為企業帶來商業價值是用戶畫像工作的主要動機和目的。
金融企業在收集完所有信息後,需要根據業務需求對量化信息進行分類篩選。這部分工作建議在數據倉庫中進行,不建議在大數據管理平臺(DMP)中處理。
定性信息的定量分類是用戶畫像的重要組成部分,對業務場景要求高,考驗用戶畫像業務需求的轉化。其主要目的是幫助企業簡化復雜的數據,對交易數據進行定性分類,並整合商業分析的要求對數據進行商業化處理。比如客戶可以分為學生、青年、青年、中年、中年、老年等人生階段。源於不同人生階段的金融服務需求是不同的。在尋找目標客戶時,可以通過人生階段進行目標客戶定位。企業可以根據客戶的收入、學歷、資產等將客戶分為低、中、高端客戶,根據客戶的金融服務需求提供不同的金融服務。可以參考其金融消費記錄和資產信息,以及交易產品和購買產品,定性描述客戶消費特征,區分電商客戶、理財客戶、保險客戶、穩健型投資客戶、進取型投資客戶、餐飲客戶、旅遊客戶、高端客戶、公務員客戶等。外部數據可以用來識別客戶的興趣愛好,比如戶外愛好者、奢侈品愛好者、科技產品愛好者、攝影愛好者、高端汽車需求者等信息。
將定量信息歸納為定性信息,並根據業務需求進行標註,有助於金融企業尋找目標客戶,了解其潛在需求,為金融行業的產品找到目標客戶,進行精準營銷,降低營銷成本,提高產品轉化率。此外,金融企業還可以根據客戶的消費特點、興趣愛好和社會信息,及時推薦產品、設計產品、優化產品流程。提高產品銷售的活躍率,幫助金融企業更好地為客戶設計產品。
使用數據進行畫像的目的是為業務場景提供數據支持,包括找到產品的目標客戶和觸達客戶。金融企業自身的數據不足以了解客戶的消費特征、興趣愛好和社會信息。
金融企業可以引入外部信息豐富客戶畫像信息,如銀聯和電商的信息豐富消費特征信息,移動大數據的位置信息豐富客戶興趣信息,外部廠商的數據豐富社會信息。
外部信息的緯度多,內容豐富,但如何引入外部信息是壹項具有挑戰性的任務。在引入外部信息時,需要考慮幾個問題,即外部數據的覆蓋範圍,如何與內部數據打通,與內部信息的匹配率,信息關聯度,數據的新鮮度。這些是引入外部信息的主要考慮因素。外部數據良莠不齊,數據的合規性也是金融企業在引入外部數據時的重要考慮因素。手機號、家庭住址、身份證號等敏感信息,在介紹或匹配時要註意隱私問題。基本原理是不需要數據交換就可以進行數據匹配和驗證。
外部的數據不會集中在壹家公司,這就需要金融企業花費大量的時間去尋找。打通外部數據和內部數據是壹個非常復雜的問題。手機號/設備號/身份證號的MD5數值匹配是個好方法,不涉及私密數據的交換,可以唯壹匹配。根據行業內的經驗,沒有壹個企業的外部數據能夠滿足企業的要求,外部數據的引入需要各種數據。總的來說,數據覆蓋率在70%以上,是非常高的覆蓋率。當覆蓋率達到20%以上,就可以商用了。
金融行業外部數據源的好夥伴有銀聯、芝麻信用、運營商、中國航空、雲騰天下、騰訊、微博、前海征信、各大電商平臺等。市場上有很多數據提供商,數據質量不錯。金融業有必要壹個壹個挖掘,或者委托壹個廠商引進。獨立第三方幫助金融行業引入外部數據是壹個很好的嘗試,可以降低數據交易成本和數據合規風險。此外,各大城市和地區的大數據交易平臺也是引入外部數據的好方法。
用戶畫像的主要目的是讓金融企業挖掘現有的數據價值,利用數據畫像技術發現目標客戶和客戶的潛在需求,並推廣產品和設計改進產品。
用戶畫像是商業場景數據實現商業變現的重要途徑。用戶畫像是數據思維運營過程中的重要閉環,有助於金融企業利用數據進行精細化運營、營銷和產品設計。用戶畫像全是數據的商業化運營,聚焦業務場景,幫助金融企業深度分析客戶,尋找目標客戶。
DMP(大數據管理平臺)在整個用戶畫像過程中起到數據變現的作用。從技術角度,DMP對畫像數據進行標簽化,利用機器學習算法尋找相似人群,與商業場景深度結合,篩選出有價值的數據和客戶,定位目標客戶,觸達客戶,記錄並反饋營銷效果。大數據管理平臺DMP過去主要用於廣告行業,在金融行業沒有應用,未來將成為數據業務應用的主要平臺。
DMP可以幫助信用卡公司篩選出未來壹個月可能分期付款的客戶、大量購買電子產品的客戶、理財客戶、高端客戶(在我行資產很少,在其他銀行資產很多)、保險、壽險、教育保險、車險等客戶、穩健型投資者、激進型投資者、理財等客戶,並可以接觸到這些客戶,提高產品轉化率,利用數據進行。DMP還可以了解客戶的消費習慣、興趣愛好、近期需求,為客戶定制金融產品和服務,進行跨界營銷。利用客戶的消費偏好,提高產品轉化率和用戶粘度。
作為引入外部數據的平臺,DMP還將外部有價值的數據引入金融企業,補充用戶畫像數據,打造不同的業務應用場景和業務需求,尤其是移動大數據、電商數據和社交數據的應用,可以幫助金融企業實現數據價值,讓用戶畫像更貼近商業應用,體現用戶畫像的商業價值。
用戶畫像的關鍵不是360度分析客戶,而是給企業帶來商業價值。沒有商業價值,談用戶畫像就是耍流氓。金融企業用戶畫像項目的出發點壹定是從業務需求出發,從強大的相關數據出發,從業務場景的應用出發。用戶畫像的本質是深度分析客戶,掌握有價值的數據,找到目標客戶,根據客戶需求定制產品,利用數據實現價值實現。
銀行擁有豐富的交易數據、個人屬性數據、消費數據、信用數據和客戶數據,對用戶畫像的需求很大。但是缺乏社會信息和興趣信息。
來銀行網點辦理業務的人年齡偏大,消費者以後主要在網上辦理業務。銀行無法觸達客戶,無法了解客戶需求,也缺乏觸達客戶的手段。分析客戶,了解客戶,尋找目標客戶,為客戶設計產品,成為銀行用戶畫像的主要目的。銀行的主要業務需求集中在消費金融、財富管理和融資服務。用戶畫像要從這些角度尋找目標客戶。
銀行的客戶數據非常豐富,種類多,數據總量大,系統多。可以嚴格按照用戶畫像五步走。首先,利用數據倉庫對數據進行濃縮,篩選出相關性強的信息,對定量信息進行表征,生成DMP需要的數據。使用DMP定制基礎標簽和應用,根據業務場景需求篩選目標客戶或深度分析用戶。同時利用DMP引入外部數據,完善數據場景設計,提高目標客戶的精準性。想辦法觸達客戶,營銷客戶,反饋營銷效果,衡量數據產品的商業價值。利用反饋數據糾正營銷活動,提高投資回報率。形成營銷閉環,實現數據商業價值變現閉環。此外,DMP可以深度分析客戶,根據客戶的消費特征、興趣愛好、社交需求、信用信息等開發設計產品,為金融企業的產品開發提供數據支持,為產品銷售方式提供場景數據。
簡單介紹壹下DMP可以實現的壹些數據場景。
尋找分期付款的顧客
利用發卡行數據+自身數據+信用卡數據,發現信用卡消費超過月收入的用戶,推薦分期消費。
尋找高端資產客戶
利用發卡行數據+移動位置數據(別墅/高檔小區)+物業費代扣數據+銀行自有數據+車模數據,發現在銀行資產較少,在其他銀行資產較多的用戶提供高端資產管理服務。
尋找財富管理客戶
利用自己的數據(交易+薪資)+移動金融客戶端/電商活躍數據。發現把工資/資產轉移到外面,但電商消費不活躍的客戶,互聯網理財的可能性更大,可以給他們提供理財服務,把資金留在銀行。
尋找海外旅遊客戶
利用自己的用卡消費數據+移動設備位置信息+社交好海外相關數據(攻略、路線、景點、費用)尋找海外旅遊客戶,提供金融服務。
尋找貸款客戶
利用自己的數據(人口統計屬性+征信)+移動設備位置信息+社交購房/強消費相關信息,找到即將買車/買房的目標客戶,為他們提供金融服務(房貸/消費貸款)。
來源:錢塘大數據二次整理,TalkingData包仲鐵原始資料來源,