2014年是阿裏巴巴集團移動電商業務快速發展的壹年,例如2014雙11大促中移動端成交占比達到42.6%,超過240億元。相比PC時代,移動端網絡的訪問是隨時隨地的,具有更豐富的場景數據,比如用戶的位置信息、用戶訪問的時間規律等。
通過數據分析,能夠挖掘數據背後豐富的內涵,為移動用戶在合適的時間、合適的地點精準推薦合適的內容。
本案例的目標是從該數據進行隨機抽樣,並用mysql進行分析,提高自己對電商指標體系的認識。
1、字段說明
1、提出問題:
1)分析用戶購物過程中的常見監控指標,了解運營現狀,查看各環節的漏鬥轉化情況,並找到需要改進的節點;
2)研究用戶在不同維度下的行為規律,了解用戶行為特征,優化運營策略;
3)利用RFM模型對用戶進行分類,指導運營針對不同價值用戶進行精細化運營;
4)了解用戶生命周期,針對不同周期的用戶采取不同的運營策略。
2、指標和字段解讀
通過用戶和用戶行為路徑可以分析PV、UV、PV/UV、跳失率、總訂單量等運營指標;
通過用戶行為和時間可以分析用戶的購物行為特征;
通過用戶和商品、商品類別可以分析用戶的購買商品偏好;用戶和時間可以分析用戶的購買時間偏好,便於對不同商品和時間偏好的用戶采取個性化時間推薦(push、短信等推送);
通過商品類別和用戶行為可以分析不同商品類別受歡迎程度,指導運營進行商品的上新或下架;
通過商品類別和時間可以分析不同商品類別的熱銷時間段,便於做活動的推廣;
結合AARRR模型,可以分析用戶的生命周期,劃分不同用戶所處的周期階段,采用差異化運營;
通過時間和用戶的生命周期字段,結合RFM模型可以給用戶做價值分類,對客戶進行差異化管理。
(查看數據清洗流程: /p/adb82624df14 )
將csv導入mysql的方法:
切換命令行菜單: /article/f00622280752dbfbd3f0c815.html
導入數據: /qq_25504271/article/details/78911151
1)選擇子集
導入之前已選擇好
2)列名重命名
無需更改列名
3)數據類型轉換
可以在設計表菜單欄更好數據類型
4)數據去重
存在重復值,但由於同壹用戶同壹個行為在壹小時內是可能存在多次的,因此這裏不做去重處理。
5)缺失值處理
經查詢,無缺失值
6)關聯數據
由於只有壹個表格,無需做表關聯(如果需要關聯,可以到分析過程中有需要時進行關聯,這樣會提高MySQL的性能。
7)異常值處理
無需處理異常值
8)數據標準化整理
日期數據整理:
為方便後續的分析,將日期數據分為日期和時間兩個維度
行為數據整理:
將用戶行為數據進行替換: 1:pv 2:fav 3:cart 4:buy
以上就完成了數據的整理工作。
1)流量指標:
計算頁面訪客數(pv)、獨立訪客數(uv)、人均點擊數(uv/pv)
頁面訪客:987911次、獨立訪客數:8474位、人均點擊次數116.58次。
95/30≈3.89次,日人均點擊次數大概為3.89次/人/天
2)每日流量指標變化趨勢
通過Navicat導出數據進行可視化處理:
pv、uv指標呈正相關性;
三個指標在大部分時間走勢平穩,由於雙十二的影響,從2014-12-11開始上升,到2014-12-12達到峰值,2014-12-13結束回到正常水平。
1)按照頁面訪客計算漏鬥轉化率
由於在購物環節中,收藏和加入購物車行為沒有嚴格的先後之分,可將兩個個步驟作為同壹步,最終得到用戶購物行為各環節轉化率,如下:
從整體轉化率來看: 瀏覽- 收藏/加購轉化率僅為5%,總體購買轉化率為1%,說明有大部分的用戶在瀏覽後未進行下壹步操作,平時“逛街看看”成為壹種習慣;
從節點轉化率來看: 瀏覽-加購/收藏環節轉化率很低,收藏/加購-購買的轉化率也只有20%,說明有相當壹部分用戶是喜歡“囤貨”,可能是為了等節假日購買?由於整體的節點並不是最細的不可分割節點,整體的數據比較粗糙,如果需要進壹步的深入分析,需要有更細的轉化率數據(由於操作路徑每個環節都會損失壹部分,因此如果能近量的較少客戶購買時所需要的操作步驟,對提升整體轉化率應該會有很好的提高)。
2)獨立訪客計算漏鬥轉化率
用戶每個環節的轉化率差不多,需要更多數據才能發現用戶流失原因。
3)、跳失率
瀏覽頁跳失率: = 只訪問壹次就離開的人數/總用戶數
只加收藏、購物車人數
1)總成交量和人均購買次數:
2)每日總成交和人均成交情況:
1)總體復購率
復購率=復購人數/購買人數=2295/4330=53%
2)商品品類銷量排名(商品復購率)
如果有更多數據,可根據商品品類屬性進行研究和下鉆,優化商品結果,但這裏因為數據脫敏無法進行下鉆分析
3)用戶復購排名
以上用戶對平臺的忠誠度比較高,對平臺的銷售貢獻度也高(利潤貢獻情況還需要具體分析),對不同的客戶可以收集相應的用戶畫像,並對用戶進行分層管理和營銷,從而達到精細化運營
1)、按日期維度
用戶活躍度與總體點擊數是正相關的,走勢平穩,不過在雙十二電商大促這天各項指標暴增,且當天點擊數占比有所下降(用戶的點擊更有針對性,前期已經選好商品,就等雙十二當天直接購買的客戶數量比較多?), 成交數占比大幅上升。
2)、周維度
壹周中的大部分時間用戶活躍度都比較平穩,周五比較特殊,出現了增長( 查看數據發現雙十二正好是周五,屬於特殊活動日,如果進行詳細分析時應該將雙十二的日期排除分析有更有意義)。
3)、小時維度
晚間用戶較為活躍,但用戶行為傾向於瀏覽;白天尤其是中午左右的時段,購買行為的比率相對壹天中最高,此時購買的目的性最強(瀏覽數占比與購買數占比進行關聯分析得出結論)。
按照商品品類區分( 矩陣分析 ),根據點擊次數和購買次數兩個維度將所有商品劃分到四個象限:
點擊數高,購買數高。說明此類產品剛需比較強,品牌多且種類豐富,用戶在較高的需求下有很多的選擇;
點擊數低購買數高。用戶的購買決策十分果斷,且對於該類產品的需求量也是很大的,說明該類產品選擇性比較小,可能形成幾個品牌壟斷的情況,或者產品的差異性較小,用戶不願花費過多的精力去挑選。
點擊數低購買數低,絕大多數產品都集中在這個象限,這種產品存在很多的替代品,用戶很難集中在某個子類進行大量購買,而是跳躍式選購。
點擊數高購買數低,這類產品的需求彈性較大,用戶購買存在隨機性。
用戶購買商品分為以下幾類過程:
直接購買
瀏覽後購買
加購物車購買
瀏覽加購物車購買
收藏購買
瀏覽收藏購買
結果顯示,直接夠買的用戶遠遠多於瀏覽後加購或者收藏再購買的用戶,說明大部分購買者都是喜歡直接購買商品的,這個跟周圍朋友的習慣也是符合的,基本上都是在瀏覽的階段都不會馬上購買,而是等到過段時間想買的時候就直接下單,幾個步驟之間相當於是分開的。
用戶的購買次數大部分集中在5次以內,購買頻率都還挺高的