分析背景說到小紅書,是目前非常熱門的電商平臺。與其他電商平臺不同,小紅書是從社區起家的。在小紅書社區,用戶通過文字、圖片、視頻筆記的分享,記錄了這個時代年輕人的正能量和美好生活。小紅書通過機器學習精準高效地匹配大量信息和人群,積累了大量海外購物數據,分析最受歡迎的商品和全球購物趨勢,並在此基礎上以最短的路徑和最簡潔的方式為用戶提供世界上的好東西。這個項目輔助小紅書分析不同商業決策帶來的銷售變化。分析目標基於用戶數據和消費行為數據,利用Python建立線性回歸模型,預測用戶消費金額的變化,找到對用戶消費影響較大的因素。分析過程數據剖面分析(數據行數和列數、缺失值分布、數據清洗)-單變量分析(數值變量的描述性指標、類別變量(有多少個類別、各自所占比例))-相關性和可視化(按類別交叉比較、變量間的相關性分析、散點圖/熱圖)-回歸模型(模型建立、模型評估和優化)壹、數據概述分析1.1數據概述首次導入數據:#導入數據#導入包Import panda ASPdim portnumpyasnp #讀取數據xhs = pd.readCSV’)xhs . info()gender \ age \ engaged_last_30中有null gender和engaged _ last _ 30數據類型錯誤:應該是對象類型數據***29452行,xhs.head()數據***8列。數據字典如下:xhs.describe()可以看出,營收和previous_order_amount的標準差都比較大。數據可能有異常值1.2數據清洗#統計數據空值xhs.isnull()。sum()#缺少條件xhs.isna()。sum()/xhs.shape#創建組標簽1=#創建組標簽2 = ['
上一篇:硨磲保養有哪些註意事項下一篇:免費下載星海無限小說txt全集。