1.定義問題
確定妳需要的問題和妳想要得出的結論。可以考慮的選項很多,要根據業務來判斷。常見的有:變化趨勢、用戶畫像、影響因素、歷史數據等。
2.數據采集
獲取數據的方法有很多:
壹是直接從企業數據庫中檢索,需要SQL技能來完成數據抽取等數據庫管理。
二是獲取公共數據,如政府、企業、統計局等機構。
三是通過Python寫壹個網絡爬蟲。
3.數據預處理
清理不完整、重復等異常數據。
4.數據分析和建模
這部分需要了解基本的統計分析方法和數據挖掘算法,了解不同統計方法的適用場景和適用問題。
5.數據可視化和分析報告編寫
學習壹個可視化工具,通過可視化最直觀的展現數據。
開始數據分析所需的技能包括:
1.SQL(數據庫):
如何從數據庫中獲取數據?如何獲取自己想要的具體數據?這些問題是妳首先要考慮的,而這些問題都是用SQL來解決的,所以SQL是數據分析最基本的技能。
2.擅長
分析師更傾向於分析數據。在分析數據的時候,他們需要把數據放到壹個文件裏,這個文件就是excel。
精通excel常用公式,學會做透視表,什麽數據都可以畫圖表。
3.3的基礎。Python或R:
必要項也是加分項,是數據挖掘方向的必要項。與工具相比,這種語言更加靈活和實用。
4.學習可視化工具
如果想發展到更高的層次,以上的東西最多只占20%,剩下的80%是理解業務的能力,分解目標的能力,根據數據要求學習更多新技能的能力。