什麽是數據分析?
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,未提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
數據分析包含“數據”和“分析”兩個方面壹方面包括手機、加工和整理數據,另壹方面也包括分析數據,從中提取有價值的信息並形成對業務有幫助的結論。
數據分析的成果通常以分析報告的形式呈現。對於數據分析報告,分析就是論點,數據就是論據,兩者缺壹不可。
傳統數據分析與大數據分析的三方面異同:
第壹,在分析方法上,兩者並沒有本質不同。
數據分析的核心工作是人對數據指標的分析、思考和解讀,人腦所能承載的數據量是極其有限的。所以,無論是“傳統數據分析”,還是“大數據分析”,均需要將原始數據按照分析思路進行統計處理,得到概要性的統計結果供人分析。兩者在這個過程中是類似的,區別只是原始數據量大小所導致處理方式的不同。
第二,在對統計學知識的使用重心上,兩者存在較大的不同。
“傳統數據分析”使用的知識主要圍繞“能否通過少量的抽樣數據來推測真實世界”的主題展開。“大數據分析”主要是利用各種類型的全量數據(不是抽樣數據),設計統計方案,得到兼具細致和置信的統計結論。
第三,與機器學習模型的關系上,兩者有著本質差別。
“傳統數據分析”在大部分時候,知識將機器學習模型當黑盒工具來輔助分析數據。而“大數據分析”,更多時候是兩者的緊密結合,大數據分析產出的不僅是壹份分析效果測評,後續基於此來升級產品。在大數據分析的場景中,數據分析往往是數據加墨的前奏,數據建模是數據分析的成果。