1,數據量巨大
隨著互聯網行業的發展,在日常運營中產生和積累了大量用戶網絡行為的數據。比如社交電商平臺每天產生的訂單,社區發布的短視頻、論壇、帖子、評論、小視頻,每天發送的郵件,上傳的圖片、視頻、音樂。
這些無數個體產生的數據是巨大的,數據量早已達到PB級別或以上。這麽大規模的數據想要進行處理、分析和統計,需要有足夠大的容量,所以大數據的壹大特點就是體量巨大。
2.各種數據形式。
廣泛的數據來源決定了大數據形式的多樣性。任何形式的數據都可以發揮作用。目前應用最廣泛的推薦系統有淘寶、網易雲音樂、今日頭條等。這些平臺會通過分析用戶的日誌數據,進壹步推薦用戶喜歡的東西。
日誌數據是明顯結構化的數據,有些數據是沒有明顯結構化的,比如圖片、音頻、視頻等。這些數據因果關系弱,需要人工標註。
3.高速的
大數據的高速意味著數據增長快,處理快。每天,各行各業的數據都在呈指數級增長。很多場景下,數據是有時效性的,比如搜索引擎需要在幾秒鐘內呈現用戶需要的數據。面對快速增長的海量數據,企業或系統必須快速處理和響應。
4.低值密度
大數據的價值密度低,意味著在海量的數據源中,真正有價值的數據少之又少,很多數據可能是錯誤的、不完整的、不可用的。總的來說,有價值的數據在總數據中的密度極低,提煉數據就像在海浪中淘沙。
5.高商業價值
與傳統的小數據相比,大數據的最大價值在於從大量不相關的數據中挖掘出對未來趨勢和模式預測分析有價值的數據,並通過機器學習方法、人工智能方法或數據挖掘方法進行深度分析。
發現新規律、新知識並應用到農業、金融、醫療等領域,最終達到改善社會治理、提高生產效率、促進科學研究、實現其商業價值的效果。