大數據的四個特征
1,大容量
例如,IDC最近的報告預測,到2020年,世界數據量將擴大50倍。目前大數據的規模還是壹個不斷變化的指標,單個數據集的規模從幾十TB到幾Pb不等。簡單來說,需要2萬臺配備50GB硬盤的PC來存儲1PB的數據。此外,各種意想不到的來源可以生成數據。
2.多樣性
。
數據多樣性的增加主要是由於網絡日誌、社交媒體、網絡檢索、手機通話記錄和傳感器網絡等數據類型。
3.高速的
高速描述了數據創建和移動的速度。在高速網絡時代,通過優化軟件性能的高速計算機處理器和服務器來創建實時數據流已經成為壹種流行趨勢。企業不僅要知道如何快速創建數據,還要知道如何快速處理、分析和返回用戶,滿足用戶的實時需求。
4.變化性
。
大數據具有多層結構,這意味著大數據呈現多種形式和類型。與傳統的業務數據相比,大數據具有不規則性和模糊性,很難用傳統的應用程序進行分析。隨著時間的推移,傳統的業務數據具有標準的格式,並且可以被標準的商業智能軟件識別。目前,企業面臨的挑戰是從以各種形式呈現的復雜數據中處理和提取價值。
大數據的三個特征
首要特點是數據類型多,包括網絡日誌、音頻、視頻、圖像、地理信息等,對數據處理能力提出了更高的要求。
第二個特點是數據值密度比較低。隨著物聯網的廣泛應用,信息感知無處不在,信息量巨大,但價值密度低。如何通過強大的機械算法更快的完成數據的價值提純,是大數據時代必須解決的難題。
第三個特點是處理速度快,時效性高,這是大數據區別於傳統數據挖掘最顯著的特點。