當前位置:吉日网官网 - 傳統故事 - 大數據的四個典型特征

大數據的四個典型特征

大數據的四個典型特征

大數據是指“現有軟件工具無法提取、存儲、搜索、* * * *享受、分析和處理的海量復雜數據集。”業界通常用四個V(即體量、種類、價值和速度)來概括大數據的特征。

壹個是巨大的數據量。到目前為止,人類生產的所有印刷品的數據量為200PB(1PB=210TB),而人類在歷史上所說的所有文字的數據量約為5EB(1EB=210PB)。目前典型的個人電腦硬盤容量在TB量級,而壹些大型企業的數據量接近EB量級。

第二是數據類型的多樣性。這種多樣性也使得數據分為結構化數據和非結構化數據。與過去易於存儲的基於文本的結構化數據相比,現在的非結構化數據越來越多,包括web日誌、音頻、視頻、圖片、地理位置信息等。這些類型的數據對數據處理能力提出了更高的要求。

第三,價值密度低。價值密度與數據總量成反比。以視頻為例,壹個1小時的視頻,在持續監控中可能只有壹兩秒的有用數據。如何通過強大的機器算法更快地“凈化”數據的價值,成為大數據背景下亟待解決的問題。

第四是處理速度快(速度)。這是大數據區別於傳統數據挖掘的最顯著特征。根據IDC的《數字宇宙》報告,預計到2020年,全球數據使用量將達到35.2ZB,面對如此海量的數據,處理數據的效率就是壹個企業的生命。

  • 上一篇:基金從業資格考試有多難?如何備考?
  • 下一篇:女生上衛校容易找工作嗎?
  • copyright 2024吉日网官网