當前位置:吉日网官网 - 傳統節日 - 什麽是大數據?

什麽是大數據?

中國發展門戶網訊 隨著新壹代信息技術的迅猛發展和深入應用,數據的數量、規模不斷擴大,數據已日益成為土地、資本之後的又壹種重要的生產要素,和各個國家和地區爭奪的重要資源,誰掌握數據的主動權和主導權,誰就能贏得未來。奧巴馬政府將數據定義為“未來的新石油”,認為壹個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,對數據的占有和控制將成為繼陸權、海權、空權之外的另壹個國家核心權力。此後,壹個全新的概念——大數據開始風靡全球。

大數據的概念與內涵

“大數據”的概念早已有之,1980年著名未來學家阿爾文?托夫勒便在《第三次浪潮》壹書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。但是直到近幾年,“大數據”才與“雲計算”、“物聯網”壹道,成為互聯網信息技術行業的流行詞匯。2008年,在谷歌成立10周年之際, 著名的《自然》雜誌出版了壹期專刊,專門討論未來的大數據處理相關的壹系列技術問題和挑戰,其中就提出了“Big Data”的概念。2011年5 月,在“雲計算相遇大數據” 為主題的EMC World 2011 會議中,EMC 也拋出了Big Data概念。所以,很多人認為,2011年是大數據元年。

此後,諸多專家、機構從不同角度提出了對大數據理解。當然,由於大數據本身具有較強的抽象性,目前國際上尚沒有壹個統壹公認的定義。維基百科認為大數據是超過當前現有的數據庫系統或數據庫管理工具處理能力,處理時間超過客戶能容忍時間的大規模復雜數據集。全球排名第壹的企業數據集成軟件商Informatica認為大數據包括海量數據和復雜數據類型,其規模超過傳統數據庫系統進行管理和處理的能力。亞馬遜網絡服務(AWS)、大數據科學家JohnRauser提到壹個簡單的定義:大數據就是任何超過了壹臺計算機處理能力的龐大數據量。百度搜索的定義為:"大數據"是壹個體量特別大,數據類別特別大的數據集,並且這樣的數據集無法用傳統數據庫工具對其內容進行抓取、管理和處理。互聯網周刊的定義為:"大數據"的概念遠不止大量的數據(TB)和處理大量數據的技術,或者所謂的"4個V"之類的簡單概念,而是涵蓋了人們在大規模數據的基礎上可以做的事情,而這些事情在小規模數據的基礎上是無法實現的。換句話說,大數據讓我們以壹種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見,最終形成變革之力。

綜合上述不同的定義,我們認為,大數據至少應包括以下兩個方面:壹是數量巨大,二是無法使用傳統工具處理。因此,大數據不是關於如何定義,最重要的是如何使用。它強調的不僅是數據的規模,更強調從海量數據中快速獲得有價值信息和知識的能力。

大數據4V特征

壹般認為,大數據主要具有以下四個方面的典型特征:規模性(Volume)、多樣性(Varity)、高速性(Velocity)和價值性(Value),即所謂的“4V”。

1.規模性。大數據的特征首先就體現為“數量大”,存儲單位從過去的GB到TB,直至PB、EB。隨著信息技術的高速發展,數據開始爆發性增長。社交網絡(微博、推特、臉書)、移動網絡、各種智能終端等,都成為數據的來源。淘寶網近4億的會員每天產生的商品交易數據約20TB;臉書約10億的用戶每天產生的日誌數據超過300TB。迫切需要智能的算法、強大的數據處理平臺和新的數據處理技術,來統計、分析、預測和實時處理如此大規模的數據。

2.多樣性。廣泛的數據來源,決定了大數據形式的多樣性。大數據大體可分為三類:壹是結構化數據,如財務系統數據、信息管理系統數據、醫療系統數據等,其特點是數據間因果關系強;二是非結構化的數據,如視頻、圖片、音頻等,其特點是數據間沒有因果關系;三是半結構化數據,如HTML文檔、郵件、網頁等,其特點是數據問的因果關系弱。

3.高速性。與以往的檔案、廣播、報紙等傳統數據載體不同,大數據的交換和傳播是通過互聯網、雲計算等方式實現的,遠比傳統媒介的信息交換和傳播速度快捷。大數據與海量數據的重要區別,除了大數據的數據規模更大以外,大數據對處理數據的響應速度有更嚴格的要求。實時分析而非批量分析,數據輸入、處理與丟棄立刻見效,幾乎無延遲。數據的增長速度和處理速度是大數據高速性的重要體現。

4.價值性。這也是大數據的核心特征。現實世界所產生的數據中,有價值的數據所占比例很小。相比於傳統的小數據,大數據最大的價值在於通過從大量不相關的各種類型的數據中,挖掘出對未來趨勢與模式預測分析有價值的數據,並通過機器學習方法、人工智能方法或數據挖掘方法深度分析,發現新規律和新知識,並運用於農業、金融、醫療等各個領域,從而最終達到改善社會治理、提高生產效率、推進科學研究的效果。

大數據六大發展趨勢

雖然大數據目前仍處在發展的起步階段,尚存在著諸多的困難與挑戰,但我們相信,隨著時間的推移,大數據未來的發展前景非常可觀。

1.數據將呈現指數級增長

近年來,隨著社交網絡、移動互聯、電子商務、互聯網和雲計算的興起,音頻、視頻、圖像、日誌等各類數據正在以指數級增長。據有關資料顯示,2011年,全球數據規模為1.8ZB,可以填滿575億個32GB的iPad,這些iPad可以在中國修建兩座長城。到2020年,全球數據將達到40ZB,如果把它們全部存入藍光光盤,這些光盤和424艘尼米茲號航母重量相當。美國互聯網數據中心則指出,互聯網上的數據每年將增長50%,每兩年便將翻壹番,目前世界上90%以上的數據是最近幾年才產生的。

2.數據將成為最有價值的資源

在大數據時代,數據成為繼土地、勞動、資本之後的新要素,構成企業未來發展的核心競爭力。《華爾街日報》在壹份題為《大數據,大影響》的報告宣傳,數據已經成為壹種新的資產類別,就像貨幣或黃金壹樣。IBM執行總裁羅睿蘭認為指出,“數據將成為壹切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。”隨著大數據應用的不斷發展,我們有理由相信大數據將成為機構和企業的重要資產和爭奪的焦點谷歌、蘋果、亞馬遜、阿裏巴巴、騰訊等互聯網巨頭正在運用大數據力量獲得商業上更大的成功,並且將會繼續通過大數據來提升自己的競爭力。

3.大數據和傳統行業智能融合

通過對大數據收集、整理、分析、挖掘, 我們不僅可以發現城市治理難題,掌握經濟運行趨勢,還能夠驅動精確設計和精確生產模式,引領服務業的精確化和增值化,創造互動的創意產業新形態。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。百度、阿裏、騰訊等通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。在智慧城市建設不斷深入的情況下,大數據必將在智慧城市中發揮越來越重要的作用。由城市數字化到智慧城市,關鍵是要實現對數字信息的智慧處理,其核心是引入了大數據處理技術,大數據將成為智慧城市的核心智慧引擎。智慧金融、智慧安防、智慧醫療、智慧教育、智慧交通、智慧城管等,無不是大數據和傳統產業融合的重要領域。

4.數據將越來越開放

大數據是人類的***同資源、***同財富,數據開放***享是不可逆轉的歷史潮流。隨著各國政府和企業對開放數據帶來的社會效益和商業價值認識的不斷提升,全球必將很快掀起壹股數據開放的熱潮。事實上,大數據的發展需要全世界、全人類的***同協作,變私有大數據為公***大數據,最終實現私有、企業自有、行業自有的全球性大數據整合,才不至形成壹個個毫無價值的“數據孤島”。大數據越關聯越有價值,越開放越有價值。尤其是公***事業和互聯網企業的數據開放數據將越來越多。目前,美歐等發達國家和地區的政府都在政府和公***事業上的數據做出了表率。中國政府也將壹方面帶頭力促數據公開***享,另壹方面,還通過推動建設各類大數據服務交易平臺,為數據使用者提供豐富的數據來源和數據的應用。

5.大數據安全將日受重視

大數據在經濟社會中應用日益廣泛的同時,大數據的安全也必將受到更多的重視。大數據時代,在我們用數據挖掘和數據分析等大數據技術獲取有價值信息的同時,“黑客”也可以利用這些大數據技術最大限度地收集更多有用信息,對其感興趣的目標發起更加“精準的”攻擊。近年來,個人隱私、企業商業信息甚至是國家機密泄露事件時有發生。對此,美歐等發達國家紛紛制定完善了保護信息安全、防止隱私泄露等相關法律法規。可以預見,在不久的將來,其他國家也會迅速跟進,以更好地保障本國政府、企業乃至居民的數據安全。

6.大數據人才將備受歡迎

隨著大數據的不斷發展及其應用的日益廣泛,包括大數據分析師、數據管理專家、大數據算法工程師、數據產品經理等在內的具有豐富經驗的數據分析人員將成為全社會稀缺的資源和各機構爭奪的人才。據著名國際咨詢公司Gartner預測,2015年全球大數據人才需求將達到440萬人,而人才市場僅能夠滿足需求的三分之壹。麥肯錫公司則預測美國到2018年需要深度數據分析人才44萬—49萬,缺口為14萬—19萬人。有鑒於此,美國通過國家科學基金會,鼓勵研究性大學設立跨學科的學位項目,為培養下壹代數據科學家和工程師做準備,並設立培訓基金支持對大學生進行相關技術培訓,召集各個學科的研究人員***同探討大數據如何改變教育和學習等。英國、澳大利亞、法國等國家也類似地對大數據人才的培養做出專項部署。IBM 等企業也開始全面推進與高校在大數據領域的合作,力圖培養企業發展需要的既懂業務知識又具分析技能的復合型數據人才。(武鋒:國家信息中心)

  • 上一篇:中國戲曲學院舞臺美術培養方案
  • 下一篇:傳統車企的油價政策是怎樣的?
  • copyright 2024吉日网官网