Data)通常用來描述數字時代產生的大量非結構化和半結構化數據。大數據無疑是影響未來各行各業發展的最引人註目的技術之壹。2009年,全球關於大數據的研究項目還非常有限。從2011開始,越來越多的管理者開始意識到大數據將是未來發展中不可回避的問題,到2012年底,世界財富500強。
90%的強勢企業都啟動了大數據項目。IDC的研究表明,到2015年,大數據的市場前景將達到169億美元。目前所有企業的經營數據每1.2年就會翻壹番。
那麽大數據為什麽會成為大家關註的焦點呢?大數據帶來了什麽樣的本質變化?為此,采訪了中國計算機聯合會大數據學科帶頭人、中國人民大學信息學院院長杜教授。
互聯網是壹個神奇的大網絡,大數據開發和軟件定制也是壹個模式。這裏是最詳細的報價。如果妳真的想做,妳可以來這裏。這個技能的起始號是187,中間是三個孩子。
最後壹個是14250,按順序組合就能找到。我想說的是,除非妳想做或者了解這個內容,否則不要來,如果妳只是來湊熱鬧的話。
杜教授認為,大數據帶來了三個根本性的變化:第壹,大數據讓人們擺脫了對算法和模型的依賴,數據本身可以幫助人們接近事情的真相;第二,大數據弱化了因果關系。大數據分析可以挖掘出不同元素之間的關聯。人們不需要知道這些元素為什麽相關,所以他們可以使用結果。在信息復雜的現代社會,這樣的應用將大大提高效率。第三,與之前的數據庫相關技術相比,大數據可以處理半結構化或非結構化的數據。這將使計算機可以分析的數據範圍迅速擴大。
2、傳統數據和大數據的區別
首先,在大數據出現之前,計算機科學非常依賴模型和算法。人們要想得到準確的結論,需要建立壹個描述問題的模型,同時需要理順邏輯,了解因果,設計精巧的算法,得出接近現實的結論。所以壹個問題能否得到最好的解決,取決於建模是否合理,各種算法的競爭成為成敗的關鍵。但是大數據的出現,徹底改變了人們對建模和算法的依賴。比如,假設有壹個算法A解決了壹個問題。
而算法b,在小數據量運行時,算法A的結果明顯好於算法b,也就是說,就算法本身而言,算法A能帶來更好的結果;但是發現當數據量越來越大時,算法B在大量數據中運行的結果要優於算法A在少量數據中運行的結果。這壹發現給計算機科學和計算機衍生科學都帶來了裏程碑式的啟示:當數據越來越大時,數據本身(而不是用來研究數據的算法和模型)保證了數據分析結果的有效性。即使沒有精確的算法,只要有足夠的數據,也能得到接近事實的結論。因此,數據被譽為新的生產力。
第二,在數據足夠多的情況下,不知道具體的因果關系也能得出結論。
比如谷歌
在幫用戶翻譯的時候,並不是在設置各種語法和翻譯規則。而是利用谷歌數據庫中收集的所有用戶的用詞習慣進行對比和推薦。谷歌檢查所有用戶的寫作習慣,並向用戶推薦最常用和最常用的翻譯方法。在這個過程中,計算機可能不知道問題的邏輯,但是當用戶行為的記錄數據越來越多的時候,計算機可以在不知道問題邏輯的情況下提供最可靠的結果。可見,海量的數據和處理這些數據的分析工具,提供了壹種全新的認識世界的方式。
第三,由於可以處理多種數據結構,大數據可以最大限度地利用互聯網上記錄的人類行為數據進行分析。在大數據出現之前,所有計算機能夠處理的數據都需要在前期進行結構化,並記錄在相應的數據庫中。而大數據技術對數據的結構要求大大降低。人們在互聯網上留下的各種維度的信息,如社交信息、地理位置信息、行為習慣信息、偏好信息等,都可以實時處理,立體完整地勾勒出每個個體的各種特征。