豐富的數據源是大數據產業發展的前提。而我國數字數據資源總量遠低於美國和歐洲,新增數據量僅為美國的7%,歐洲的12%,其中政府和制造業的數據資源積累遠遠落後於國外。就有限的數據資源而言,仍然存在標準化程度低、準確性低、完整性低、利用價值低的情況,大大降低了數據的價值。
挑戰2:建立數據挖掘分析模型
步入大數據時代,人們都在談論大數據,這似乎已經演變成壹種新的趨勢。數據比以往任何時候都更加植根於我們生活的每個角落。我們試圖用數據解決問題,改善福利,促進新的經濟繁榮。
挑戰3:數據公開和隱私之間的權衡
數據應用的前提是數據是開放的,這已經是* * *學問了。有專業人士指出,中國人口世界第壹,但2010年中國新存儲的數據是250PB,只有日本的60%,北美的7%。目前,我國壹些部門和機構擁有大量數據,但寧願自己不用,也不願提供給相關部門,導致信息不全或重復投入。2012年中國數據存儲容量達到64EB,其中55%的數據需要進行壹定程度的保護,但目前只有不到壹半的數據得到了保護。