人類社會的數據生成模式大致經歷了以下三個階段:
1.操作系統階段
數據庫的出現大大降低了數據管理的復雜性。事實上,數據庫大多被操作系統采用。作為操作系統的數據管理子系統,如超市銷售記錄系統、銀行交易記錄系統、醫院病人病歷等。,人類社交數據的第壹次大飛躍,始於操作系統對數據庫的大量使用。這壹階段最重要的特點是,數據往往是隨著壹定的操作活動生成並記錄在數據庫中的。例如,超市銷售的每件產品都會在數據庫中生成壹個相應的項目。這些數據是以被動的方式生成的。
2.用戶生成的內容階段
互聯網的誕生,促使了人類社會數據量的第二次大飛躍。但真正的數據爆炸發生在Web2.0時代,Web 2.0的重要標誌是用戶生成內容(UGC)。這類數據近年來壹直呈爆炸式增長,主要有兩個原因。首先,以博客、微博為代表的新型社交網絡的出現和快速發展,使得用戶更願意產生數據;其次,智能手機和平板電腦等新型移動設備的出現,便於攜帶和全天候接入網絡,使人們在網上表達意見更加方便。這個階段的數據生成方式是主動的。
3.感知系統階段
人類社會數據量的第三次大飛躍最終導致了大數據的出現,今天我們正處於這個階段。這壹飛躍的根本原因是感知系統的廣泛使用。隨著技術的發展,人們已經能夠制造出具有處理功能的極其微小的傳感器,並開始廣泛布置這些裝置來監控社會的運行。這些設備將不斷生成自動生成的新數據。簡單來說,數據生成經歷了被動、主動、自動三個階段。這些被動、主動、自動的數據同構形成大數據的數據源,但自動的數據才是大數據的根源。