1,數據規模
數據庫和大數據最明顯的區別就是規模。數據庫的規模相對較小,即使是以前被認為比較大的數據庫,如VLDB(超大型數據庫),與大數據XLDB(超大型數據庫)仍相差甚遠。
壹般MB是數據庫處理的基本單位,GB、TB、PB是大數據處理的基本單位。
2.數據類型
傳統數據庫數據單壹,往往只有壹個或幾個,而且這些數據主要是結構化數據。大數據有上億種,這些數據既包括結構化數據,也包括半結構化數據和非結構化數據。重要的是,半結構化和非結構化數據的份額正在增加。
3.模式和數據之間的關系
傳統數據庫在生成數據之前總是有模式的。很多情況下,大數據很難提前確定模式,模式只能在數據出現後才能確定,而且模式是隨著數據量的增長而不斷演變的。
處理物品
傳統的數據庫數據是其處理的對象。大數據的處理對象除了數據之外,還可以通過這些數據預測其他數據的可能性,並將收集到的數據作為資源,幫助解決其他很多領域的問題。