列存儲不同於傳統的關系數據庫,它的數據是按行存儲在表中的。列模式帶來的壹個重要好處是,整個數據庫被自動索引,因為查詢中的選擇規則是按列定義的。
當查詢只需要幾個字段時,按列存儲每個字段的數據聚合存儲可以大大減少讀取的數據量。壹個字段的數據聚集存儲使得為該聚集存儲設計更好的壓縮/解壓縮算法變得更加容易。
傳統(Oracle)行存儲和(Hbase)列存儲的區別。
主要體現在以下幾個方面:1。數據類型。關系數據庫采用關系模型,具有豐富的數據類型和存儲方式。HBase采用更簡單的數據模型,將數據存儲為無法解釋的字符串。用戶可以將不同格式的結構化數據和非結構化數據序列化為字符串,保存在HBase中。用戶需要編寫自己的程序來將字符串解析成不同的數據類型。2.數據操作。關系數據庫包含了豐富的操作,如插入、刪除、更新、查詢等。,這將涉及復雜的多表連接,通常借助於多個表之間的主鍵和外鍵關聯。HBase操作沒有復雜的表間關系,只有簡單的插入、查詢、刪除、清空等。因為HBase是為了避免表與表之間的復雜關系而設計的,所以它通常只使用單個表的主鍵查詢。