壹:傳統數據庫
(1)傳統索引不適於海量數據
傳統行存數據庫索引需要手工設定,對應用不完全透明,隨場景和需求的變化需要不斷調整,人工維護成本很高。並且傳統索引占用存儲空間很大,甚至高於數據本身,造成查詢效率的下降。
(2)數據裝載速度慢
因為索引需要重新創建,加載性能會變的很糟糕。分析型架構系統要解決這些個問題,必須最大限度地減少磁盤 I/O ,提升查詢效率,減小人工維護成本。南大通用分析型數據庫GBase8a (以下簡稱GBase 8a)通過列存儲模式、數據壓縮、智能化的索引、並行處理、並發控制、高效的查詢優化器等技術,使得上述問題得到有效解決。以下各節將描述 GBase 8a 的創新架構如何實現這些目標。
二:新型數據庫
新型數據庫采用分布式並行計算架構,部署於X86通用服務器,滿足大數據實時交易需求,成本低、擴展性高,突破了傳統數據庫性能瓶頸。
分布式非關系型數據庫技術創新
非關系型數據庫即NoSQL,拋棄了關系數據庫復雜的關系操作、事務處理等功能,僅提供簡單的鍵值對(Key, Value)數據的存儲與查詢,換取高擴展性和高性能,滿足論壇、博客、SNS、微博等互聯網類應用場景下針對海量數據的簡單操作需求。主要技術創新為:
(1) 簡單的數據操作換取高效響應。NoSQL僅支持按照Key(關鍵字)來存儲和查詢Value(數據),不支持對非關鍵字數據列的高效查詢;因數據操作簡單、數據間壹般不需要關聯操作,故系統可支持高並發和較快的響應速度。
(2) 多種壹致性策略滿足業務需求。不同於傳統關系型數據庫僅支持強壹致性策略,NoSQL還支持弱壹致性和最終壹致性等多種策略,可根據應用場景進行對應配置。例如,對寫入操作頻繁,但數據讀取最新版本要求並不嚴格的應用,如互聯網網頁數據的存儲和分析應用,可以采用最終壹致性策略;而對訂購關系存儲的應用,則必須用強壹致性策略,保證總是讀取最新版本數據