數倉架構分五層,第壹層是數據源,又稱上遊系統,銀行為例,數據源由核心系統、ECIF、貸款系統、存款系統、中間業務總賬系統、財務系統 等等。第二層,貼源層,又稱標準化層(ODS),這裏需要清洗臟數據(用正則表達式、條件過濾),規範命名,數據類型和格式作標準化處理,添加時間戳字段。源到貼源層用ETL工具(datastage、kettle、infomatica)同步抽取;用shell腳本來異步傳輸。第三層,FDM層(基礎層),按照業務條件(或業務邏輯),匯總加工源數據(ods層的數據),形成寬表。(用存儲過程實現)第四層,匯總層/主題層。按照不同維度(機構、日期、幣種、地點)來匯總;根據客戶需求提煉主題數據(where過濾)。(用存儲過程實現)第五層,應用層。包括報表,下遊系統,數據平臺,數據集市。