當前位置:吉日网官网 - 傳統美德 - 大數據系統架構

大數據系統架構

轉: /a/227887005_487103

數據分析工作雖然隱藏在業務系統背後,但是具有非常重要的作用,數據分析的結果對決策、業務發展有著舉足輕重的作用。隨著大數據技術的發展,數據挖掘、數據探索等專有名詞曝光度越來越高,但是在類似於Hadoop系列的大數據分析系統大行其道之前,數據分析工作已經經歷了長足的發展,尤其是以BI系統為主的數據分析,已經有了非常成熟和穩定的技術方案和生態系統,對於BI系統來說,大概的架構圖如下:

總的來說,目前圍繞Hadoop體系的大數據架構大概有以下幾種:

傳統大數據架構

Lambda架構算是大數據系統裏面舉足輕重的架構,大多數架構基本都是Lambda架構或者基於其變種的架構。Lambda的數據通道分為兩條分支:實時流和離線。實時流依照流式架構,保障了其實時性,而離線則以批處理方式為主,保障了最終壹致性。什麽意思呢?流式通道處理為保障實效性更多的以增量計算為主輔助參考,而批處理層則對數據進行全量運算,保障其最終的壹致性,因此Lambda最外層有壹個實時層和離線層合並的動作,此動作是Lambda裏非常重要的壹個動作

優點: 既有實時又有離線,對於數據分析場景涵蓋的非常到位。

缺點: 離線層和實時流雖然面臨的場景不相同,但是其內部處理的邏輯卻是相同,因此有大量榮譽和重復的模塊存在。

適用場景: 同時存在實時和離線需求的情況。

Kappa架構

Unifield架構

總結

以上幾種架構為目前數據處理領域使用比較多的幾種架構,當然還有非常多其他架構,不過其思想都會或多或少的類似。數據領域和機器學習領域會持續發展,以上幾種思想或許終究也會變得過時。

  • 上一篇:“陪伴”業務為什麽會火?
  • 下一篇:太原有哪些培訓機構?
  • copyright 2024吉日网官网