當前位置:吉日网官网 - 傳統美德 - 大數據倉庫項目的架構

大數據倉庫項目的架構

雲數據倉庫解決方案:/solution/datavexpo/data warehouse

離線倉庫盤點體系結構

離線倉庫盤點特征

基於無服務器的雲數據倉庫解決方案

體系特性

實時倉庫盤點體系結構

[圖像上傳失敗...(圖片-ec3d 9a-1629814266849)]

實時倉庫盤點體系結構的特點

秒級延遲,實時構建數據倉庫,結構簡單,平滑升級傳統數據倉庫

體系特性

數據倉庫的輸入數據源和輸出系統是什麽?

輸入系統:嵌入式點產生的用戶行為數據,JavaEE後臺產生的業務數據,單個公司的爬蟲數據。

輸出系統:報告系統、用戶畫像系統、推薦系統。

1)Apache:運維麻煩,組件之間的兼容性需要自己調查。(壹般由大廠使用,技術力量強,運維人員專業)

2)CDH:國內使用最廣泛的版本,不過CM不是開源的,但是對中小公司使用沒有影響(建議使用)$ 10000 CDP每節點。

3)HDP:開源,可以二次開發,但不如CDH穩定,國內很少使用。

服務器使用物理機還是雲主機?

1)機器成本考慮因素:

(1)物理機:128G內存,20核物理CPU,40線程,8THDD,2TSSD硬盤,單機定價4W,是惠普品牌。壹般物理機壽命5年左右。

(2)雲主機,以阿裏雲為例,配置差不多,每年5W。

2)運行和維護成本考慮因素:

(1)物理機:需要專業運維人員(1萬*13個月)、電費(商業用戶)、空調安裝。

(2)雲主機:大量的運維工作已經由阿裏雲完成,運維相對容易。

3)企業選擇

(1)阿裏雲(上海)選擇的是有金融財富的公司和與阿裏沒有直接沖突的公司。

(2)中小公司,為了上市融資,選擇阿裏雲,融資後買物理機。

(3)有長遠規劃,資金充足,選擇實體機。

按照數據規模,大家聚類。

它屬於R&D部門/技術部/數據部,我們屬於大數據集團。其他包括後端項目組,前端組,測試組,UI組。其他包括產品部、運營部、人事部、財務部和行政部。

大數據開發工程師= & gt大數據組的團隊領導= "項目經理= & gt部門經理=技術總監

軍銜分為初級、中級、高級。晉升規則並不確定,取決於公司的福利和職位空缺。

JD。COM: T1,T2大壹新生;T3 14k左右T4 18K左右T24K-28K左右。

阿裏:p5,p6,p7,p8

小公司(3人左右):團隊負責人1,其余團隊成員沒有明確分工,可能兼顧javaEE和前端。

中小公司(3~6人左右):組長1人,線下2人左右,實時(線下壹般比實時多)1人左右。團隊領導負責javaEE和前端。

中型公司(5人左右10人):組長1人,線下(線下處理,倉庫盤點)3人左右,實時2人左右。團隊領導和技術專家兼顧javaEE和前端。

中大型公司(約10 20人):組長1人,線下5人10人(線下處理,倉庫盤點),實時5人,JavaEE1人(負責對接JavaEE業務),前端1人(有無負責前端的人)。(發展相對較好的中大型公司,可能會把他們的大數據部門分成幾個大數據組,分別負責不同的業務。)

以上只是參考配置,因為公司之間差異很大。比如ofo的大數據部門只有5個人左右,所以根據所選公司的規模來確定壹個合理的範圍。這個人員配備壹定要在面試前考慮清楚,答案應該是非常確定的。

IOS多少人,Android多少人,前端多少人,JavaEE多少人,測試多少人。

(IOS、Android) 1-2個人前端1-3個人;JavaEE壹般是大數據的1-1.5倍。測試:有些有,有些沒有。大概1。產品經理1,產品助理1-2,運營1-3。

公司部門:

0-50家小公司

50-500中等

500-1000家大公司

1000以上領先廠商的存在。

來自:/article/details/116003357

  • 上一篇:復式樓梯樓梯的設計技巧這種設計既美觀又實用。
  • 下一篇:沙城決戰之血傳說輪回方法介紹
  • copyright 2024吉日网官网