在騰訊的定義中,藍鯨描述的是基於SOA(Service-oriented architecture)和雲技術的運維模式,通過原子服務集成和開放工具構建的方式,解決基礎服務的無人值守運維和運維增值服務的低成本實現。總之,藍鯨讓遊戲運維能夠以低成本提供更高水平的服務。藍鯨創始人、騰訊遊戲運維支撐體系負責人黨首輝對藍鯨的系統和功能做了詳細的分析,解讀了其四大秘訣。
秘密壹:運維基礎服務?未被註意的
假設運維系統的壹個環節在淩晨4點鐘出現故障。按照系統自身的邏輯,發現問題,處理問題,然後直接重啟,需要1分13秒。早上來上班的時候,運維人員接到通知,告訴我半夜發生的事情,我(藍鯨)幫妳處理。這就是藍鯨的無人值守功能。
顧名思義,無人值守是不需要運維人員進行任何人工操作,由系統自身進行處理的功能,這是藍鯨運維的基礎服務。如果細分業務性質,壹部分是自助發布變更、區域遷移、信息提取和數值調整,另壹部分是自動伸縮、區域遷移和故障處理。
再者,藍鯨可以幫助運營者將重復性、繁瑣性、創新性的操作打包,做成應用工具。遇到類似情況時,可以直接使用工具代替人工操作,不僅將操作人員從各種重復性工作中解放出來,還大大縮短了類似操作的時間成本,提高了運維效率。據介紹,騰訊《劍2》在使用藍鯨的開放區域App後,只需5-7分鐘即可打開區域,比使用App前節省了近4個小時,效率提升數十倍。
雲時代,無人值守服務還可以實現智能滾動服務,比如達到壹定人數後,會自動實現開區功能。鑒於故障,它也會立即自愈。目前,霍穎和天天玄都通過藍鯨開通了自動開區功能,超級瑪麗開通了故障自愈功能。
技巧二:運維增值服務?雲時代將占90%
目前,包括基礎運營工具建設、產品運營決策支持、用戶遊戲體驗優化、業務異常位置規避、遊戲運營架構優化等增值服務在運維工作中的占比已經達到10%左右。黨首輝表示,增值服務在雲時代將占據更高的比重,未來有望提升至90%。
從2008年開始,騰訊的運維體系開始在遊戲領域沈澱。經歷了劇本時代、運營時代、雲時代,在2013後騰訊雲的支持下,構建了雲時代的藍鯨體系。
據黨首輝介紹,遊戲的架構和運營都沒有標準。同壹個遊戲同壹個場景的版本可能壹變就變,所以運維需要不斷調整。如果沒有工具進行運維,就要不斷修正操作。
實際上,運維的腳本化,運維配置的雲化,可以最大限度的保證配置安全。黨首會提到,運營時代起到了規範運營的作用。傳統意義上,壹個人可以管理多個業務,自己寫多個劇本。如果再換壹個人,就有可能把最後壹個人的運維腳本全丟了。基於這些方面,在雲時代規範了腳本,實現了跨系統的調度自動化。像這樣的運營增值服務的比例在雲時代會進壹步擴大。
技巧三:雲工作臺、快速搭建、服務集成三位壹體
藍鯨系統是落地藍鯨模式的技術解決方案,由藍鯨平臺、操作系統和Iaas組成。關鍵藍鯨平臺主要有三個部分,提供雲工作臺,快速搭建平臺,然後是服務集成。
據黨首輝介紹,藍鯨平臺不僅為遊戲運營商提供豐富的SaaS服務,還為開發者提供PaaS服務。藍鯨PaaS雲平臺提供工具開發、調試、托管服務的全流程,降低了工具的開發門檻。普通運維經過簡單的培訓,就能快速做出運營工具,投放市場。同時,藍鯨還在IaaS層和操作系統層對接了大量原子操作,在ESB平臺實現了靈活調度,提供給PaaS平臺使用,這樣在構建調度自動化工具時,運維不需要對接接口和硬編碼調度邏輯,進壹步降低了工具開發的門檻。
技巧四:藍鯨基本是武裝運維而不是替代,幫助運維轉型。
藍鯨是騰訊遊戲運維從實戰中總結、提煉、構思、設計、打造的壹套系統。設計的初衷是武裝運維,讓其提供更高維度的服務,而不是取代運維。
?傳統領域的運維價值比較低,被替代的成本不高。壹般來說,開發是和遊戲綁定的,壹般不會作為公共資源出現。如果兩個遊戲都需要細化,那麽同時做開發是不合適的。是重復建設,運維部門有這個能力。藍鯨要做的就是加強運維,拉高維度。?黨首會這樣解釋藍鯨的概念。
在必要性方面,黨首輝表示,遊戲行業的運維必須轉型。現在遊戲拼渠道,拼質量,產品拉回的每壹個流量都要想辦法留在這裏,沈澱下來。壹方面,發布時間必須越來越短,否則變化可以自動擴大。妳不能等到滿了,用戶進不去了,妳要更聰明。還有壹個斷層問題。對於異常識別和決策,操作和維護控制整個環境。另外還有壹個新的回歸,有多少玩家輸了,哪些玩家能來。運維部門應該對這些信息提供建設性的反饋。
在騰訊開放的環境下,雲幫助藍鯨走上遊戲運維管理的巔峰,最大限度降低了運維門檻,提高了運維效率。2015ChinaJoy期間,騰訊雲再次展示了其在遊戲雲服務領域的領先優勢,並表示將繼續開放騰訊內部的各種秘密武器,其獨有的能力將覆蓋開發、測試、運營、支付等各個環節,勢必會給遊戲行業帶來更多的價值和更多的改變。