人工智能經歷了六十多年的浮浮沈沈,隨著計算算力的進步,算法的創新和互聯網發展下的海量數據積累,人工智能技術未來十年將煥發出新的活力,成為最具有沖擊力的 科技 發展趨勢之壹。
在HUAWEI CONNECT 2020期間,華為基於對電信領域的深刻理解和多年經驗沈澱,帶來了《AIOps使能服務》的分享,旨在結合電信領域應用場景,使能網絡達到自動、自愈、自優和自治的自動駕駛網絡,提升整個網絡的效率,降低OPEX。
AIOps成為電信網絡運維智能化轉型趨勢
隨著“5G 新基建”的加速實施,數字經濟發展迎來新的動能。不僅推動投資消費的快速成長,還將驅動各行業的數字化轉型升級。隨之而來的是網絡問題復雜化與業務質量高要求的挑戰,運維能力的演進成為電信網絡能否持續發揮效能的關鍵因素。
電信網絡運維作業正面臨問題發現被動(75% 問題由用戶發現),故障根因定位難(90% 時間用於問題定位)的業務挑戰。同時,各專業運維支撐系統功能也面臨開發周期長,閉環流程自動化程度低的技術瓶頸。因此,運營商期望引入AI實現智能運維,做到主動維護和故障自愈。
在運維支撐系統的演進方向上,AIOps(運用AI及大數據技術解決運維問題)已經成為電信行業運維智能化轉型的趨勢和***識:構建AIOps平臺能力,支撐不同運維場景應用。在未來五年內,電信行業市場的運維系統和平臺將加速AI能力的升級,成為電信領域AI應用的核心場景,投資占比達到60%。
因此,AIOps已經成為電信網絡運維智能化轉型趨勢。通過構建電信領域AIOps平臺能力,快速實現智能運維升級。
華為AIOps助力網絡提升可靠性及使能智能化運維
按照自動駕駛網絡的等級定義,運維的智能化目標是要實現全域、全流程的預測性運維,自動監控、定位、自愈。
華為AIOps使能服務作為自動駕駛網絡AI引擎NAIE的核心能力,基於AI平臺,提供了壹系列的電信領域AIOps原子能力以及組合編排能力,使能網絡管控析單元、智能運維解決方案等運維系統,最終幫助運營商打破原有的煙囪式建設方式,將各專業運維系統的應用與AI能力解耦,采用分層的服務化架構對接***享數據中心,集中提供AIOps能力,適配運維場景應用百花齊放的需求。
如下是華為AIOps使能服務預組合編排好的服務,可開箱即用:
kpi異常檢測服務, 快速智能識別海量kpi/kqi的異常情況,廣泛應用在網絡性能和質量監控場景;
故障識別與根因定位服務, 根據海量告警結合對應網絡拓撲和傳播知識,實時識別故障及根因網元及告警,可自動學習知識規律,保證持續優化,可廣泛應用在各種網絡場景;
日誌異常檢測服務, 實現日誌的自動分類和統計規律發掘,實時監控出系統的異常行為和相關日誌,可廣泛應用在IT及電信網絡場景;
硬盤異常預測, 可智能預測短期內(14天)的硬盤故障,以采取規避預防措施,以免對業務產生影響,廣泛支持主流廠商的HDD及SSD型號。
細數華為AIOps使能服務四大核心競爭力
提供豐富的AIOps原子能力: AIOps的原子能力覆蓋運維全流程,包括預測、檢測,定位、執行。原子能力庫支持流量預測,故障預測,KPI異常檢測,日誌異常檢測,CHR異常檢測,異常關聯分析,事件聚合,根因定位等20+原子能力。
作為電信領域的AIOps使能服務,具備兩個核心特點:壹是基於華為電信領域的經驗,原子能力將AI算法與電信領域行業知識融合,預制了默認的電信領域模型參數,同時支持現網運行態的調優,解決當前通用算法模型在具體行業落地效果差的難題。目前,已經在現網得到了規模驗證。
另壹個是AIOps原子能力采用標準化模型規範,統壹數據輸入,參數配置,結果輸出等接口。為AIOps單點原子能力到靈活的組合串接提供了基礎。
組合編排與DevOps能力: 通過組合編排功能,使用者可選擇業務場景所需的AIOps原子能力,通過可視化方式完成流程串接,並進行業務泛化參數配置,包括數據接入方式,模型參數,內置電信領域泛化參數,事件通知方式、可視化Dashboard等配置。上述能力支持可視化編排或接口調用方式實現。此外,基於NAIE平臺訓練服務,AIOps的原子能力庫支持使用者根據實際業務需求開展算法模型的創新與開發,不斷擴展AIOps能力。NAIE的生態服務也提供專業的人員培訓賦能。
支持電信領域數據對接: 支持KPI、告警、日誌、xDR等電信領域主流運維數據。支持Kafka,數據庫,文件系統,Restful等電信運維系統的主流數據對接方式。AIOps使能服務提供通用的數據源對接和標準化數據治理組件,通過配置項快速建立與運維系統的數據源連接,通過SDK將不同的數據類型和格式治理成標準化的AIOps原子能力輸入集,用於模型訓練和推理。
場景組合服務: 圍繞運維全流程(發現、分析、處理)提供預制典型場景組合應用,快速接入運維流程。
綜上所述,華為AIOps使能服務作為智能運維AI能力引擎,融合AI的技術優勢與華為在電信領域的專業優勢,為運維系統的智能化演進提供AIOps平臺能力支持,助力到各專業運維系統的應用快速上線,讓運維專家專註場景應用設計和業務目標達成。
華為AIOps助力運營商及企業網絡打造最佳實踐
在KPI異常檢測方面,電信網絡中,通過KPI來預測和檢測網絡問題是最普遍的場景。通過AI算法基於 歷史 數據自動生成每個KPI的動態門限,避免傳統靜態門限帶來的誤報和漏報。
華為NAIE融合了電信領域的運維業務特點,提供單指標/多指標檢測,異常原因關聯分析,模型的自學習調優等關鍵能力。目前已經用在核心網,無線,數通等不同業務領域。國內某運營商采用了核心網KPI異常檢測服務以後,實現提前5小時識別異常並主動預警,降低了業務損失。
在告警根因定位方面,發現異常或者故障之後的定位是運維流程中的難點,如何準確的將多維度的異常、告警等事件進行匯聚,減少故障噪聲,準確定位到具體原因?這些工作目前主要依賴專家經驗或者手工分析,而且受限於分析算力和知識信息,效果並不好。
華為NAIE AIOps通過AI算法與業務的融合,支持多類異常/告警等事件的智能故障定位,自動實現時間,拓撲和故障傳播圖等維度的事件匯聚和根因定位。目前已經應用到無線接入網等業務領域,經過實際驗證,無效上站減少60%,根因識別準確率85%+,運維效率整體提升15%。
寫在最後,電信領域AIOps落地的關鍵是需要將行業知識與AI技術融合。網絡運維系統的AIOps能力構建的趨勢是業務與能力解耦,做到AIOps能力的復用、拉通,支持,適配運維場景應用百花齊放和快速上線叠代的需求。
因此,AIOps使能服務作為智能運維AI能力引擎,融合AI的技術優勢與華為在電信領域的專業優勢,為運維系統的智能化演進提供AIOps平臺能力支持,助力到各專業運維系統的應用快速上線,讓運維專家專註場景應用設計和業務目標達成。目前,華為AIOps使能服務已經在無線,核心網,數通等網絡域得到了廣泛的應用。