當前位置:吉日网官网 - 傳統美德 - 什麽是智能運維?

什麽是智能運維?

得益於IT外包服務的發展,現在的運維不再包括搬機上架、連接網線、安裝操作系統等基礎工作。運維人員壹般會從安裝了指定版本操作系統並分配了IP地址和賬號的服務器入手,工作範圍壹般包括:服務器管理(操作系統層面,如重啟和離線)、軟件包管理、代碼在線和離線、日誌管理和分析、監控(區分系統和業務)。

隨著業務的發展,服務器規模的擴大,以及雲(公有雲和混合雲)和虛擬化的逐步實施,運維工作已經擴展到容量管理、靈活(自動化)的容量擴展和收縮、安全管理以及故障分析和定位(各種容器和開源框架的引入帶來的復雜性增加)的範圍。

聽起來好像每壹種工作都不容易。不過好在這些領域都有成熟的解決方案,開源軟件和系統,運維工作的重點就是如何應用這些工具解決問題。

傳統的運維工作經歷了不斷的發展(服務器規模不斷擴大),大致經歷了人工、工具和自動化、平臺化和智能運維(AIOps)幾個階段。這裏的AIOps不是指it運營的人工智能,而是指算法化的IT運營(基於Gartner的定義標準)。

基於算法的IT運維可以利用數據和算法提高運維的自動化程度和效率,如告警匯聚合並、根源分析、關聯分析、容量評估、自動擴容收縮等。

在監控、服務臺、自動化的基礎上,利用大數據和機器學習不斷優化,利用機器智能拓展人類能力的極限。這才是智能運維的本質意義。

智能運維的具體落地模式也在各團隊探索中,早期成果在異常檢測、故障分析和定位的應用上(取決於業務系統標準化的推進)。智能運維平臺的邏輯架構如圖所示。

智能運維平臺邏輯架構圖

智能運維絕不是壹個跨越式的發展過程,而是壹個長期進化的系統,其基礎是運維自動化、監控、數據采集、分析處理等具體項目。人們很容易忽略智能運維在工程上的投入,以為只要有算法就行了,其實這裏工程能力和算法能力同等重要。

智能運維要解決的問題是:海量數據存儲、分析處理、多維度、多數據源、信息過載、復雜業務模式下的故障定位。隨著智能運維的深入應用,這些問題是否會得到壹定程度的解決?我們將在下壹篇文章中逐步展開這些問題,並提供壹些解決方案。

本文選自董朋、朱偉、劉軍等合著的《智能運維:從0開始構建大規模分布式AIOps系統》。,電子工業出版社2065438+2008年7月出版。

本書結合大型企業智能運維實踐,全面完整地介紹了智能運維的技術體系,使讀者更加了解運維技術的現狀和發展。同時幫助運維工程師在壹定程度上了解機器學習的常用算法模型,以及如何應用於運維。

  • 上一篇:什麽是星巴克咖啡文化?
  • 下一篇:關於春節的初中英語作文
  • copyright 2024吉日网官网