OpManager引領智慧型運維未來的發展方向

2021-10-12 09:16:36 字數 927 閱讀 1344

近年來運維技術飛速發展,運維團隊大多建設好了各種系統,虛擬化、容器化、持續整合等。但是如何有效的利用這些系統最終實現站點的高可用、高效能、高可擴充套件?隨著智慧型化技術的發展,為了解決上述運維領域的問題,智慧型運維的呼聲已經越來越高。

如今,我們國家智慧型運維發展還是處於乙個探索階段,要想盡快在智慧型運維領域有所突破,首先要主抓好網路監視系統與網路警報系統,並利用機器學習演算法進行快速網路監視與排障。

現在我們國家運維界在自動化方面已經達到了一定的水平,現階段而且言,自動化與網路監視兩部分還是是有一定距離。例如,你拿到了網路監視的報警,可能不清楚立馬去做哪一項自動化的部署。如果能把自動化與網路監視這兩部分有機的結合起來,運維的工作會運轉的更加順利。

在 pc 端的時代,運維的很多任務作受限於瀏覽器,it管理員拿不到使用者端真實的資料。這種狀況下,大家會普遍採購第三方服務,嘗試獲取終端資料。而且在移動端時期,我們都有自己的 ip,可以把採點的邏輯放在自己的 ip 裡,然後獲取到更準確、更真實的客戶資料。相對於挑戰來說,這其實是移動端帶來的好處。

雲服務的出現給運維工作帶來難題。沒有出現雲服務之前,it管理員在一台或是兩三颱機器中可以完成問題排查。出現雲服務之後,這些問題可能拆到了好幾十個分布式的地方,各自的輸出,甚至啟停會很方便,你有可能遇到在找問題的時候混淆的情況。而且解決這些麻煩是需要智慧型運維。

智慧型運維的理想狀態是把運維工作的三大部分:網路監視、管理與故障定位,利用機器學習演算法的方法把它們有機結合起來。

大家會朝著智慧型運維方向發展,並且智慧型運維的發展一定是乙個長期演進的過程。第一步是智慧型運維在網路警報系統上的價值,第二步是智慧型地去判斷網路警報,而且不是現在靠人力的經驗去設定乙個閾值。設定網路警報閾值是一項耗時耗力的工作,需要it管理員在充分了解業務的前提下才能進行,還是得考慮業務是不是平穩發展狀態。第三步是利用 nlp,把故障報告、文字化的語言提煉出來去自動反饋到這個系統裡。這一點可能是更遙遠的乙個設想,但是如今來看會是將來發展的一條道路。

ccf 智慧型運維 裴丹 基於機器學習的智慧型運維

聽了裴丹教授關於 基於機器學習的智慧型運維 演講之後的寫下的乙個筆記。今天來看,還是有不少啟發,分享給大家,對細節有興趣的童鞋可以去看演講實錄。在本文末尾附了相關鏈結。基於機器學習的智慧型運維 講師 裴丹 概述值得工業界運維工程師關注的頂級學術會議 智慧型運維歷程 基於專家庫規則 機器學習 深度學習...

如何構建智慧型運維平台?

隨著技術的發展,運維支撐必須逐漸擺脫對人力的單純依賴,走向平台化。如何才能構建具有一定智慧型的運維平台?軟體即服務 software as a service 需要以軟體服務為基礎,實現運維的it能力和業務能力的對接。生活中,幾乎我們每一天都在接觸saas雲服務,比如 我們平時使用的蘋果手機雲服務,...

hyspider之智慧型運維監控

借助scrapyd,可以通過http請求遠端排程爬蟲。scrapy.cfg中加入deploy配置 scrapyd安裝 pip install scrapyd 啟動scrapyd,scrapyd deploy上傳的檔案存放到 安裝scrapyd client pip install scrapyd c...