無監控,不運維 解讀企業全棧式監控運

2022-02-18 01:07:35 字數 1231 閱讀 2887

企業應用由單體應用系統向分布式系統的發展趨勢已經不可逆轉。十年前 「soa」 大頻率的出現在軟體系統招標技術架構要求書中,相信用不了多久「微服務架構」也會被頻繁提及——分布式系統將成為主流。

01為什麼分布式系統會「火」?

因為業務應用隨著自身功能的複雜化、應用間更頻繁的相互呼叫以及使用者數的不斷增長等諸多因素,導致單台伺服器效能已經無法滿足應用系統的業務量,再也無法保證應用的可靠執行。而分布式系統架構卻可以很好的解決系統容量和提公升可靠性的問題。但分布式架構依然存在很多問題。

02下面對比了單體架構和分布式架構的優劣

全棧式監控就像一台應用健康狀況的ct掃瞄機,讓服務從前到後的響應情況能夠被清晰的洞察;讓系統執行產生的故障問題能夠被準確的定位。

03基於全棧式運維的核心思想

合理的做法應該是

1、以使用者服務的api為主線來進行系統監控

2、聚合基礎層、平台層和應用層的監控指標,將服務和執行服務的中介軟體以及主機能夠無縫的關聯監控

3、跟蹤使用者請求鏈路(traceroute),從請求的客戶端、網路、閘道器、前-中-後台服務、資料庫等一站式跟蹤使用者的服務請求

市場上監控軟體很多,能夠從使用者體驗和運維者兩個角度綜合考慮做到打通全棧監控的很少。東軟平台產品的一體化運維組合是這個領域的踐行者。

04東軟的一體化運維平台專注在兩個場景

健康體檢

提供乙個全棧監控指標聚合門戶,通過ai演算法進行**分析,讓運維者了解系統的綜合健康評估,輔助運維者管理系統容量。

病情診斷

提供全鏈路跟蹤監控,當出現非預期流量提公升時,可以找到系統效能瓶頸;當系統服務故障時,可以從客戶端請求及系統執行環境一直滲透到程式**進行根源性分析。

總結一下:分布式系統全棧監控是一雙慧眼,它能幫助我們了解系統到底發生了什麼,尤其是當使用者服務出現問題時,它能幫助我們快速找到問題根源。

無監控,不運維

監控系統俗稱 第三隻眼 正所謂 無監控,不運維 監控系統的地位不言而喻。沒有了監控,不管什麼基礎運維 業務運維都是 瞎子 監控系統的作用 監控問題 有沒有做監控?監控是否及時?監控資訊是否有助於快速定位問題?如何使用監控系統 監控物件 硬體監控 包括 電源狀態 cpu狀態 機器溫度 風扇狀態 物理磁...

IT系統運維監控 被動式旁路監控

個人研究心得 1 各種監控方式 zabbix和nagios等監控軟體,主要通過snmp和agent等,對網路裝置的效能 連通性和可用性進行監控,但沒有監控應用程式的響應時間等,it人員和管理人員很難快速定位網路延時等問題。主動監測,在客戶端 模仿 使用者正常使用應用程式,實施複雜,不斷的重複會占用網...

企業運維監控平台架構設計與實現

阿里雲大學 企業運維監控平台架構設計與實現 本課程主要介紹了企業常見的運維監控平台的構建思路和常用軟體,講述了cacti nagios zabbix ganglia webnagios等常用監控軟體的差異和優劣,並深入介紹了通過ganglia nagios如何快速構建乙個統一運維監控平台。課時列表 ...