監控運維那點事 客戶體驗監控2

2021-07-02 12:32:37 字數 1196 閱讀 2404

思路:

1. 以終為始,關注客戶體驗相關服務監控。 

2. 持續迭代,羅馬非一日建成。

3. 站在巨人肩膀上,借力雲服務。

2. 基礎設施伺服器監控,也可以用ping方式搞定。

3. 軟體中介軟體,基本上通過tcp\udp偵聽服務的埠即可,如mysql資料庫的3306埠。部分服務部署在內網不對外(公網),需要內網部署探針方式。

基本上協議級(http、tcp、udp、ping)監控可以解決掉公網服務的應用/業務可用性監控,至少可以做到客戶體驗中可用(可達)保障。

優點是見效快,幾分鐘-個把小時基本完成。

缺點是內網方面,部分服務部署在內網不對外(公網),需要內網部署探針方式,如監控寶。

客戶體驗監控--端到端:端到端(end-to-end)即使用者端到伺服器端,見下圖(110雲監控僅內測,未發布。110雲告警已公測),由於鏈路複雜,特別是使用雲服務後,雖然使用簡單,但實際的it複雜度增大,任何乙個環節出現問題都會影響終端使用者的體驗。

端到端關注的指標包括:

3. 準確性,至是否準確的響應內容,如是否可以登入,是否正常顯示內容,與實際業務操作場景有關。

具體實現技術基本上是從兩個方向:主動探測和全量被動檢測方式。

1. 主動探測,指主動模擬真實使用者的操作動作:

**類的,通過嵌入式瀏覽器實現**頁面的訪問操作,實際記錄頁面的可用性、頁面響應、載入、完成耗時,實際的每個請求頁面元素耗時和狀態等;可以說基本上是與實際使用者操作基本類似。

探測點分布問題:主動探測一般盡可能的在全國各地、各運營商網路鏈路進行模擬,從而獲知最真實的客戶體驗。

2. 全量被動式檢測,有兩種模式,嵌碼式和網路流量流向全域性監控方式。優點是全量,而不是零散式,同時也是缺點,儲存量和實現難度更大。

網路流量流向監控,一般是交換機埠旁路複製,或者是dpi模式。國外廠家,如ibm\hp\oracle\bmc\ca等傳統公司給土豪級國企使用。基本來說是費力不討好型別,這也是這些傳統企業的市場被新興saas雲監控服務商吞噬原因。

說了半天,端到端 監控很重要,但是理想很豐滿,現實很骨感。大多是通過分析應用日誌和負載均衡裝置(nginx等)手段實現。

透**資訊,原先110雲監控做的客戶體驗監控功能上有點意思了,由於在使用者體驗和效能高併發上達不到boss的「5分鐘理論」要求,被停掉,攻城獅們還需努力呀。

運維那點事

前言 泛泛而談 最近一直在幫張琦老師弄一些課程安排的事情,也順便聊了聊現有培訓機制需要改革的方向,拒絕填鴨式的教育是當務之急,討論之餘寫下這篇文章,僅此紀念,別無他意。有競爭力的運維人員應該考慮什麼?且聽熊熊慢慢道來 執行的職能 包括減少系統宕機時間 依賴各種文件尋找解決方案 根據實際情況進行裝置更...

運維那點事

前言 泛泛而談 最近一直在幫張琦老師弄一些課程安排的事情,也順便聊了聊現有培訓機制需要改革的方向,拒絕填鴨式的教育是當務之急,討論之餘寫下這篇文章,僅此紀念,別無他意。有競爭力的運維人員應該考慮什麼?且聽熊熊慢慢道來 執行的職能 包括減少系統宕機時間 依賴各種文件尋找解決方案 根據實際情況進行裝置更...

自動化運維那點事

前些天參加乙個乙個運維沙龍 茶歇的時候和中信服的以為負責人聊天,他很有激情,說最近在籌備做一套自動化運維的解決方案,和他們的其他解決方案一起賣給客戶 好想法,的確,最近自動化運維炒得火熱,中小企業們也喊著口號 不做自動化運維就不叫運維。這裡簡單的介紹一下何謂自動化運維。自動化運維概念會被重視是情理之...