電商總結(二)日誌與監控系統的解決方案

2021-09-13 20:43:43 字數 1670 閱讀 9316

前一篇文章聊到了小型電商**的系統架構,然後有朋友問我,裡面的日誌與監控指的是啥,所以,今天就來聊聊這個問題。

監控系統主要用於伺服器集群的資源和效能監控以及應用異常和效能監控,日誌管理等多維度的效能監控分析。乙個完善的監控系統和日誌系統對於乙個系統的重要性不必我多說,總而言之就一句話,只有實時了解各系統的狀態,才能保證各系統的穩定。

如上圖所示,監控平台監控的範圍很廣,伺服器效能及資源,還有應用系統的監控。每個公司都有特定的平台統一監控的需求及解決方案,但是監控平台的任務和作用基本是一致的。

一,日誌

日誌是監視程式執行的一種重要的方式,主要有兩個目的:1.bug的及時發現和定位,2.顯示程式執行狀態。正確詳細的日誌記錄能夠快速的定位問題。同樣,通過檢視日誌,可以看出程式正在做什麼,是不是按預期的設計在執行,所以記錄下程式的執行狀態是必要的。這裡將日誌分為兩種:1.異常日誌,2.執行日誌。

我們主要是使用log4net,將各個系統的日誌,持久化記錄到資料庫或者檔案中,以方便後續的系統異常監控和效能分析。如何整合log4net,這裡不再說明。

日誌記錄的幾個原則:

1. 區分日誌級別一定要區分清楚,哪些屬於error,warning,info,等,

2. 記錄錯誤的位置,如果是分層系統,一定要在某個層統一處理,例如,我們的mvc架構,都是在各個action中catch異常,並處理,業務層和資料庫層這些地方的異常,都是catch到異常後,往上一層拋。

3. 日誌資訊清晰準確有意義,日誌盡量詳細點,以方便處理。應該記錄相關系統,模組,時間,操作人,堆疊資訊等。方便後續處理。

二,監控

監控系統是乙個複雜的系統平台,目前有很多的開源產品和平台。不過我們平台小,監控任務和需求少,所以基本都是自己開發,主要有這五個方面:1.系統資源,2.伺服器,3.服務,4.應用異常,5.應用效能。

具體的架構圖如下:

1,系統資源監控

監控各種網路引數和各伺服器相關資源(cpu,記憶體,磁碟讀寫,網路,訪問請求等),保證伺服器系統的安全運營;並提供異常通知機制以讓系統管理員快速定位/解決存在的各種問題。目前比較流行的應該是zabbix。

2,伺服器監控

伺服器的監控,主要是監控各個伺服器,網路節點,閘道器,等網路裝置,的請求響應是否正常。

通過定時服務,定時去ping各個網路節點裝置,以確認各網路裝置是否正常,,如果哪個網路裝置出現異常,則發出訊息提醒。

3,服務監控

服務監控,指的是各個web服務,服務,搜尋引擎服務,快取服務等平台系統的各項服務是否正常執行,

可以通過定時服務,每隔一段時間,就去請求相關的服務,確保平台的各項服務正常執行。

4,應用異常監控

目前我們平台的所有系統的異常記錄,都記錄在資料庫中。通過定時服務,統計分析一段時間之內的異常記錄。如果發現有相關重要的模組的系統異常,比如支付,下單模組,頻繁發生異常,則立即通知相關人員處理,確保服務正常執行。

5,應用效能監控

在api介面和各應用的相關位置進行攔截和記錄下程式效能(sql效能,或是 程式執行效率)。相關重要模組提供效能預警,提前發現問題。 同時統計相關監控資訊並顯示給開發的人員,以方便後續的效能分析。

電商總結(二)日誌與監控系統的解決方案

前一篇文章聊到了小型電商 的系統架構,然後有朋友問我,裡面的日誌與監控指的是啥,所以,今天就來聊聊這個問題。監控系統主要用於伺服器集群的資源和效能監控以及應用異常和效能監控,日誌管理等多維度的效能監控分析。乙個完善的監控系統和日誌系統對於乙個系統的重要性不必我多說,總而言之就一句話,只有實時了解各系...

電商總結(二)日誌與監控系統的解決方案

前一篇文章聊到了小型電商 的系統架構,然後有朋友問我,裡面的日誌與監控指的是啥,所以,今天就來聊聊這個問題。監控系統主要用於伺服器集群的資源和效能監控以及應用異常和效能監控,日誌管理等多維度的效能監控分析。乙個完善的監控系統和日誌系統對於乙個系統的重要性不必我多說,總而言之就一句話,只有實時了解各系...

電商總結(二)日誌與監控系統的解決方案

前一篇文章聊到了小型電商 的系統架構,然後有朋友問我,裡面的日誌與監控指的是啥,所以,今天就來聊聊這個問題。監控系統主要用於伺服器集群的資源和效能監控以及應用異常和效能監控,日誌管理等多維度的效能監控分析。乙個完善的監控系統和日誌系統對於乙個系統的重要性不必我多說,總而言之就一句話,只有實時了解各系...