Zabbix分布式監控系統使用總結

2021-09-04 17:58:23 字數 1604 閱讀 4550

從接觸和使用zabbix已經有2年多的時間,剛開始接觸也就是從zabbix安裝,使用和簡單的維護開始學習。到後來涉及到如何新增監控主機?如何自定義監控項?如何設定報警閥值?等開始學習。

有幸在2023年底從零開始研究和選型整個公司idc監控系統。由於zabbix簡單易用和強大功能,決定用zabbix做為公司的監控系統。整個公司有多個idc機房,監控節點有700左右,採用zabbix分布式來監控。

現在zabbix上線已經接近一年的時間,執行非常穩定,開啟頁面速率流暢。在這一年的多的時間裡面,也發表了一系列文章,主要包括zabbix監控和分布式部署和實施方案、zabbix如何監控網路裝置、zabbix 後台資料操作和api等。希望對廣大朋友所有幫助。

1)zabbix監控和分布式部署實施方案

2)zabbix分布式部署proxy實戰

3)zabbix如何監控網路裝置

4)zabbix如何監控windows機器

5)zabbix通過shell指令碼監控hp伺服器硬體資訊

6)zabbix通過snmp監控hp伺服器硬體資訊

7)通過zabbix全面監控netscaler負載均衡裝置

8)zabbix監控mysql資料庫效能

9)如何從zabbix資料庫中獲取監控資料

10)zabbix python api 應用實戰

做好監控系統,最重要的其實就是兩點,首先是監控專案的設定。根據系統、業務設定最能代表監控專案的效能指標。其次是報警閾值的設定。根據業務指標設定精準的報警閾值。比如說監控apache的httpd程序數監控,如果maxclients設定200,那麼當httpd程序在180的時候必須報警,如果在200的時候報警,此時由於httpd程序爆滿已經打不開頁面了或者開啟**的速度非常慢。

下面是平時工作中總結的zabbix報警閾值的設定,主要包括linux系統、windows系統、伺服器硬體監控、網路裝置和線路的監控的報警閾值的設定。

1)linux系統的報警閾值,這裡增加了linux殭屍程序的監控。

2)windows系統的報警閾值,perf_counter是通過windows的效能計數器獲取的資料。

3)sqlserver和iis的報警閾值,其中perf_counter是通過windows的效能計數器獲取的資料,check_iis_perf.sh是通過指令碼以external check方式監控的。

4)hp硬體的監控,主要是通過snmp協議和zabbix discovery方式來監控。

5)其它方面的監控,主要是應用程式的監控。

最後,發表此文章的主要目的是和廣大朋友相互交流和相互學習,在一些自定義監控專案上面提供更多一點自己的想法和使用經驗,如果在系統和應用的監控方面有更多好的想法,歡迎相互交流。

Zabbix分布式監控系統使用總結

從接觸和使用zabbix已經有2年多的時間,剛開始接觸也就是從zabbix安裝,使用和簡單的維護開始學習。到後來涉及到如何新增監控主機?如何自定義監控項?如何設定報警閥值?等開始學習。有幸在2013年底從零開始研究和選型整個公司idc監控系統。由於zabbix簡單易用和強大功能,決定用zabbix做...

zabbix 分布式監控proxy

概述 zabbix proxy 可以代替 zabbix server 收集效能和可用性資料,然後把資料匯報給 zabbix server,並且在一定程度上分擔了zabbix server 的壓力.此外,當所有agents和proxies報告給乙個zabbix server並且所有資料都集中收集時,使...

企業級分布式監控系統 zabbix

zabbix 是乙個企業級的分布式開源監控方案。zabbix重要的不是部署,而是學會操作使用,所以推薦大家進行一鍵部署。手動部署可參考官方文件 一鍵部署可參考 docker上一鍵部署 乙個監控系統執行的大概的流程是這樣的 zabbix agent需要安裝到被監控的主機上,它負責定期收集各項資料,併發...