nagios 總結 運維監控之nagios

2021-10-13 20:00:38 字數 1307 閱讀 5230

無監控,不運維。

沒有了監控,運維靠什麼排查問題?靠什麼調優?靠什麼規劃資源?因此,監控系統對於做好運維是必不可少的。

目前,比較流行的開源監控有zabbix、nagios、pormetheus、open-falcon等。

nagios是一款開源的伺服器和網路監視工具,能有效監控windows、linux和unix的主機狀態,交換機路由器等網路設定,印表機等。

nagios 通過服務端週期性的執行命令,檢查監控裝置的狀態,通過命令的返回值來判斷狀態是否正常。如果週期內,有多少次不正常就傳送告警。注重的是狀態監控。

命令可以自定義,可以自己寫指令碼完成,只要輸出返回值,nagios就可以進行狀態判斷。這就是nagios的靈活的地方。

但是,nagios定義的命令那個 能在本地執行,怎麼監控遠端的伺服器?或者說是怎麼在遠端伺服器上執行命令命令,並返回監控專案的狀態呢?

這時候就要用到nrpe,被監控客戶端需要安裝nrpe,並啟用nrpe服務,缺省會啟用5666埠;服務端也是需要安裝nrpe,但是需要用到的命令那個是check_nrpe,這個命令可以呼叫遠端已經定義好的命令。

因此,只要服務端週期性,呼叫check_nrpe命令執行遠端的命令並返回狀態,就可以判斷遠端機器的狀態。

同時nagios也可以同步命令那個返回對應的效能資料,可以指定格式儲存到對應的文字中。可以通過分析文字裡面的資訊獲取歷史資料。

命令輸出狀態用於判斷服務狀態,同時命令的輸出會被當成資訊展示出來,通過 "|"分割展示資訊和效能資料。

例如:

ok - cpu load is ok | load1=2;16;32   load5=0.1;14;32   load15=0.2;12;32
nagios配置都是檔案,需要在終端下進行配置,比較不方便。也有可以存到資料庫的解決方案可以選擇。

nagios配置比較不方便,修改命令的時候,需要下發命令指令碼,修改配置檔案。

nagios自帶的web自展示狀態和配置資訊,沒有針對性能數進行展示,需要搭建另外的服務進行圖表展示。例如:pnp。

官方文件裡面也有一套 nagios + nagflux + influxdb + grafana的方案。可以展示比較好看的圖表

nagios是比較靈活,但是靈活以為著可以有很多選擇,很多事情都要自己來定義。

你覺得nagios怎麼樣呢?

運維監控利器nagios

nagios的概念和功能 nagios是一款開源的免費網路監視工具,其功能強大,靈活性強。能有效監控windows linux和unix的主機狀態,交換機 路由器等網路設定,印表機等,在系統或服務狀態異常時發出郵件或簡訊報警第一時間通知 運維人員,在狀態恢復後發出正常的郵件或簡訊通知。nagios可...

hyspider之智慧型運維監控

借助scrapyd,可以通過http請求遠端排程爬蟲。scrapy.cfg中加入deploy配置 scrapyd安裝 pip install scrapyd 啟動scrapyd,scrapyd deploy上傳的檔案存放到 安裝scrapyd client pip install scrapyd c...

Linux系統運維之運維監控 pdf格式

linux系統運維之運維監控 本文是系統運維工程師的實用手冊 主要講解基於 linux 平台運維工作中需要掌握的監控知識 本文全部基於實際應用 部署步驟詳細 可以直接複製用於生產環境的安裝配置 幫助剛剛接觸 linux運維的朋友們,迅速搭建企業級的監控平台。本文共分為五個部分 第一部分簡單的介紹了監...