Alertmanager告警規則編寫案例(十二)

2021-10-19 21:41:38 字數 597 閱讀 2807

首先要將一些類似的監控項規劃到乙個分組,在定義表示式、告警級別、告警詳細內容,在告警詳細內容中一定要熟練使用監控項自身的標籤,這樣就可以在告警內容中讓管理員一眼知道什麼觸發了告警

expr指定表示式,在使用邏輯符號匹配閾值

告警內容中要熟練運用各種標籤,標籤都是監控項中自帶的,value標籤就是當前監控項的乙個指標

[root@prometheus-server /data/prometheus]# vim rules/node.yml

groups:

- name: node.rules

rules:

- alert: nodefilessystemusage

expr: 100 - (node_filesystem_free_bytes / node_filesystem_size_bytes *100) > 80

for: 1m

labels:

serverity: warning

annotations:

summary: "主機 } : } 磁碟使用率過高"

description: "} : {

alertmanager郵件告警

alertmanager郵件告警 這篇文章是基於之前部落格進行開展的 關於計畫任務的乙個小需求 利用了prometheus 下 process exporter對crond計畫任務程序監控的,grafana內建的監控報警有點醜,如下圖 而且配置不夠靈活,沒有分組,靜默等東西配置。所以就有了這個ale...

對alertmanager 告警有延遲的理解

目錄 1.prometheus 2.告警狀態 3.告警規則for 即持續時間 4.例子 5.alertmanager 告警評估時間週期 evaluation interval 預設1m metrics收集週期 scrape interval 預設1m inactive 既不觸發告警也不是掛起狀態 p...

Alertmanager配置檔案詳解

重點 apiversion v1 kind configmap metadata name alert config namespace kube ops data config.yml global 在沒有報警的情況下宣告為已解決的時間 resolve timeout 5m 配置郵件傳送資訊 sm...