k8s 離線安裝 阿里開源 k8s 事件通知服務

2021-10-11 13:45:29 字數 3615 閱讀 8267

在 kubernetes 開源生態中,資源監控有metrics-serverprometheus等,但這些監控並不能實時推送 kubernetes 事件,監控準確性也不足。當 kubernetes 集群中發生 pod因為 oom 、拉取不到映象、健康檢查不通過等錯誤導致重啟,集群管理員其實是不知道的,因為 kubernetes 有自我修復機制,pod宕掉,可以重新啟動乙個。這樣讓集群管理員很難立即發現服務問題。

kubernetes中,事件分為兩種:

例子:

$ kubectl get events

last seen type reason object message

58m normal scalingreplicaset deployment/demo scaled down replica set demo-8b85c64cb to 0

5m7s warning unhealthy pod/demo-79844f78b8-nd5jz readiness probe failed: get dial tcp 192.168.1.68:8080: connect: connection refused

阿里雲開源 kubernetes 事件離線工具kube-eventer,能很好的解決這個問題。

下面是以釘釘做為接收器,通過釘釘機械人通知到相關人員或者相關群

dingtalk阿里 sls 服務elasticsearchhoneycombinfluxdbkafkamysql

K8s部署prometheus監控K8s細節

prometheus 一些配置檔案可以再github上找到。部署 root kube prometheus manifests 目錄下所有檔案 部署 root kube prometheus manifests setup 目錄下所有檔案 要注意的是自己要建立乙個工作空間 如果報錯執行下面語句 部署...

k8s集群部署 docker部署k8s安裝篇

1 安裝docker 緊接著配置乙個穩定 stable 的倉庫 倉庫配置會儲存到 etc yum.repos.d docker ce.repo檔案中 yum config manager add repo 更新yum安裝的相關docke軟體包 安裝docker ce yum update y yum...

K8s集群環境搭建 K8s安裝(2)

k8s集群環境搭建 基礎環境配置 1 k8s集群環境搭建 k8s安裝 2 k8s集群環境搭建 安裝keepalived和haproxy 3 k8s集群環境搭建 k8s集群初始化 4 k8s集群環境搭建 安裝metrics和dashboard 5 一 安裝docker 所有節點 檢視docker版本有...