linux服務監控及運維

2022-09-26 13:12:46 字數 2199 閱讀 2978

目錄

1.1、安裝壓縮包:以root身份登陸centos依次 執行以下命令:

wget

如果wget 下不下來,則直接在瀏覽器中複製 貼上鏈結 **下來,用ftp傳輸工具傳輸到linux上,然後再進行下面的操作

1.2 解壓: tar zxvf psutil-2.1.3.tar.gz

1.3 進入解壓完的目錄:cd psutil-2.1.3/

1.4 啟動安裝: python3 setup.py install

1.5 驗證: 在命令視窗輸入 python3,然後 輸入 :

import psutil 不報錯,則證明安裝 成功

接著輸入:

res = psutil.process_iter()

for var in res:

​ print(var)

則會顯示一堆資訊

程式設計客棧

import psutil

proc_dict = {}

#id:程序名

proc_name = set()

#關於程序的集合,集合去重

for p in psutil.process_iter():

proc_dict[p.pid] = p.name()

proc_name.add(p.name())

print(proc_dict)

print('\n\n--------------------------\n')

print(proc_name)

proc_stop = monitor_name - proc_name

即:需要監控的服務name 減去 作業系統中所有服務的name

1.使用os.system(命令)啟用 服務。

完整**如下:

import psutil

import os

#如果需要發郵件給通知管理人員可能需要使用 request 和 json

#import request

#import json

import time

time_now = time.strftime('%y-%m-%d %h:%m:%s',time.localtime())

#要監控的服務

monitor_name =

#啟動命令

monitor_map =

while true:

#作業系統中所有程序的字典

proc_dict = {}

#作業系統中所有的程序名集合

proc_name = set()

#psutil.process_iter()會返回作業系統下所有程序名及程序id

for p in psutil.process_iter():

proc_dict[p.pid] = p.name()

proc_name.add(p.name())

print(proc_dict)

print('\n\n--------------------------\n')

print(proc_name)

# monitor_name - proc_name == died process name

#提取到那個監控程序沒有啟動

proc_stop = monitor_name - proc_name

print(proc_stop)

if proc_stop:

for p in proc_stop:

p_status = '停止'

p_name = p

data =

headers =

#sewww.cppcns.comnd_data = json.dumps(data).encode('utf-8')

#發郵件給管理人員

#request.post(url=url,data=send_data,headers=headers)

os.system(monitor_map[p])

proc_name = set()

for p2 in psutil.process_iter():

proc_name.add(p2.name())

if p in proc_name:

print("重啟成功")

else:

print("重啟失敗")

tplictegime.sleep(2000)

執行之後的效果:

運維架構服務監控Open Falcon

一 介紹 監控系統是整個運維環節,乃至整個產品生命週期中最重要的一環,事前及時預警發現故障,事後提供翔實的資料用於追查定位問題。監控系統作為乙個成熟的運維產品,業界有很多開源的實現可供選擇。當公司剛剛起步,業務規模較小,運維團隊也剛剛建立的初期,選擇一款開源的監控系統,是乙個省時省力,效率最高的方案...

Linux系統運維之運維監控 pdf格式

linux系統運維之運維監控 本文是系統運維工程師的實用手冊 主要講解基於 linux 平台運維工作中需要掌握的監控知識 本文全部基於實際應用 部署步驟詳細 可以直接複製用於生產環境的安裝配置 幫助剛剛接觸 linux運維的朋友們,迅速搭建企業級的監控平台。本文共分為五個部分 第一部分簡單的介紹了監...

運維架構服務監控Open Falcon介紹

一 open falcon介紹 監控系統業界有很多傑出的開源監控系統。我們在早期,一直在用zabbix,不過隨著業務的快速發展,以及網際網路公司特有的一些需求,現有的開源的監控系統在效能 擴充套件性 和使用者的使用效率方面,已經無法支撐了。因此,從各位sre sa devs的使用經驗和反饋出發,結合...