監控運維系統實施方案 監控物件資訊收集階段

2021-09-23 19:11:09 字數 3456 閱讀 1602

原始出處 、作者資訊和本宣告。否則將追究法律責任。

監控運維系統不是一件一蹴而就的事情,也不是一朝一夕就能輕易完成的,監控運維系統的規模與伺服器規模和軟體規模息息相關,需要仔細分析和籌畫才能實現乙個可用的監控運維系統。   

為了直觀的表示當前系統(除非特殊說明都指作業系統)和應用的執行狀態,能讓不熟悉運維知識的leader看明白當前的執行狀態,最好的方法就是運用圖的方式將這些系統和應用之間的邏輯關係展示出來。根據系統和業務兩種區分可以將它們分成三張圖(這些圖可以叫做系統架構圖、軟體架構圖和業務邏輯圖)。    

1.系統架構圖:表示所有系統的堆疊關係,例如物理伺服器和虛擬伺服器用不同的形式在圖中展示出來,通過此圖一眼就能看到那些系統存在問題,存在什麼問題    

2.業務邏輯圖:單獨表示業務邏輯,將業務邏輯之間的依賴關係和其他關係表示出來,便於在發現整體故障時,確定**存在問題能導致整體故障的發生,通過此圖一眼就能看到那些業務存在問題,存在什麼問題    

3.軟體架構圖:表示業務與系統的對應關係,即那些業務執行在哪些系統中,或每個系統執行著那些業務,便於當出現問題時該去排查哪些系統或者哪些模組

為了達到較好的監控效果,需要準備以下一些內容:   

1.硬體層面:當前伺服器的實際使用情況,例如伺服器的數量,主機名稱(規範的fqdn),ip位址(有多少位址寫多少位址),作業系統類別,管理方式和管理資訊(如何遠端登入、使用者名稱和密碼等);如果可能,最好包含有網路裝置的相關資訊,如與伺服器的連線方式、頻寬等相關資訊    

2.作業系統層面:不管作業系統是虛擬的還是非虛擬的,對於監控來說都是乙個完整的監控實體,與硬體層面的伺服器一樣,它也需要確切的知道主機名稱(規範的fqdn),ip位址(有多少位址寫多少位址,並區分管理位址和業務位址等),作業系統類別,管理方式和管理資訊(如何遠端登入、使用者名稱和密碼等)    

3.軟體(業務)層面:每乙個業務模組的名稱、提供的功能,依賴關係(該業務模組需要哪些其他的業務模組,哪些業務模組需要該業務模組),程序或服務名稱,監聽的ip位址和埠(socket),每乙個業務模組正常執行時的可監控狀態(如返回值是多少正常,輸出什麼字串是正常等)    

4.軟體層面中每乙個業務模組與作業系統層面的對應關係,業務模組需要作業系統中那些軟體包(依賴關係)、安裝路徑、可用的診斷程式和維護工具等

一些可參考的**

表1:伺服器監控列表

伺服器序號

主機名稱

ip位址1

ip位址2

作業系統類別

登入方式

管理位址

管理使用者名稱

管理密碼備註1

rc220.domain.cn

221.0.92.31

192.168.1.100

linux ubuntu

idrac

221.0.93.31

username

password

2bb200.domian.cn

-192.168.1.200

vmware esxi5.5

ucs manager

192.168.1.200

username

password

表2:作業系統監控列表

作業系統序號

主機名稱

ip位址1

ip位址2

作業系統類別

是否虛擬機器

登入方式

使用者名稱密碼備註1

node1.domain.cn

221.0.92.31

192.168.1.100

linux ubuntu

-ssh

username

password

2node2.domain.cn

-192.168.1.101

linux ubuntu

-ssh

username

password

3vcenter.domian.cn

-192.168.1.201

linux suse

是vsphere client

username

password

表3:業務模組監控列表

業務模組序號

模組名稱

模組功能描述

依賴關係a

依賴關係b

程序名稱(完整命令列)

監聽ip位址

監聽埠正常狀態描述

1關聯式資料庫

mysql資料庫

-資訊收集服務         

資訊查詢服務

mysqld_safe --datadir=/data/mysql

192.168.1.100

3306

3306埠已監聽,程序存在,允許連線,資料庫存在,資料庫表存在,資料庫字段存在

2資訊採集服務

收集使用者資訊

關聯式資料庫         

web伺服器1

終端使用者         

資訊查詢服務

command --parameter=/path

192.168.1.101

8081

***埠已監聽,***程序存在,返回值為***,*** url返回***

3資訊查詢服務

查詢使用者資訊

關聯式資料庫         

資訊採集服務

終端使用者

command --parameter=/path

192.168.1.102

8082

***埠已監聽,***程序存在,返回值為***,*** url返回***

4 表4:業務模組與作業系統對應關係

編號模組名稱

業務模組序號

作業系統序號

軟體包/編譯引數

安裝路徑

可用診斷程式

維護工具備註1

關聯式資料庫11

mysql-server,mysql,musql-libs,mysql-devel

/usr

msyql,mysqladmin

mysql,mysqladmin

2資訊採集服務22

-/usr/local/wwwroot

curl,wget

-參考圖形可以用visio繪製,構圖需要根據上述**製作,由系統架構師、軟體架構師或者在公司多年了解系統架構和軟體架構的系統運維人員製作。

以上三圖依次為系統架構圖,軟體架構圖,業務與作業系統對應關係圖的大體示例。

--end--

本文出自 「通訊,我的最愛」 部落格,請務必保留此出處

監控運維系統實施方案 監控物件資訊收集階段

監控運維系統不是一件一蹴而就的事情,也不是一朝一夕就能輕易完成的,監控運維系統的規模與伺服器規模和軟體規模息息相關,需要仔細分析和籌畫才能實現乙個可用的監控運維系統。為了直觀的表示當前系統 除非特殊說明都指作業系統 和應用的執行狀態,能讓不熟悉運維知識的leader看明白當前的執行狀態,最好的方法就...

OA系統許可權分派實施方案

針對oa系統的特點,許可權說明 許可權 在系統中,許可權通過模組 動作來產生,模組就是整個系統中的乙個子模組,可能對應乙個選單,動作也就是整個模組中 在b s系統中也就是乙個頁面的所有操作,比如 瀏覽 新增 修改 刪除 等 將模組與之組合可以產生此模組下的所有許可權。許可權組 為了更方便的許可權的管...

OA系統許可權分派實施方案

任何系統都離不開許可權的管理,有乙個好的許可權管理模組,不僅使我們的系統操作自如,管理方便,也為系統新增亮點。l 不同職責的人員,對於系統操作的許可權應該是不同的。優秀的業務系統,這是最基本的功能。l 可以對 組 進行許可權分配。對於乙個大企業的業務系統來說,如果要求管理員為其下員工逐一分配系統操作...