Linux 運維故障排查思路,有這篇文章就夠了

2021-10-08 21:57:17 字數 451 閱讀 9296

有時候會遇到一些疑難雜症,並且監控外掛程式並不能一眼立馬發現問題的根源。這時候就需要登入伺服器進一步深入分析問題的根源。那麼分析問題需要有一定的技術經驗積累,並且有些問題涉及到的領域非常廣,才能定位到問題。所以,分析問題和踩坑是非常鍛鍊乙個人的成長和提公升自我能力。如果我們有一套好的分析工具,那將是事半功倍,能夠幫助大家快速定位問題,節省大家很多時間做更深入的事情。

本篇文章主要介紹各種問題定位的工具以及會結合案例分析問題。

套用5w2h方法,可以提出效能分析的幾個問題

針對應用程式,我們通常關注的是核心cpu排程器功能和效能。

執行緒的狀態分析主要是分析執行緒的時間用在什麼地方,而執行緒狀態的分類一般分為:

on-cpu:執行中,執行中的時間通常又分為使用者態時間user和系統態時間sys。

如果大量時間花在cpu上,對cpu的剖析能夠迅速解釋原因;如果系統時間大量處於off-cpu狀態,定位問題就會費時

論運維之故障排查思路與方法

運維故障思路剖析 1 出了問題冷靜分析,仔細聽通告者描述的問題,勿要慌張理清思路 2 根據描述問題檢視相應的服務有沒有埠 後台是否有執行的程式 防火牆的策略 網路問題 報錯日誌 3 如若有些開源軟體需要連線至資料庫,在看資料庫的埠 後台執行的程式,是否能登入 4 一般到了這一步就是疑難問題啦!仔細分...

linux運維系統故障排查思路

一 linux系統故障的一般處理思路 報錯資訊 查閱日誌檔案 分析定位問題 解決問題。二 linux系統無法啟動原因及解決 系統無法啟動的原因很多,常見的有下面幾種情況 1 檔案系統被破壞,常常因斷電和非法關機引起檔案系統結構不一致。修復方法是用fsck命名強制修復,進入單使用者模式或者互動介面,按...

Linux 系統故障排查思路簡析

處理linux系統故障的思路 1.重視錯誤提示資訊。2.查閱日誌檔案 message 系統日誌 服務的日誌 error 應用日誌 3.分析,定位問題。4.解決問題。忘記root密碼?重置 centos5或者6 啟動載入grub引導選單時 按esc 找到當前系統引導選項。按方向鍵找到需要的系統引導核心...