如何排查Linux伺服器崩潰的問題

2021-10-16 15:18:26 字數 1773 閱讀 7188

眾所周知,linux伺服器以可靠著稱。在企業環境中偶爾的系統崩潰可能看起來影響不是很多,但是準確地診斷系統故障的原因是必須的,因為系統故障可以明顯影響潛在的軟體或硬體問題指標。儘管故障診斷非常艱鉅,但通過使用本指南中提到的工具,您可以確保你能夠應對各種艱難的挑戰。

因為每個伺服器都是不同的,本指南並非在幫助你找出事故的確切原因。重點是你可以使用工具來獲得重要資訊來診斷問題。

linux程序管理

伺服器崩潰後第一步應該檢查您的系統上執行的所有程序,以確保一切都是有效地執行。linux內建的 top命令允許您檢視cpu使用率,記憶體使用,交換記憶體、快取大小、緩衝區大小,程序pid、使用者、命令等等。這些簡單的命令可以對故障進行初始診斷分類以便立即您檢視系統資訊。

使用此命令簡化終端top輸出

htop——乙個功能更強大的解決方案這可以使伺服器管理工作更容易,安裝這個工具後,極大增強了故障排除能力,且提供更直觀的資訊。htop的關鍵特性包括乙個顏色編碼介面; 快捷鍵; 水平和垂直滾動等等。然而htop不是預設安裝在linux系統,可以使用下面的命令新增到基於centos和redhat的系統,~ yum install htop在ubuntu系統上,htop可以用以下命令安裝:~ sudo apt-get install htop

分析網路流量

有時候伺服器崩潰將引發網路流量問題。有效的包分析是至關重要的決定是否在資料中心,客戶端系統,甚至直接在伺服器上引發崩潰問題。

tcpdump

tcpdump是可用於linux系統的最廣泛使用的命令列網路資料報分析工具之一。對於伺服器管理員來說,這是乙個至關重要的工具,因為它允許他們捕獲或過濾在特定介面上通過網路接收或傳輸的tcp/ip資料報。該程式還允許您將資料儲存到檔案中以進行進一步分析。儘管在本指南中完全介紹tcpdump的使用是不切實際的,但tecmint.com還是提供了乙個快速入門指南,供伺服器管理專業人員在方便時使用。

netstat

當您查詢簡單的網路統計資訊時,netstat是執行此任務的理想工具。此命令可用於監控傳入和傳出的網路資料報,以及檢視每個網路裝置的介面統計資訊。與tcpdump一樣,在此處列出命令的數量也不切實際,但是tecmint.com提供了有用的技術指南。

wireshark

wireshark是幾乎所有伺服器管理員都必須使用的重要工具,因為它是伺服器管理員可以使用的最強大且廣泛支援的資料報監視工具之一。關鍵功能包括:〜voip分析,支援數百種通訊協議,能夠儲存許多不同的捕獲格式等等。對於任何型別的資料報分析,在大多數情況下,wireshark可能都是伺服器管理員唯一需要的工具。

檢查日誌

當所有其他方法均失敗時,瀏覽伺服器日誌是解決所有錯誤的最佳方法之一。通常,檔案位於/var/log/syslog和/var/log/目錄中。但是檢視原始日誌通常是無用的,因為它們通常包含數千個條目,並且如果沒有日誌分析工具就不可能完全理解資料。簡化日誌分析的方法如果您要分析常規伺服器流量日誌,那麼優秀的分析工具對於任務便於管理至關重要。對於web伺服器流量分析,awstats是許多伺服器管理員的首選工具,因為它是乙個免費的應用程式,可以將資料圖形化。儘管awstats並不像前面提到的工具那樣專注於底層資訊,但是它提供了一些關鍵指標。借助awstats,諸如http錯誤,負載均衡伺服器的集群報表,每小時流量日誌以及高峰時間報表以及訪問者ip位址等資料都是確定伺服器崩潰可能觸發因素的關鍵指標。對於需要高效能日誌管理解決方案的使用者,site24x7提供了各種工具,適用於需要快速解決伺服器問題的企業客戶。除了監控包含60多個效能指標的伺服器外,site24x7還提供對日誌管理工具的訪問,該工具使對日誌資料的篩選更加容易。該監視工具還提供了cron作業,任務,守護程式,檔案和目錄監控功能,使您可以更加主動的來提高安全性。​

Linux伺服器排查

一 檢視當前登入使用者 w 檢視是否有異常使用者登入,有則強制斷開該使用者 pkill kill t 二 檢視使用者登入伺服器的ip資訊 last 資訊會存入 var log secure 檔案中 注意是否刪除 三 history 曾今做過什麼 注意有沒有使用wget 或 curl 等命令 五 ps...

伺服器崩潰

今天上午發現公司伺服器,連線不上,公司伺服器是超微x9drh 7f的主機板,4根16g記憶體條,3個320g的和乙個500g容量的硬碟。最初卡在乙個system initialization 後面還有乙個b子沒有顯示完全,網上一查,覺得可能是backgroud initialization raid...

伺服器被入侵如何排查?如何防止伺服器被入侵?

遇到很多次客戶伺服器被入侵的情況,有些伺服器被植入木馬後門 有些被檢查出有挖礦程式 有些發現登入密碼不對,被惡意登入修改了密碼,遇到了伺服器被入侵的情況應第一時間聯絡服務商售後處理將損失降低到最低程度,讓 遊戲等業務恢復。根據以往的處理經驗,總結了一些伺服器被入侵的排查方法,專門用來檢查伺服器第一時...