伺服器故障 專業人員該做出什麼反應

2021-09-23 08:23:33 字數 1032 閱讀 7653

過去我們對於電視訊號不好的解決方案,都有乙個共識:拍一拍

現在我們對於電腦、手機宕機的解決方案也有乙個共識:重啟

伺服器故障怎麼辦

但是,當我們面對伺服器出現故障時,又該做出什麼反應呢?如果你要是拍一拍,估計伺服器不會給你任何反應,但是你的同事可能會用狐疑的眼神兒看你;如果你立刻重啟,你的上司可能會臭罵你一頓。那麼伺服器故障時,作為專業的技術人員該做出什麼反應?

知己知彼

知己知彼

如果你是新人,想要知己知彼,就一定先要搞清楚伺服器硬體情況。因為有時候伺服器是裸機狀態,所以,如果你不了解伺服器的硬體情況,了解一下這裡的it架構和具體的硬體資訊是很有必要的。諸如網路狀態、有沒有不間斷電源、硬碟是否支援熱插拔、伺服器是不是ha高可用集群等問題。

摸清表層

即便只是看清表層,我們也需要盡可能多的了解有用資訊,例如:伺服器何時故障的?故障表現是什麼?故障有沒有呈現規律性?上一次更新是什麼時候,更新了什麼等問題。畢竟伺服器不是電腦,如果你沒搞清楚狀況就進行強行關機,很可能造成資料丟失,而且還沒解決問題。要記住,伺服器是7*24小時開機的存在。

只有了解了伺服器故障的基本邏輯,檢視了日誌等資訊,盡可能的了解問題所在,才能給出具體的解決方案。

了解過去

我們常說以史為鑑或者讀史使人明志,其中都體現了了解過去的重要性。所以我們要先看一下過去都發什麼可什麼。檢視歷史操作記錄,可以了解過去有誰登陸了,都執行了那些命令,更多的資訊對於你的判斷準確性由很大的提公升。但是,作為admin使用者,在檢視歷史記錄時,要注意不要利用自己的許可權去侵犯別人的隱私。

看清現狀

看清現狀

然後你就可以根據自己的判斷,對伺服器進行修復了。

切記,在伺服器上,拍一拍和萬能的重啟都是莽撞之舉,在伺服器出現故障時,要了解伺服器故障的具體原因,方能對症下藥。

伺服器硬體故障排查

電源故障現象 1 接電源線 電源燈不亮 2 電源指示燈報警 3 電源燈正常 按開機鍵無反應 排查方式 1 檢測電源線的接觸是否有鬆散 2 替換電源測試 3 供電環境檢測 是否存在電壓不穩定 4 檢視事件日誌 主機板故障現象 1 按開機鍵無效,黑屏 2 裝置啟動正常,接顯示器黑屏 3 裝置某些介面或者...

華為伺服器故障燈不開機 華為伺服器

通過檢視串列埠輸出確認imana 200 ibmc系統是否反覆復位。當串列埠日誌反覆列印如下資訊,表示imana 200 ibmc系統反覆復位。jffs2 load complete 1107083 bytes loaded to 0x8b000000 booting kernel from leg...

伺服器電源故障解決過程

伺服器 dell 執行環境 較差 工作強度 低 一日,伺服器宕機,嘗試開機,風扇轉動,五到十秒後停止,顯示器上無顯示。重複了多次,故障依舊。原來沒有開過機箱,沒敢動手。先找到說明書,英文的,慢慢檢視其結構說明和常見故障。考慮到電源問題,斷電,開啟機箱。從電源線介面卸下螺絲,想拉出 電源 發現有線纜接...