Linux 系統故障排查思路簡析

2021-09-20 14:37:12 字數 3260 閱讀 9121

處理linux系統故障的思路:

1.重視錯誤提示資訊。

2.查閱日誌檔案 。message (系統日誌) 服務的日誌 error(應用日誌)

3.分析,定位問題。

4.解決問題。

忘記root密碼?

重置:centos5或者6    啟動載入grub引導選單時 按esc 找到當前系統引導選項。

按方向鍵找到需要的系統引導核心,按 「e「 進入編輯狀態。

然後通過方向鍵選中帶有kernel指令的行 繼續按"e" 在行尾**空格新增『single』 修改完成後

按回車鍵進入上一級選單。然後按"b".進入單使用者模式, passwd   輸入2次相同的密碼。

然後重新啟動系統 (reboot   或是  init 3)

重置centos7 下的密碼:

同樣進入 kernel行尾新增 init=/bin/sh

ctrl +x   啟動shell引導,進入單使用者模式。

掛載根分割槽:

mount  -o remount,rw /

如果系統開啟了 selinux 需要在根分割槽建立 autorelabel檔案 (touch /.autorelabel)

passwd  輸入2次一樣的密碼

重新啟動:  exec  /sbin/init    

linux 啟動不了?

援救模式啟動系統。

模擬故障: 修改 /etc/fstab  # \mv /etc/fstab /etc/fstab.bak

啟動系統:出現錯誤;

starting system logger: can't open or create /var/run/syslogd.pid.  can't write pid .

解決方法: 在光碟機中放入系統盤。用系統盤重新引導啟動。

進入修復模式:rescue installed system

啟動到shell最終進入   bash-4.1#    命令提示符下:

可以檢視系統分割槽情況: # fdisk -l

檢視根分割槽的具體位置: tune2fs -l /dev/sda2 | more

(/dev/sda2這個引數根據具體分割槽情況 查詢到/ 目錄 因為fstab在根目錄下)

找到根分割槽後掛載根分割槽。然後重構 fstab檔案  

重新啟動系統。看是否讀取fstab成功。

檔案系統受損(一般在頻繁讀寫的時候出現斷電。容易造成檔案系統錯誤)

如何檢視檔案體統型別:

1. file -s /dev/sda2

2.  mount

3.  df -t /dev/sda2

4.  more /etc/fstab

如果系統不能修復就需要手動修復了:

1.解除安裝 分割槽 umount

2.  修復  fsck.ext4 -y /dev/sda5

linxu網路問題?

1.網路硬體異常。(網線,網絡卡,路由器,交換機)

2.檢查網絡卡是否正常工作(網絡卡配置檔案是否正確)

3.檢查dns設定  /etc/resolv.conf    /etc/hosts(網域名稱解析服務衝突)

4.服務是否正常開啟。可以通過telnet或者netstat命令檢視服務是否正常。

5.訪問許可權是否開啟,從本機iptalbes 防火牆,linux核心強制訪問控制策略selinux。

6.區域網主機之間聯接是否正常,可以通過ping自身ip。ping區域網其它主機ip,ping閘道器

位址確定區域網連線正常。

檢視網路路由資訊。動態監測 : 

mtr  網域名稱或ip

traceroute 網域名稱或ip

檢查服務是否正常:例如sshd 服務:

# telnet  192.168.1.123 22

(成功進入telnet後 。如何退出? ctrl + ]   進入telnet> quit 退出 

檢查區域網主機之間聯機是否正常:

ping  ip   | telnet ip port

錯誤解析: 一般操作檔案系統時。例如 執行 mkdir 時 出現:「read-only file system「

可能是檔案系統資料塊出現不一致導致的,也有可能是磁碟故障造成的。

對於簡單的錯誤,檔案系統一般可自行修復,當遇到致命錯誤無法修復時,檔案系統為了保證資料一致性和安全,會暫時遮蔽檔案系統的寫操作,將檔案系統變為唯讀,進而出現了上面的「read-only file system」現象。

解決: fsck命令修復

解除安裝 分割槽。umount

可以檢視 檔案所占用的pid  :  fuser  /

執行 fsck   (fsck會自動識別檔案系統型別)

檔案許可權問題:

# su - swa

su: warning: cannot change directory to /home/swa: permission denied

su: /bin/bash: permission denied

檢視 /home/下的許可權:

# ls -al

drwxr-xr-x.  3 root root 4096 jan 29 04:03 .

drw-rw-rw-. 24 root root 4096 jan 29 01:41 ..

drwx------   2 swa  swa  4096 jan 29 04:03 swa 

這裡發現 。。  目錄沒有x (執行許可權)

# chmod  755 .. (修改許可權)

成功切換登入。

還可以通過 stat  檢視 許可權

stat ..

file: `..'

size: 4096            blocks: 8          io block: 4096   directory

device: 802h/2050d      inode: 1046530     links: 3

access: (0755/drwxr-xr-x)  uid: (    0/    root)   gid: (    0/    root)

access: 2017-01-29 04:03:28.585978590 +0800

modify: 2017-01-29 04:03:08.505176624 +0800

change: 2017-01-29 04:03:08.505176624 +0800

服務啟動問題: 啟動不了服務:

可以檢視 磁碟空間時候寫滿。或者 innode 是否寫滿。

服務啟動的時候,會寫入日誌。如果磁碟滿了,日誌檔案寫入不了。服務啟動不了。

linux運維系統故障排查思路

一 linux系統故障的一般處理思路 報錯資訊 查閱日誌檔案 分析定位問題 解決問題。二 linux系統無法啟動原因及解決 系統無法啟動的原因很多,常見的有下面幾種情況 1 檔案系統被破壞,常常因斷電和非法關機引起檔案系統結構不一致。修復方法是用fsck命名強制修復,進入單使用者模式或者互動介面,按...

系統故障排查

一 1.建立用於儲存mbr備份的新硬碟分割槽,並永久掛載 1 新建乙個目錄 mkdir backmbr 2 掛載 mount dev sdd1 backmbr 永久掛載 vim etc fstab 3 備份mbr扇區資料 dd if dev sda of backmbr mbr.bak bs 512...

Linux系統故障修復

linux系統中有乙個叫做單使用者模式的東西,類似windows系統中的安全模式。進入單使用者模式後,我們就可以在最小環境中進行系統的維護與修復,玩過linux系統的都知道linux中有乙個執行級別的概念,單使用者模式就是執行級別1。在單使用者模式中,系統會引導你進入根shell,並且禁用網路,大多...