Linux系統的排查思路

2021-09-12 14:49:56 字數 3046 閱讀 2890

處理linux系統故障的思路:

1.重視錯誤提示資訊。

2.查閱日誌檔案 。message (系統日誌) 服務的日誌 error(應用日誌)

3.分析,定位問題。

4.解決問題。

忘記root密碼?

重置:centos5或者6 啟動載入grub引導選單時 按esc 找到當前系統引導選項。

按方向鍵找到需要的系統引導核心,按 「e「 進入編輯狀態。

然後通過方向鍵選中帶有kernel指令的行 繼續按"e" 在行尾**空格新增『single』 修改完成後

按回車鍵進入上一級選單。然後按"b".進入單使用者模式, passwd 輸入2次相同的密碼。

然後重新啟動系統 (reboot 或是 init 3)

重置centos7 下的密碼:

同樣進入 kernel行尾新增 init=/bin/sh

ctrl +x 啟動shell引導,進入單使用者模式。

掛載根分割槽:

mount -o remount,rw /

如果系統開啟了 selinux 需要在根分割槽建立 autorelabel檔案 (touch /.autorelabel)

passwd 輸入2次一樣的密碼

重新啟動: exec /sbin/init

linux 啟動不了?

援救模式啟動系統。

模擬故障: 修改 /etc/fstab # \mv /etc/fstab /etc/fstab.bak

啟動系統:出現錯誤;

starting system logger: can『t open or create /var/run/syslogd.pid. can『t write pid .

解決方法: 在光碟機中放入系統盤。用系統盤重新引導啟動。

進入修復模式:rescue installed system

啟動到shell最終進入 bash-4.1# 命令提示符下:

可以檢視系統分割槽情況: # fdisk -l

檢視根分割槽的具體位置: tune2fs -l /dev/sda2 | more

(/dev/sda2這個引數根據具體分割槽情況 查詢到/ 目錄 因為fstab在根目錄下)

找到根分割槽後掛載根分割槽。然後重構 fstab檔案

重新啟動系統。看是否讀取fstab成功。

檔案系統受損(一般在頻繁讀寫的時候出現斷電。容易造成檔案系統錯誤)

如何檢視檔案體統型別:

1. file -s /dev/sda2

2. mount

3. df -t /dev/sda2

4. more /etc/fstab

如果系統不能修復就需要手動修復了:

1.解除安裝 分割槽 umount

2. 修復 fsck.ext4 -y /dev/sda5

linxu網路問題?

1.網路硬體異常。(網線,網絡卡,路由器,交換機)

2.檢查網絡卡是否正常工作(網絡卡配置檔案是否正確)

3.檢查dns設定 /etc/resolv.conf /etc/hosts(網域名稱解析服務衝突)

4.服務是否正常開啟。可以通過telnet或者netstat命令檢視服務是否正常。

5.訪問許可權是否開啟,從本機iptalbes 防火牆,linux核心強制訪問控制策略selinux。

6.區域網主機之間聯接是否正常,可以通過ping自身ip。ping區域網其它主機ip,ping閘道器

位址確定區域網連線正常。

檢視網路路由資訊。動態監測 :

mtr 網域名稱或ip

traceroute 網域名稱或ip

檢查服務是否正常:例如sshd 服務:

# telnet 192.168.1.123 22

(成功進入telnet後 。如何退出? ctrl + ] 進入telnet> quit 退出

檢查區域網主機之間聯機是否正常:

ping ip | telnet ip port

錯誤解析: 一般操作檔案系統時。例如 執行 mkdir 時 出現:「read-only file system「

可能是檔案系統資料塊出現不一致導致的,也有可能是磁碟故障造成的。

對於簡單的錯誤,檔案系統一般可自行修復,當遇到致命錯誤無法修復時,檔案系統為了保證資料一致性和安全,會暫時遮蔽檔案系統的寫操作,將檔案系統變為唯讀,進而出現了上面的「read-only file system」現象。

解決: fsck命令修復

解除安裝 分割槽。umount

可以檢視 檔案所占用的pid : fuser /

執行 fsck (fsck會自動識別檔案系統型別)

檔案許可權問題:

# su - swa

su: warning: cannot change directory to /home/swa: permission denied

su: /bin/bash: permission denied

檢視 /home/下的許可權:

# ls -al

drwxr-xr-x. 3 root root 4096 jan 29 04:03 .

drw-rw-rw-. 24 root root 4096 jan 29 01:41 …

drwx------ 2 swa swa 4096 jan 29 04:03 swa

這裡發現 。。 目錄沒有x (執行許可權)

# chmod 755 … (修改許可權)

成功切換登入。

還可以通過 stat 檢視 許可權

stat …

file: `…『

size: 4096 blocks: 8 io block: 4096 directory

device: 802h/2050d inode: 1046530 links: 3

access: (0755/drwxr-xr-x) uid: ( 0/ root) gid: ( 0/ root)

access: 2017-01-29 04:03:28.585978590 +0800

modify: 2017-01-29 04:03:08.505176624 +0800

change: 2017-01-29 04:03:08.505176624 +0800

linux運維系統故障排查思路

一 linux系統故障的一般處理思路 報錯資訊 查閱日誌檔案 分析定位問題 解決問題。二 linux系統無法啟動原因及解決 系統無法啟動的原因很多,常見的有下面幾種情況 1 檔案系統被破壞,常常因斷電和非法關機引起檔案系統結構不一致。修復方法是用fsck命名強制修復,進入單使用者模式或者互動介面,按...

Linux 系統故障排查思路簡析

處理linux系統故障的思路 1.重視錯誤提示資訊。2.查閱日誌檔案 message 系統日誌 服務的日誌 error 應用日誌 3.分析,定位問題。4.解決問題。忘記root密碼?重置 centos5或者6 啟動載入grub引導選單時 按esc 找到當前系統引導選項。按方向鍵找到需要的系統引導核心...

linux系統基本排查

1.檢視記憶體使用情況 free g當觀察到free欄已為0的時候,表示記憶體基本被吃完了,那就釋放記憶體吧。釋放記憶體 sync echo 3 proc sys vm drop cachessync表示將記憶體快取區內容立即同步到磁碟,為了保證安全可以多執行幾次。2.檢視磁碟使用情況 df h當發...