線上操作與線上問題排查實戰

2021-09-16 12:47:02 字數 998 閱讀 1299

問題:1.2.3.4的sshd的監聽埠是22,如何統計1.2.3.4的sshd伺服器各種連線狀態(time_time_wait/close_wait/estestablestablishestablished)連線數。

說明:netstat是追查網路連線問題的常用工具,結合grep/awk使用。

說明:線上日誌檔案一般以bz2壓縮之後保留。使用bzcat和bzgrep來讀取。

問題:打包備份/opt/web/www/目錄,排除掉目錄中的logs目錄,打包好的檔案存放在/opt/backup目錄下。

說明:在專案需要打包遷移時,常常需要排除掉日誌目錄,exclude是需要掌握的引數。

問題:找出伺服器上,某個正在執行的tomcat產生的大量異常日誌,找出該檔案,並釋放空間。

參***:

第一步,找到該檔案

find / -type f -name "log" | xargs ls -lsh | more

du -a / | sort -rn | grep log | more

find / -name 'log' -size +1000m -exec du -h {} ;

第二步,將檔案清空

假設找到的檔案為a.log

正確的情況方式應該為:echo "">a.log,檔案空間會立刻釋放。

很多同學:rm -rf a.log,這樣檔案雖然刪除,但是因tomcat服務仍在執行,空間不會立刻釋放,需要重啟tomcat才能將空間釋放。

問題:顯示server.conf檔案,遮蔽掉#號開頭的注釋行。

問題:磁碟io異常如何盤查,類似寫入慢或當前使用率高,請查出導致磁碟io異常高的程序io。

第一步:iotop -o 檢視當前正在寫磁碟操作的所有程序id資訊。

第二步:如果此時各項寫入指標都很低,基本沒有大的寫入操作,則需要排查磁碟自身。可以檢視系統dmesg或cat /var/log/message 看看是否有相關的磁碟異常報錯,同時可以在寫入慢的磁碟上touch 乙個空檔案看看,是否磁碟故障導致無法寫入。

線上操作與線上問題排查實戰

一 了解機器連線數情況 問題 192.168.88.136的sshd的監聽埠是22,如何統計192.168.88.136的sshd服務各種連線狀態 time wait close wait established 的連線數。netstat an grep 192.168.88.136 22 awk ...

線上操作與線上問題排查實戰

一 了解機器連線數情況 問題 192.168.88.136的sshd的監聽埠是22,如何統計192.168.88.136的sshd服務各種連線狀態 time wait close wait established 的連線數。netstat an grep 192.168.88.136 22 awk ...

Mycat 線上問題排查實戰

背景 由於分片字段儲存由原來的純數字變為字母 數字以及數字 純字母三種混合,準備直接修改分片規則,另外伺服器資源配置調整了一下,由原來的16cpu 32g 調整到8cpu 32g,以適應新的業務需求,由原有的mod long求模法變為sharding by murmur 一致性hash 規則,配置好...