記一次服務突然被kill掉的問題排查

2021-10-17 14:27:06 字數 590 閱讀 8241

專案部署在阿里雲伺服器,執行在docker容器中,後來發現容器會突然掛掉,沒有任何日誌輸出

執行命令:dmesg | grep 『killed process』

可以看到程序pid=4645的程序被kill掉了

再執行命令檢視記憶體空間:free -h

記憶體確實已經比較緊張,但還有一定空間

檢視oom-killer執**況:sudo less /var/log/messages | grep oom-killer

與服務掛掉的時間能對上,基本確定是記憶體不足引發了oom-killer,根據一定規則(占用記憶體、存活時間)提前kill掉了某些程序,從而保證系統安全

可以根據自己的業務,禁止kill掉關鍵程序:echo -17 > /proc/程序pid/oom_adj

另外雖然可以關閉oom保護機制,但是不建議,可能會引發更嚴重的問題,最好還是擴容或者遷走部分服務

記一次IOS提審被拒UIWebView問題

有一段時間沒更新文章了,最近幾天忙著ios sdk接入提審過審工作,此文記錄一次提審被拒的棘手問題,我不以專業的ios開發者,來記錄最有效的解決方案。這幾天提審ipa包,被拒審,內容如下 itms90809 instead,use wkwebview for improved security an...

記一次noprefixroute引發的問題

ip addr顯示內容 inet 中包含 noprefixroute,看著礙眼想去掉,不知道怎麼弄。最終找到了一台不顯示這項引數的機器,開啟其 etc sysconfig network scripts ifcfg ethx,多方比對發現配置了nm controlled no。該引數預設為yes,竟...

記一次伺服器被攻擊經歷

從接手公司伺服器兩個半星期經常性的無法正常ssh登陸,十次裡面有九次半都是顯示 ssh exchange identification read connection reset by peer 也谷歌很多種原因和解決方案,無非是分兩種 一是執行緒滿了,需要更改配置檔案把max session 調大...