centos6 系統slab記憶體一直線性增長

三、解決辦法

四、總結

原本一直執行比較穩定的阿里雲伺服器，突然有一天記憶體告警，大概使用95%左右。因當時事情比較多，清理系統記憶體快取後，此事就擱置了。但前幾天又收到記憶體告警簡訊，抽了點時間處理相關問題。以下將記錄問題從定位到解決的整個過程。

使用top後按記憶體排序，發現各程序使用率不高。最高的0.5%，平均0.2%左右。

從上圖可以看出，程序使用的記憶體不到10%.

a). 執行cat /proc/meminfo命令檢視記憶體使用分布情況。

從上圖我們可以看出系統總記憶體16g，而slab占用大概16g的記憶體。其中slab記憶體大部分可以**釋放，不可釋放的只有48m。

b). 執行slabtop檢視slab分布。

從上圖可以看出dentry幾乎佔了14g的空間。

c).檢視slab dentry狀態。

執行cat /proc/sys/fs/dentry-state命令

第一項：系統當前申請的dentry數目

第二項：系統當前未使用的dentry數目

第三項：當記憶體不足時，系統延遲**的時間(秒)

可以看出，有大量未使用的dentry，猜測可能有比較頻繁的檔案相關操作。

d).strace追蹤

帶著上面的疑問，加上記憶體監控資訊，逐個分析記憶體增長前最近有調整過的業務程序。經過逐一分析，逐個指令碼定位追蹤，發現可能與curl https有關。

與一台正常呼叫的伺服器執行curl https命令對比，結果如下:

strace -f -e trace=open,unlink,close curl ""

正常伺服器呼叫日誌：

異常伺服器呼叫日誌：

從上面兩張圖，我們可以看出第二台伺服器的curl https時，系統會建立臨時檔案，而且這些檔案又很快的被刪除。我們都知道，linux為了提高io讀寫效能，會將檔案的inode等資訊快取在記憶體。雖然系統刪除檔案，但這些檔案的inode dentry快取資訊還保留在記憶體，從而造成記憶體使用越來越多。

sync
echo 2 > /proc/sys/vm/drop_caches

yum upgrade nss yum upgrade curl

curl -v

筆者公升級到nss3.44版本後發現問題仍未解決。

從排查->定位->解決問題，整個過程雖然花了蠻長時間，但總體來說，收穫還是挺大的。在以後遇到類似系統方面的"疑難雜症"時，解決思路有一定的借鑑之處。

centos6 系統slab記憶體一直線性增長

系統安裝centos6

1 2 系統平台 CentOS 6

centos6系統簡單命令

centos6 系統slab記憶體一直線性增長

系統 安裝centos6

1 2 系統平台 CentOS 6

centos6系統簡單命令

相關推薦

系統安裝centos6