根據堆疊日誌定位記憶體洩漏

【問題描述】：服務後端是3節點集群，凌晨出現2節點磁碟打滿告警並導致業務中斷，定位發現是jvm堆疊日誌hprof，該檔案比較大（大概10g+）。恢復線上業務後，剛好另一節點磁碟沒有滿，並打出堆疊日誌，可以用來定位此次故障原因。

工具：memoryanalyzer-1.8.1.20180910-win32.win32.x86_64

tomcat bin/setenv.sh配置堆疊日誌：

export catalina_opts="$catalina_opts -xx:+heapdumponoutofmemoryerror"

export catalina_opts="$catalina_opts -xx:heapdumppath=/opt/admin/logs/cloudnetmonitor-computer"

【定位過程】：

第一步從線上匯出堆疊日誌到本地分析

由於公司安全策略，線上與本地網路隔離，需要堡壘機傳送檔案並且限制大小，在linux伺服器上需要拆分日誌檔案：

拆包： tar czf - sourcefile | split -b 90m - dest_split.

合併：cat dest_split.* >> dest.tar.gz

解包：tar zxvf dest.tar.gz

第二步啟動mat工具

啟動前配置memoryanalyzer檔案，調大記憶體 -xmx12g

mat工具 file- open head dump 匯入hprof檔案，大檔案可能持續一段時間，匯入後

第三步分析記憶體洩漏

mat工具提供的分析還是比較全面，檢視「accumulated objects in dominator tree」，發現是執行緒池佇列長度打滿，而且該佇列是個鍊錶阻塞佇列，轉到對應**位置

問題**位置：

private executorservice fixedthreadpool = executors.newfixedthreadpool(10);

檢視固定執行緒池原始碼：

找到問題了，這裡預設定義的是不指定容量大小的阻塞佇列，意味著是無限大小。作為開發者，我們需要注意的是，如果構造乙個linkedblockingqueue物件，而沒有指定其容量大小，linkedblockingqueue會預設乙個類似無限大小的容量（integer.max_value），這樣的話，如果生產者的速度一旦大於消費者的速度，也許還沒有等到佇列滿阻塞產生，系統記憶體就有可能已被消耗殆盡了。

根據堆疊日誌定位記憶體洩漏

C 記憶體洩漏定位 valgrind

定位一起記憶體洩漏

記憶體洩漏了，該如何定位

根據堆疊日誌定位記憶體洩漏

C 記憶體洩漏定位 valgrind

定位一起記憶體洩漏

記憶體洩漏了，該如何定位

相關推薦