生產close wait問題排查記錄

一、問題現象

背景：公司封裝了訊息中心，統一對接外部簡訊通道，並提供統一的傳送api(http介面），供公司內部使用。

環境如下：

問題現象：圖中「3.簡訊平台」出現很多 closed_wait 連線，檢視這些closed_wait的連線都是和nginx的連線ip：port

二、分析http在什麼情況下會出現closed_wait

來看一下http狀態變化圖：

2、根據上圖可知，當客戶端主動關閉連線，發起 fin 包時，服務端此時則處於 close_wait狀態，當服務端傳送ack、fin後，服務端才會處於 closed 狀態，那問題是為什麼服務端不傳送ack、fin報文呢？客戶端什麼情況下會主動關閉連線呢？

3、客戶端主動關閉連線，服務端不傳送ack、fin報文…

懷疑是否因為服務端阻塞了，客戶端超時後關閉連線

不如現在本地測試下，經過測試，通過jmeter呼叫本地tomcat，並設定超時時間為5s，然後在本地**打上乙個斷點，這樣服務端就不會響應客戶端了。經測試果然如此，在5s後，服務端的埠連線狀態為closed_wait，客戶端的連線狀態為：fin_wait_2，和我們的猜想一致。