RDS鏈路卡慢問題的診斷

2021-09-23 23:06:55 字數 1381 閱讀 8967

經常會收到使用者反饋在使用rds的過程**現卡慢,閃斷地情況,當出現此類問題的時候,首先我們要進行一下測試,看看問題出現在哪乙個階段,rds給到使用者的是乙個dns位址,其實他包括三個階段:dns–>vip–>db

我們可以在本地的應用伺服器(vm)上通過簡單的ping命令,或者資料庫的客戶端去不斷的連線測試rds,來獲取每次連線rds的響應時間(rt)。在正常情況下rt應該小於20ms以內,如果超出10ms,則表明了rds的網路鏈路出現了異常,這個時候我們就需要去排查一下是在**出現了問題:

(1)    當dns鏈路服務出現問題:

當我們測試出dns的連線比較耗時,而使用vip連線正常的時候,則表明dns解析比較耗時,此時的問題則出現在了dns服務上面,這個時候可以嘗試換用其它的dns伺服器,或者啟用dns快取服務,或者暫時在hosts檔案中繫結dns和ip位址,等dns服務恢復正常後在取消繫結(我們強烈建議在正常情況下不要繫結rds的dns和ip位址,或者直接使用ip位址進行訪問,因為rds的ip位址可能會發生改變,繫結ip或者直連ip的方式會導致rds訪問出錯);

(2)    當vip 鏈路出現問題:

當我們測試超出dns連線比較耗時,同時使用vip連線也比較耗時的時候,則表明rds的vip鏈路出現了異常,這個時候可以提交rds的工單,讓後端的人員進行排查。

(3)    正常情況下的鏈路表現:

正常情況下,通過dns或者vip的方式去連線rds,rt應該在20ms以下。

案例分析一:

使用者應用程式從凌晨0:05左右突然開始出現連線rds超時,rds,ecs的cpu,網路,io負載都不高,已經影響使用者的正常使用,使用者的報錯截圖:

第一步:獲取鏈路rt

àrds測試:(dns連線)

在我們自己vm上部署的探測測試:(dns連線)

最後建議使用者從業務上去排查是否存在異常,最終定位應用異常導致。

案例分析二:

使用者反饋例項出現寫入速度過慢.寫入速度不如正常狀態下1/10.

排查使用者的rds,ecs的cpu,io負載都不高,但在資料庫中發現了有network io的等待,是不是網路出現了異常,所以這個時候需要測試正常的一次連線rds需要消耗多久的時間,通過sqlping發現了重要線索:

使用者在3臺不同的vm上去連線測試rds,發現都出現了大量的連線時間高或者超時,證明了rds的鏈路上確實存在了問題,這個時候你可以提工單進行反饋;進一步去探測db節點的rt,結果發現在後端的db伺服器上出現了異常,最終定位問題在後端的物理伺服器上硬體出現了問題,在替換硬體後問題得以解決。

mysql資料庫健康診斷 MySQL 慢的診斷思路

1 問題 如果遇到 mysql 慢的話,你的第一印象是什麼,mysql 資料庫如果效能不行,又該是如何處理的?一些反饋如下 第一反應是再試一次 第二個反應是優化一下 sql 第三個反應是調大 buffer pool,然後開始換硬體了,換一下 ssd 分析一下這些現象背後隱藏的意義 如果再試一次能夠成...

xshell輸入慢的問題

xshell輸入慢的問題是由ssh的服務端在連線時會自動檢測dns環境是否一致所導致的,這裡將usedns yes 改為usedns no 即可 具體操作如下 開啟sshd服務的配置檔案vi etc ssh sshd config 把usedns yes 改為 usedns no 即可 注 vi下的...

su sudo 慢可能的問題

首先我使用的是centos 7 之前在網上查su sudo 慢都是說要修改 etc hosts 但是修改hosts之後沒什麼用 接下來我發現hostnamectl和systemctl都報 error getting authority error initializing authority err...