效能測試 怎麼保證現網的可靠性?

2022-05-14 18:08:04 字數 1939 閱讀 3464

oncall的問題

1,問題處理,

包括客戶提出的問題,運營提出的問題,他們是系統的使用者,會有各種各樣的問題出現,

2,告警處理,

接入各類告警系統,這些都是通過日誌分析統計出來的,所以要做日誌整改,會傳送郵件和簡訊,及時告警,告警要時刻處理,

包括流量的監控,功能撥測用例的執行,日誌分析所有的請求有沒有異常狀態碼,如果有就會告警,就要分析,

3,例行巡檢,先於客戶發現問題

3.1 要保證各類告警系統是正常的,告警系統不正常了,就不會有自動的告警了,這很危險,

3.2 伺服器各項指標的監控,常態:cpu占用<15%,記憶體占用<30%,磁碟空間<50%等,

上面兩步要保證各類告警系統和伺服器的各項指標的趨勢是穩定的,如果有激增,有階梯式的,有量級的變化就要有所分析了,否則就會有潛在的風險

3.3 例行巡檢關鍵功能,比如首頁開啟,主流程的暢通,介面正常,

4,容災環境,

必須要有容災環境,這樣出現問題你就會有乙個緩衝,即使這個容災就是唯讀的也可以,為我們解決問題提供時間,不至於赤裸裸的暴露在客戶面前,半死也比死掉好,

你有容災環境,你解決嚴重的現網問題的時候就不會手抖,遇到崩潰級別的現網問題,手都會抖,腦子一片空白,根本不知道幹什麼,別人說做什麼就做什麼了

所以平時一定要有容災的演練!!只有這樣才能應急,

5,回溯報告,

出現大的現網問題,都必須要有回溯報告,找到問題的根因,按照問題回溯------定位問題--------改進措施的思路,是什麼,為什麼,怎麼辦?有整套方案

如果對系統進行效能測試?

1,首先就是要知道系統的常態資料,每乙個介面每天的訪問量,常態是10,峰值就要支援100,擴容之後就要支援1000,

這個就要使用到流量的監控工具,每乙個介面的常態資料,就要做日誌整改,

2,有了基線常態資料,就要根據,常態資料,做壓測目標,就是峰值是常態的10倍,擴容之後是常態的100倍,

要根據介面測試,也可以統計到每乙個頁面的介面,根據頁面測試

也可以梳理出來關鍵場景,每次上線做例行10倍流量測試的看護場景,

所以可以分為,介面級別的,頁面級別的,場景級別的,

3,橫向擴容問題,伺服器從兩天,擴容到8臺,

快速的擴容,需要有乙個前提條件就是伺服器是無狀態的,也就是資料庫快取都是共享的,這樣訪問每乙個節點返回的資料都是實時的

做流水線的運營部署,容器化的部署,這樣只需要改一些配置就能做到10分鐘之內迅速的擴容,而不是傳統的還需要每一台伺服器部署**,做配置,

但是所有的這些例行的都有乙個前提,就是你的**邏輯是沒有問題的,

1,確保你的**沒有低效能的命令,比如redis 的keys命令,和hgetall命令,

2,確保你的**沒有那種無限迴圈的任務,自己把自己搞死,

比如所有的外部服務都應該是可以拋棄的,就是所謂的應急放通機制,

比如,redis的連線超時問題,連線超時就要斷開,去查資料庫,不能卡死在查redis這裡,redis不能保證自己一定是活著的,

比如,redis查詢超時了,比如多少秒查不到,就要斷開連線,查資料庫這樣的機制,不能排除redis服務會死掉了,或者假死了,不能影響業務主流程,

擴充套件一下,所有不必要的外部服務都應該有應急放通的機制,都應該在不通的情況下不影響主流程的能力,

不考慮超時場景的程式設計師都是初級程式設計師,不考慮歷史資料相容的問題也是初級程式設計師,

必須要保證自己的**邏輯沒有問題,否則你做再多的擴容也沒有用,

系統不能保證乙個1000個人的活動,這系統就是有問題的,

做的所有的這些,就是為了保證在極端情況下,保證業務是正常的,否則你做再多的需求,再多的功能,業務中斷了,都沒有用,

效能測試目標:

在版本平穩交付的同時,通過介面場景級效能優化,公升降配,流控,容量**等技術手段做好後台效能的持續介面看護,無因效能問題漏測導致重大的網上事故,實現現網零事故,客戶零投訴的目標,

軟體效能測試與可靠性測試

效能測試 1.軟體效能測試包括三個目標 發現缺陷 效能調優 能力檢驗與規劃 2.軟體效能的主要指標有 響應時間 系統響應時間和應用延遲時間 吞吐量 併發使用者數 資源利用率 3.系統的響應時間通常是指該系統所有功能的平均響應時間或者所有功能的最大響應時間 4.對於無併發的應用系統而言,吞吐量與響應時...

軟體效能測試與可靠性測試

效能測試 1.軟體效能測試包括三個目標 發現缺陷 效能調優 能力檢驗與規劃 2.軟體效能的主要指標有 響應時間 系統響應時間和應用延遲時間 吞吐量 併發使用者數 資源利用率 3.系統的響應時間通常是指該系統所有功能的平均響應時間或者所有功能的最大響應時間 4.對於無併發的應用系統而言,吞吐量與響應時...

TCP的可靠性保證機制

我們常說,udp是不可靠的通訊協議,而後來發展的tcp彌補了udp的不可靠缺陷,那麼tcp是靠什麼來保證可靠性的呢?當接收方收到報文時就會確認,如果傳送方傳送一段時間後沒有確認就重傳 tcp會利用視窗控制來提高傳輸速度,意思是在乙個視窗大小內,不用一定要等到應答才能傳送下一段資料,視窗大小就是無需等...