乙個事故引發的思考

2021-09-06 13:10:07 字數 597 閱讀 7267

今天線上服務出現了乙個事故,思考下這個事故,覺得有好幾個地方需要思考。

1 對於前端而言,**回滾的功能是必須的。前端介面出現了問題,第乙個應該想到的是將**回滾到乙個穩定版本。

2 快取和資料庫的使用,需要注意乙個問題,當快取失效的時候,可能會有大併發的請求去訪問資料庫,這個時候資料庫會不會崩潰?如果這個時候資料庫崩潰了,那麼web前段機也會隨之崩潰。

所以,快取失效的時候去資料庫訪問這裡必須有乙個鎖機制。

3 在處理快取和資料庫的關係的時候,快取一般會去設定乙個過期時間,是在這個過期時間到的時候,快取中的資料自動刪除呢?還是做偽過期?即在設定的時候單獨設定乙個expire過期時間,根據這個過期時間來判斷是否過期,這個好處是這裡的快取中得資料除了做加速作用,還做了容災處理,當後端資料庫掛了的時候,快取中的資料就會一直生效。

4 設定過期時間的時候是否需要將過期時間雜湊,這個是個技巧。

5 客戶端不要做在xx點做介面呼叫的操作。這完全就相當於ddos攻擊了。客戶端需要將所有介面做雜湊處理。不能集中。

6 報警和預警機制需要考慮。

7 再高深的技術不如讓服務穩定最重要。

8 在做第三方請求處理的時候,需要問下自己,如果這個請求失敗了怎麼辦?

乙個情懷引發的生產事故 續

nlua實現 using nlua using system.text namespace nluaandroslyncompare5 呼叫案例,就是把乙個 號碼轉換成固定需要的格式,funcfionbody中是lua指令碼語言的實現函式 這裡也是比c 要多學一點lua知識的地方 listnlua ...

乙個情懷引發的生產事故 續

nlua實現 using nlua using system.text namespace nluaandroslyncompare5 呼叫案例,就是把乙個 號碼轉換成固定需要的格式,funcfionbody中是lua指令碼語言的實現函式 這裡也是比c 要多學一點lua知識的地方 listnlua ...

乙個案例引發的思考

今天下午,團隊開了乙個簡短的版本總結會。會上測試經理分析了乙個案例 某子程式在轉測試後發現不能被平台排程,原因是子程式的排程入口跟不符合平台規範。很明顯開發在轉測試前沒有充分自驗證,測試經理提出,後續對跟平台對接的子程式轉測試必須要有將子程式接入平台跑通後的驗證報告和相關checklist,否則不予...