生產事故或缺陷總結

2021-10-10 02:44:51 字數 673 閱讀 8017

10月30日 今天出了個生產問題,支行機構資訊有個字段未展示出來。由於字段展示區域不顯眼,非主流程,主功能可正常使用,測試人員在測試階段未發現問題。未避免後續問題,建議在測試階段,開發人員就應該關注全天日誌資訊,排查問題。所有介面入參及出參,都需要日誌列印。

資料庫入幫時,為指定型別,當字段為空時,是無法入庫的,導致報錯。

平時開發要考慮超大型資料的問題。oracle不支援1000條以上的in,update資料也要考慮超大資料的問題,不行就分頁處理。

連線查詢比子查詢效率高很多。

樂觀鎖可作為獎券避免超發的兜底方案。

redis可作為分布式快取,但是其他執行緒拿不到鎖時,可用自旋鎖。

如何解決超高併發庫存問題?

對於乙個使用者多角色問題,要判斷好當前環境拿那個角色。

1202

今天生產環境反饋,訪問某介面有問題。日誌檢視,過去24小時內與任何訪問記錄。測試環境正常。結果是前端同事上線前沒有將測試路徑切換成生產路徑。以後對於長時間無訪問的介面,要重視。測試環境正常,生產環境不正常的這種情況,90%以上都是配置檔案的問題。**評審時,要著重注意配置檔案。

1221

測試環境和生產環境,由於前面人接入系統,測試環境已全部申請完成,生產環境只申請到一半,導致上線出現問題。接入新系統,容易出現問題。一定要確保生產環境配置能生效。接入系統,認真諮詢以前同事,獲取相關接入文件。

ibmmq生產事故

在 中建立了乙個沒使用的mq的連線物件,也沒有進行資源釋放。上生產前最好確保連線佇列管理器的資源在流程結束後都得到了釋放 disconnect 或者進行大批量報文測試,至少需要一百筆,因為ibmmq預設通道連線數是100。錯誤表現 報2537錯誤,提示svrconn通道不可用 解決 重啟mq可以斷開...

linux 磁碟掛載 mount 的生產事故

當時生產用的是阿里雲伺服器,後來磁碟空間不足,又買了1塊100g的磁碟準備掛載上去,當時我們的應用在 data 目錄下,然後就掛載到了 data 目錄,當時以為只是單純的增加儲存空間解決問題。就這樣掛載完之後,線上的應用報了404的問題,服務無法正常進行。當時立馬去伺服器排查,發現服務還在啟動中,然...

一次生產事故的優化經歷

跟蹤web伺服器業務日誌,發現在資料庫更新層報請求不到新的資料庫連線或者資料庫連線已經用完,認為是資料庫的最大連線數太小,於是調整mysql資料庫最大連線數為以往的3倍 下次搶標的時候繼續觀察業務日誌,發現已經不報資料庫鏈結的相關錯誤了,但還是很多使用者反饋搶標時候打不開頁面。在搶標過程中繼續觀察,...