修改引數,觸發「血案」

2021-12-30 13:04:31 字數 815 閱讀 4378

公司2023年架設的一套10 g rac,安裝當時的規劃db_files設定了200,近期由於生產旺季,資料檔案增大,需要將這個引數調整為1000,

接受這個case時覺得沒什麼難的,隨即申請停機時間15分鐘;

到了停機時間,登入rac的node2執行

sql> alter system set db_files=1000 scope=spfile;

隨後正常關閉rac

執行開啟rac過程,asm,nodeapps開啟後,在執行開始例項時,丟擲乙個crs的錯誤,隨後檢視alter.log日誌,發現data4沒有mount,好奇怪哦

生產還等著呢,距停機時間還有8分鐘呢,排錯吧

方法1:

先將node1的data4手動mount起來,node1正常啟用,然後再mount node2上data4

這時由於大量生產客戶端已經和在node1產生連線,導致了node2無法mount;

方法2:

依次關閉nodeapps,asm,根據alter.log提示,檢查asm例項的pfile,問題出現了,data4沒有被寫入到檔案,隨後在2個節點都加入data4,啟動ok!

終於想起來了,2023年11月左右一同事新增2tb的data4,估計是當時作業沒有完成!

asm diskgroup新增與刪除步驟見博文:

至問題解決,超過了申請停機時間6分鐘,屬於嚴重生產事故,被boss大罵一頓!

總結一下:

1.任何db維護需求,需dba team協調溝通;

2.在接受本次維護任務時,最好能看一下該db最近維護記錄,小心觸發別人的錯誤,導致自己被k!

修改單例屬性引發的血案

最近接觸的一些系統中遇到乙個問題,乙個交易的服務對外提供了支付和退款兩種能力,但是發現執行時交易的服務走了退款。原因是spring容器管理的乙個物件service 屬性執行時被改變,導致上下流程對不上的問題,多業務鏈路併發時引發執行時屬性錯亂,導致 支付和退款行為混淆 下面是大體 樣例。記錄下問題原...

乙個引數引起的血案

問題產生實際情況 資料庫被強制乾掉,空間漲到100 分析 經觀察發現是由於pg log目錄增長過快導致磁碟空間被爆。pg log是如何產生的?記錄資料庫執行日誌,內容可讀,預設關閉,需要設定引數啟動。1.error資訊。2.定位慢查詢sql。3.資料庫的啟動關閉資訊。4.pg系統相關警告資訊等。根據...

修改mysql引數 mysql動態修改引數

mysql資料庫可以動態的修改引數,即可以修改會話級變數只對當前會話產生影響 又可以修改全域性變數,對所有新連線的會話都產生影響。1 修改全域性變數 root admin root mysql mysql show variables like sort buffer size variable n...