騰訊雲盤復資料損壞技術原因 建議開啟快照功能

2022-10-07 08:24:12 字數 1405 閱讀 2831

網易科技訊8 月 8 日訊息,昨日騰訊雲再發宣告,盤復了「前沿數控」檔案系統元資料損壞www.cppcns.com的技術原因,騰訊稱該故障緣起於因磁碟靜默錯誤導致的單副本資料錯誤,再加上資料遷移過程中的兩次不規範的操作,導致雲盤的三副本安全機制失效,並最終導致資料完整性受損。

騰訊雲稱,對其業務所受影響表示誠摯歉意。同時希望使用者開啟免費的快照功能,可對重要資料進行定期備份。

8 月 6 日,騰訊雲表示,提出了「賠償+補償」總金額達到136, 469 元的解決方案,是該使用者在騰訊雲平台中用雲金額的 37 倍。「前沿數控」基於自身評估就此次故障對騰訊雲提出了11,016, 000 元的索賠要求。騰訊雲稱,這遠遠高於其能夠提供的方案,雙方目前未能達成一致。

以下是宣告全文

【關於客戶「前沿數控」資料完整性受損的技術覆盤】

近日,騰訊雲客戶北京清博數控科技****所屬「前沿數控」平台一塊作業系統雲盤發生故障,導致該客戶的檔案系統元資料損壞,我們對客戶業務所受影響表示誠摯歉意。同時,我們也對此次故障過程進行了深入的技術覆盤。

覆盤發現,該故障緣起於因磁碟靜默錯誤導致的單副本資料錯誤,再加上資料遷移過程中的兩次不規範的操作,導致雲盤的三副本安全機制失效,並最終導致客戶資料完整性受損。

痛定思痛,騰訊雲希望在盡力幫助客戶解決本次問題的同時,也通過相關機制的優化避免類似情況的再度發生。

故障過程覆盤

當天上午11:57,我們的運維人員收到倉庫ⅰ空間使用率過高告警,準備發起搬遷擴容;在14: 05 時,運維人員從倉庫ⅰ選擇了一批雲盤搬遷至新倉庫ⅱ,為了加速搬遷,手動關閉了遷移過程中的資料校驗;在20: 27 搬遷完成之後,運維人員將客戶的雲盤訪問切至倉庫ⅱ,同時為了釋放空間,對倉庫ⅰ中的源資料發起了**操作;到20: 30 監控發現倉庫ⅱ部分雲盤出現io異常程式設計客棧。

故障原因覆盤

本次事故起源自因磁碟靜默錯誤導致的單副本資料錯誤,再由於資料遷移過程中的不規範操作,導致異常資料擴散至三副本,進而導致客戶資料完整性受損。

資料搬遷過程中的違規操作主要如下兩點:

因這些錯誤操作的連續影響,導致該客戶資料完整性受損,給客戶的正常業務執行造成影響,騰訊雲對此再次表示最誠懇的歉意。

改進措施:

經過技術覆盤,騰訊雲技術團隊深入到每個環節,通過責任到人與流程閉環的雙管齊下,相應作出如下的加強和改進措施:

進一步建議:

騰訊雲自 2016 年 3 月以來一直在提供免費的快照功能,可以對重要資料進行定期備份。同時出於對客戶資料私隱性和安全性的考慮,客戶可以自由選擇開啟或者不開啟這一免費功能。騰訊雲在這裡也呼籲客戶開啟這一功能,進一步提公升自身資料的安全性。

未來,本著對客戶資料最大的敬畏,騰訊雲將繼續探索更科學的機制,避免類似事件再次發生。

騰訊雲2018 年 08 月 07 日

本文標題: 騰訊雲盤復資料損壞技術原因 建議開啟快照功能

本文位址: /news/roll/134682.html

騰訊雲 Linux 掛載資料盤

檢視已掛載的硬碟 1 執行fdisk l命令檢視硬碟資訊。硬碟從未進行初始化時,需要先建立檔案系統,硬碟格式化 執行mkfs.ext4 device name dev vdb 命令格式化並建立 ext4 檔案系統。也可以選擇其他檔案系統型別,如 ext3 掛載硬碟 建議用下面的自動掛載 mkdir ...

騰訊雲CVM如何掛載資料盤

格式化 建立檔案系統並寫入檔案 1 執行fdisk l命令,檢視連線到例項的盤裝置名稱。找到建立的 20 gb 雲硬碟,假設這裡它的裝置名為 dev vdb 2 格式化該裝置 本例使用 ext4 檔案系統 執行 mkfs.ext4 dev vdb命令。3 掛載到 data 掛載點下,執行以下命令 m...

騰訊雲掛載資料盤的步驟

步驟方法 1 檢查硬碟裝置是否有資料盤 當然也知道現在磁碟是有資料的,大概伺服器有58g的磁碟空間,8g是系統盤那麼就剩下了50g的剩餘空間,那麼下面就把這50g掛載。查詢命令 fdisk l 可以看到有52gb的資料盤沒有掛載,看好前面的路徑 dev vdb 2 資料硬碟分割槽 執行命令 fdis...