從Azure雲服務故障中我們能學到什麼?

2022-10-02 23:12:16 字數 1861 閱讀 6240

azure遭雷擊後業務停擺

本月初,azure因遭遇雷擊,造成長時間的業務停頓。隨後又因為伺服器宕機,而再次暫停2小時服務。是否因為azure「流年不利」?其實業內人士都了解,這只是意外,而我們無法**意外什麼時候會發生,就跟無法**會因為什麼而發生意外一樣。

對於事故勇於承擔並予以解決無疑是令人欣慰的。

azure的工程部主管說「首先,我想對受影響地區的託管客戶為長時間的vsts故障及其對全球客戶帶來的影響深表歉意。這起事件對我們來說前所未有。在我們七年的歷史中,這次故障是vsts客戶遇到持續時間最長的。我通過twitter、電子郵件和**與客戶溝通,客戶的團隊至少有一天無法正常辦公。我們讓客戶失望了。這是一次痛苦的經歷,為此我道歉。」(譯文**於「雲頭條」)

隨後,azure對自身的服務設定、備份方案、硬體設施、人員維護等進行了一系列的調整。雖然這些調整也許在未來並不能避免所有意外的發生,但至少能夠減輕事故帶來的不良影響,減少造成的損失。

我們從中能學到什麼?

人類有喜歡成功、畏懼失敗的天性,還因此而絞盡腦汁地設計了許多「完美模型」想避免失敗。事實上,因為迷信「完美模型」而吃的大虧很多,比如:「鐵達尼號」曾被認為是「不可沉沒」的;馬奇諾防線也被稱作是「不可逾越」的;在發生核洩漏之前,每個核電站都聲稱自己的安全系統是「萬無一失」的……

意外的發生,最大的好處就是讓我們更加進步。因為遊輪**汙染海面而對石油運輸的vcnxdco安全設施重加考慮,因為核反應堆發生意外而改善核反應過程和安全設施,因為發現上萬種不適合做燈絲的材料後而找到鎢絲……

於是,我開始思考,從azure的事故中我們能學到什麼?

我首先想到的是:「有備無患」的態度。在容災備份這個行業,每年都會發生若干或大或小的it事故,比如:某公司員工誤刪資料了、某醫院伺服器宕機業務停頓了、某學校被勒索病毒攻擊了、某單位丟失資料了,等等。在遭遇意外之後,結果如何就跟「有備無患」的態度大大相關了。

這裡舉個不久前的例子,今年7月中旬,重慶市南岸區人民醫院因意外斷電2次,導致醫院his系統資料庫發生邏輯故障,無法正常啟動。

資料庫邏輯錯誤故障截圖

作為二甲醫院,重慶市南岸區人民醫院早就為his系統部署了容災備份軟體,來以防萬一。因此,在故障發生後,在容災備份軟體廠家北vcnxdco京和力記易科技****西部大區技術工程師的協助下,利用備特佳軟體的「任意時間點回退」功能,一次性成功恢復資料,解決了資料邏輯故障問題,經校驗,資料完全一致,his系統恢復正常使用。

有了「有備無患」的態度,之後,自然是想要「魚」與「熊掌」能夠兼得。

大多遭遇it故障的客戶,在面對故障會持續多久沒有明確結論的時候,都面臨著一道「魚」與「熊掌」的選擇題,是要馬上恢復業務,還是要保證資料不丟?其中一些客戶,他們不想丟失任何資料,只要能恢復資料,不管這個過程有多長。而另外一些客戶,需要讓龐大的團隊迅速開始工作,哪怕丟失部分資料也認了。

這個選擇在構建容災備份方案www.cppcns.com的時候也會遇到。一方面是資料的100%備份與恢復,一方面是業務的連續性,「魚」與「熊掌」如何兼得?

作為國產容災備份軟體廠商,北京和力記易科技****早就已經開始思考並解決了這一問題。和力記www.cppcns.com易自主研發的備特佳容災備份系統,以cdp持續資料保護技術為核心,實時監測資料變化並備份,資料變化傳到備份機以後,乙份與以前的資料實時覆蓋,形成乙份最新的及時可用資料,另外乙份以自有格式儲存。備份機上這份及時可用的資料與生產機上的業務資料完全一致,如果生產機意外宕機,備份機完全可以代替生產機繼續對外服務。而以自有格式儲存的資料,可以在遭遇it故障後,用於資料的任意回退,就像前面舉例說明的那樣。既能保證資料安全,又能保障業務連續,「魚」與「熊掌」也可得兼。

編者語:

遭遇故障並不可怕,從中學習,好的保留,不好的就改變,我們會一直走在進步的路上。

本文標題: 從azure雲服務故障中我們能學到什麼?

本文位址: /news/media/145920.html

微軟Azure雲服務需要SDN

微軟的雲產品azure遍布在世界各地的22個超大規模的區域。azure的儲存和計算每六個月就會翻一番,azure每個月新增9萬使用者。世界500強中有百分之五十七的企業都在使用azure,主機的數量迅速從10萬增長到幾百萬。這是azure cto在2015 open networking summi...

面向阿里雲專家的 Azure 雲服務介紹

本文是面向阿里雲專家的 azure 雲服務介紹,參考本文可以幫助大家 按圖索驥 在 azure 的平台上找到能滿足自己需求的服務。在公有雲計算蓬勃發展的同時,中國也出現了越來越多的本土公有雲平台。針對各家平台豐富的選擇和各種不同的服務名稱,使用者往往會感到困惑。今天我們就中國區由世紀互聯運營的 mi...

面向阿里雲專家的 Azure 雲服務介紹

本文是面向阿里雲專家的 azure 雲服務介紹,參考本文可以幫助大家 按圖索驥 在 azure 的平台上找到能滿足自己需求的服務。在公有雲計算蓬勃發展的同時,中國也出現了越來越多的本土公有雲平台。針對各家平台豐富的選擇和各種不同的服務名稱,使用者往往會感到困惑。今天我們就中國區由世紀互聯運營的 mi...