技術決定成敗 災備系統建設的六大要素

2022-07-18 18:30:16 字數 1863 閱讀 9453

容災技術是災備系統的核心,技術因素考慮的是否完善,對於災備系統建設的成敗可以說起到非常關鍵的作用。如果災備方案提供商在企業災備建議之初,能從企業切實的容災系統技術和工程可行性出發,為企業找出最佳的災備系統建設路線,相信可以幫助企業的災備系統建設少走不少彎路。那麼,企業在構建容災系統時需要考慮的技術因素有哪些呢?

(1)防範的災難範圍

災難的防禦範圍,常規上大家重點考慮一些硬災難,包括伺服器、儲存等硬體裝置損壞造成的宕機;**、火災、機房進水等造成的機房失效,也有空調損壞、多站供電斷電等意外;甚至當瘟疫蔓延時機房無法進入等極端情況。這類災難一般被稱為"'硬'性災難"或"站點級災難",意指整個站點失效,整個站點所提供的服務均被中止。

然而,還有很多災難型別,災難發生後,雖然建築、裝置、人員都是無損的,但整個機房站點同樣失效,整個站點所提供的服務同樣被中止。這類災難我們稱為"'軟'性災難"或"類站點級災難"。它們帶來的後果同樣是災難性的、甚至更加嚴重。這種災難主要是由於一些惡意行為:外部黑客攻擊、內部高技術犯罪;和一些失誤行為:系統維護失誤、誤刪除重要資料、打入衝突系統補丁。。。等引起的。

"'硬'性災難"或"站點級災難"的發生是管理人員能夠即刻發現的,造成的損失大多可以立刻評估、處理。而"'軟'性災難"或"類站點級災難"大部分無法被管理人員立時發現,造成的損失一般要遠遠大於前者。而且,恢復起來很麻煩,需要企業投入更多的資源、承擔更多大的風險去解決。

(2)對企業當前業務的影響程度

(3)企業能容忍的恢復時間(rto)

當計算機系統發生意外無法工作時,導致業務停頓所造成的損失程度,即企業對於系統發生故障時的最大容忍時間,業務稱之為rto。這也是設計容災備份方案的重要技術指標。對於容災系統來說,它除了集群系統之外的其它容災系統,在災難發生後都需有乙個恢復的過程,尤其遠端容災的宕機時間最長,那怎樣來解決企業使用者對容災系統所需的恢復時間呢?目前市場中主流的cdp持續資料保護技術在保證rto方面,可以達到企業所需的分種級恢復的恢復時間要求,對於遠端容災更是可在30分鐘內恢復業務執行,而這種恢復時間也並沒有為企業增加額外的災備建設成本。

(4)企業能容忍的最大資料丟失量(rpo)

是否要求資料庫可以恢復所有提交的交易並且要求實時同步資料,也就是資料的連續性和一致性,決定了容災備份方案規模和複雜程度的重要依據。傳統的容災技術大多採用的是基於磁碟陣列或應用主機來實現的,因此資料的同步都侷限於資料盤的資料同步,同步映象技術可以達到資料盤的資料同步,但非同步映象無法達到資料盤的資料一致性,因此借住於快照技術達到同一時間點的資料盤的同步。但在技術中都無法確保實現執行業務系統資料的一致性。同是地,在恢復顆粒的精細程度上也有一定侷限,恢復到發生災難前一刻的資料時間點或恢復到之前保留的某一時間點版本的資料,與快照技術及快照策略有非常大的關係,兩個快照之間的時間差是不可避免的,如果企業選擇的快照技術可以把快照間隔縮到最短(如,主流的cdp技術可以達到微秒級),企業則可以對業務資料實現最大化保護。

(5)技術的維護難度

由於長期以來,容災技術的複雜性和高成本性,使得大量的容災系統建設都呈現出維護難度大、傳輸故障的防範能力低、災備演習難度大的特徵。因此,選擇的容災技術應考慮到技術實現和管理的友好性和簡易性,災備中心管理人員的本地可自行維護能力是乙個重要的因素,這是故障快速響應和處理的乙個基礎,這樣才能使得多極的維護體系更為有效率、處理故障的能力更為強大。

(6)是否適用於現有的業務系統,是否面向未來可能加入的其他業務系統

這是非常容易被忽視的乙個因素。混合系統容災、開放裝置的選擇常常使得使用者的理想與技術現實產生鴻溝。如果能夠在本次建立容災系統時,採用面向未來的技術,這樣就可以形成一次構建,長期受益的良好架構,而且今後的系統改造成本將會十分輕微,達到為全系統服務的長期目標。

災備系統技術建設案例

資料備份技術 正常情況下系統的各種應用在資料中心執行,資料存放在資料中心和災難備份中心兩地儲存。當災難發生時,使用備份資料對工作系統進行恢復或將應用切換到備份中心。災難備份系統中資料備份技術的選擇應符合資料恢復時間或系統切換時間滿足業務連續性的要求。目前資料備份技術主要有如下幾種 1 磁帶備份。2 ...

災備技術之RTO和RPO

資料備份最重要的目的就是 恢復資料 當系統出現故障損毀時,可以通過資料備份來恢復,最大限度降低損失。但是,系統需要進行什麼程度的備份,這就需要根據實際情況來制定。這裡,有兩個指標可以參考 rto recovery time objective rpo recovery point objective...

災備 獨立磁碟陣列 RAID 技術

本文是對3個月前臨時出差前往客戶現場,安裝交付我司大資料產品時使用的一項硬體級的災備技術的簡要覆盤。raid redundant arrays of independent disks raid 獨立冗餘磁碟陣列 獨立磁碟構成的具有冗餘能力的陣列磁碟利用率 100 沒有提供冗餘或錯誤修復能力,但實現...