災備系統技術建設案例

2021-10-05 19:18:57 字數 4074 閱讀 2232

資料備份技術

正常情況下系統的各種應用在資料中心執行,資料存放在資料中心和災難備份中心兩地儲存。當災難發生時,使用備份資料對工作系統進行恢復或將應用切換到備份中心。災難備份系統中資料備份技術的選擇應符合資料恢復時間或系統切換時間滿足業務連續性的要求。目前資料備份技術主要有如下幾種:

(1)磁帶備份。

(2)基於應用程式的備份。通過應用程式或者中介軟體產品,將資料中心的資料複製到災難備份中心。在正常情況下,資料中心的應用程式在將資料寫入本地儲存系統的同時將資料傳送到災難備份中心,災難備份中心只在後台處理資料,當資料中心癱瘓時,由於災難備份中心也存有生產資料,所以可以迅速接管業務。這種備份方式往往需要應用程式的修改,工作量比較大。另外,由應用程式本身來處理資料的複製任務,對應用系統的效能影響較大。

(3)資料庫的遠端資料複製。基本原理是將資料中心的資料庫日誌傳送到遠端災難備份中心的資料庫中,通過日誌同步兩端的資料庫。這種方式需要資料庫軟體的支援。由於資料庫方式只是傳送資料庫日誌,與應用沒有直接關係,因此無須對應用程式做大量修改。這種災難備份方式比較適合於只對資料庫有遠端災難備份需求,傳輸距離較長且網路傳輸頻寬不大的使用者環境。

(4)伺服器邏輯卷的遠端資料複製。這種方式在伺服器作業系統邏輯卷管理軟體基礎上實現,通過ip網路將邏輯卷操作傳輸到異地主機,在異地主機執行同樣的邏輯卷操作,保證本地和遠端邏輯卷的一致性。這種災難備份方式適合檔案、資料庫等多種資料的遠端複製要求,並且對應用系統和資料庫是透明的,但需要資料中心和災難備份中心主機同構。

(5)基於儲存備份軟體實現的遠端資料複製。資料的複製和同步通過儲存備份軟體實現,系統的靈活性很強,完全不依賴主機系統和儲存系統,也不影響本地應用的響應速度,資料可以從任何儲存裝置上映象到任何地點的任何儲存裝置上。

(6)基於智慧型儲存裝置的遠端資料複製。由智慧型儲存裝置自身管理軟體實現資料的遠端複製,即智慧型儲存裝置將系統中的儲存操作指令傳送到遠端的智慧型儲存裝置上,在遠端智慧型儲存裝置中重做儲存操作指令,實現資料遠端複製。這種災難備份方式要求資料中心和災難備份中心配置同構的智慧型儲存裝置。

同步/非同步方式

(1)同步資料複製。同步資料複製指的是備份中心的資料在任何時間與資料中心的資料均保持一致。複製環境中的任何乙個結點的複製資料發生了更新操作,這種變化會立刻反映到其他所有的複製結點,同步資料複製方式在主機向本地磁碟寫資料的同時,將資料傳到備份中心的磁碟系統,在確認遠端備份系統的資料同步更新後,完成寫資料的操作。只有當備份資料的寫操作完成後,主機程式繼續進行,否則主機程式將等待備份資料的寫操作的完成。同步資料複製方式的資料實時性強,災難發生時備份資料能夠與生產資料保持一致,幾乎沒有資料丟失,恢復時間短。同步資料複製技術可以保證資料的一致性和完整性,實現起來較為簡單,但是增加了網路和應用系統的負擔,由於需要等待遠端站點的確認,資料更新操作時間長,影響應用的效能。

同時,由於資料在兩個中心間傳輸要消耗時間,使得資料讀/寫操作時間受到兩個中心之間距離的影響,兩個中心間的距離限制很難突破60km。由於受到傳輸技術的限制,該方式對資料中心和備份中心之間的距離和通訊質量有嚴格要求。一般適用於同城異地的備份。

(2)非同步資料複製。非同步資料複製方式是在主機系統問本地磁碟寫資料後,將本地生產資料以後臺的方式複製到異地。非同步資料複製方式對資料的更新操作不必等本地卷和備份卷的資料都更新完畢後才算是更新完成,因此減少了更新操作的時間,對生產主機效能的影響較小。非同步資料複製方式的所有複製結點的資料在一定時間內是不一致的。複製環境中的其中乙個結點的複製資料發生了更新操作,這種改變將在一段時間後反映到其他複製結點以最終保證所有複製結點間的資料一致。非同步複製技術可以保證資料的一致性,實現起來較為複雜,但是減少了網路和應用系統的負擔。但由於資料不能時時同步,災難發生時可能出現少量資料的丟失。

儲存子系統

儲存子系統是容災系統的重要組成部分。儲存大量資料的災難備份中心儲存子系統適合採用san架構,由磁碟陣列和san交換裝置組成資料儲存池。儲存系統中儲存裝置是最重要的部分,其效能的好壞直接決定了整個san儲存系統,儲存裝置特別是磁碟陣列必須考慮以下重要技術特性:

(2)儲存子系統的資料保護能力。資料保護能力是指在儲存裝置的設計方面,對各種偶然性錯誤和意外情況的**,以及採取的預防或補救措施。儲存系統是乙個從軟到硬的複雜系統,所以對資料保護能力的評價應當考慮到整個系統。一些低端磁碟陣列廠商宣稱他們的產品由於採用了raid、熱交換磁碟、雙電源等技術,資料將永不丟失。對一些中小型使用者,這些資料保護技術基本可以滿足要求,對重要的應用系統,還需要考慮對資料完整性的保護,對主機連線的保護及對遠端容災的支援等方面。

(3)儲存子系統的容量。儲存容量是儲存系統最基本的引數,使用者不僅要關心產品的最大容量,還要關心實際可使用容量及擴容成本等問題。

(4)儲存子系統的連線性。在san環境中,以光纖連線裝置(光纖通道交換機等)為中心,連線主機、磁碟陣列、磁帶庫等多種裝置,環境比較複雜。因此在產品選型時,要充分考慮裝置間的連線性。選擇具有良好的開放性和連線性的產品,不僅是當前系統正常連線和執行的要求,也為系統將來擴充套件提供更大的空間和靈活性。

(5)儲存子系統的可管理性。可管理性是儲存產品的重要效能。首先,使用者應考慮產品所提供的管理功能或方式是否實用可靠。其次,要考慮管理的方便性,是否支援中心化管理和遠端管理,是否支援故障自動通知機制,在配置改變或系統擴容時,不需宕機或盡可能縮短宕機時間,也是企業級產品的重要特徵。

(6)儲存子系統的其他功能的考慮,如資料快照功能、lun masking功能、異地資料複製功能等。

6.伺服器系統

容災系統中伺服器平台的效能和可靠性對容災系統的整體效能有重要影響。在選擇容災伺服器時應注意以下問題:

(1)隨著計算機軟、硬體技術的飛速發展,傳統的risc伺服器/unix在效能、可靠性方面越來越高,而在價效比和易用性等方面也較以前有很大的提高。而基於microsoftwindows作業系統的pcserver在效能方面也有非常大的提高,**相對小型機來說低廉,比較適合做中小型系統的容災伺服器。

(2)在需要採用應用級容災的情況下,往往要求容災中心伺服器與使用者資料中心伺服器同構,實現應用系統的相容。特別應當注意容災中心伺服器中軟體環境的配置,容災中心的軟體環境必須能夠保證應用服務的正常執行。

(3)在需要採用伺服器邏輯卷資料複製技術實現容災功能的情況下,容災中心伺服器與使用者資料中心伺服器同構。

(4)為了節省容災系統的建設成本,在效能滿足的條件下,幾種應用可以共享一台服器。容災系統伺服器的效能應滿足容災方案的要求如cpu處理能力、資料快取能力、良好的i/o吞吐能力、伺服器的效能穩定等。伺服器應具有一定的高可用性(如冗餘網絡卡,使用raid磁碟等),保證在災難恢復期間的可靠執行。

①cpu效能。可以用伺服器的tpc-c(transactionprocessingperformancecouncil,事務處理效能委員會c類指標)值作為相對選型參考值。廠家公布的tpc-c值,一般是採用該伺服器最大的硬體配置,接近100%使用率得到的tpc-c值,而實際購買的配置往往小得多,實際系統效能的tpc-c值不會有公布值那麼高,在設計伺服器處理能力時,需要將一些實際經驗值和tic-c值一起綜合考慮,留有一定餘量。   

②記憶體大小。記憶體是所有程式執行的環境,一般來說記憶體空間越大伺服器的事務處理效能越好,但不同的應用對記憶體的要求不同,所以在資料處理系統伺服器記憶體設計中,需要從應用的角度來考慮,尋找最佳的配置。   

③i/o效能。伺服器的i/o效能包括內建磁碟效能、網絡卡效能、hba卡效能等。伺服器的i/o效能應達到災難備份系統的要求並與容災系統的網路環境相適應。   

④應用系統的負載均衡。在由多台伺服器提供服務的情況下使用負載均衡技術,以防止伺服器結點過載或未被充分利用的情況發生

ucache災備雲建設的具體案例

案例:國家電網西安資料中心

專案背景:

國家電網位居《財富》世界500強第2位、中國500強企業第1位,是全球最大的公用事業企業;

國網西安資料中心是國網三大資料中心之一,擔負著國家電網西北五省資料級、應用級災備的重要任務,同時承載了國網眾多重要業務系統的執行工作 ;

國家電網西安資料中心擁有混合的it環境,包括oracle rac資料庫及vmware虛擬化平台;

要求方案架構達到災難恢復能力5級建設水平,實現分鐘級rto,滿足核心業務的sla要求。

提供災備中心級的解決方案,通過副本資料管理技術,方案架構達到災難恢復能力5級建設水平;

通過anybackup cdm的分鐘級資料掛載恢復能力,大幅提公升了核心業務的sla水平,實現分鐘級rto;

通過永久增量備份能力,實現海量資料的快速保護,同時降低儲存成本;

完整的服務體系,實現全生命週期的災備保障,確保災備中心的可用性與有效性。

技術決定成敗 災備系統建設的六大要素

容災技術是災備系統的核心,技術因素考慮的是否完善,對於災備系統建設的成敗可以說起到非常關鍵的作用。如果災備方案提供商在企業災備建議之初,能從企業切實的容災系統技術和工程可行性出發,為企業找出最佳的災備系統建設路線,相信可以幫助企業的災備系統建設少走不少彎路。那麼,企業在構建容災系統時需要考慮的技術因...

災備建設的四大誤區

企業只要投巨資建設了災備系統,以後就不會再出現業務中斷和資料丟失了嗎?其實,災難備份 恢復與業務連續性有很大的差別,不能將兩者混為一談。對災備的錯誤認知是導致災備建設失敗的重要原因。emc公司資深業務連續性諮詢顧問許瑀表示。容災不等於業務連續 一些企業領導的固有思維是 容災與業務連續性是一回事,只要...

災備技術之RTO和RPO

資料備份最重要的目的就是 恢復資料 當系統出現故障損毀時,可以通過資料備份來恢復,最大限度降低損失。但是,系統需要進行什麼程度的備份,這就需要根據實際情況來制定。這裡,有兩個指標可以參考 rto recovery time objective rpo recovery point objective...