系統可靠性之 硬體冗餘(2)

2021-04-09 06:15:39 字數 2265 閱讀 4219

按備份後的資料是否可更改可分為活備份與死備份。

活備份是指備份到可擦寫儲存介質,以便更新和修改。死備份是指備份到不可擦寫的儲存介質,以防錯誤刪除和別人有意篡改。

按選擇的備份軟體的功能可分為動態備份與靜態備份。

動態備份利用軟體功能定時自動備份指定檔案,或檔案內容產生變化後隨時自動備份。靜態備份是指為保持檔案原貌而進行人工備份。

為了實現自動化的備份、檔案歸檔、資料分級儲存以及災難恢復等,需要使用網路資料儲存管理系統。通過資料儲存管理軟體,結合相應的硬體和儲存裝置,對分布式網路環境下的資料備份進行集中管理。

網路資料儲存管理系統配有專用的備份伺服器,備份伺服器需要安裝網路資料儲存管理伺服器端軟體,連線一台大容量儲存裝置(磁帶庫、光碟庫)。需要進行資料備份管理的伺服器需要安裝備份客戶端軟體,通過區域網將資料集中備份到與備份伺服器連線的儲存裝置上。

網路資料儲存管理系統的核心是備份管理軟體,通過備份軟體的計畫功能,可建立乙個完善的備份計畫及策略,並可借助備份時的呼叫功能,讓所有的伺服器備份都能在同一時間進行。備份軟體也提供災難恢復手段,實現網路資料備份的全自動智慧型化管理。目前在資料儲存領域可以完成網路資料備份管理的軟體產品主要有legato networker、ibm ad**、veritas netbackup等。

為了有效地進行備份,應列出乙份緊要系統的列表,然後對每乙個系統可能遇到的風險和威脅進行分析,根據這些重要的伺服器制定備份方式和策略。一旦確認了重要系統,應明確以下問題:

系統是否有備份?

備份間隔是可接受的嗎?

系統是按規定進行備份的嗎?

是否確認備份介質正確的儲存了資料?

備份介質是否在室內得到了正確的保護?

是否在另一處還有作業系統和儲存設施的備份?(包括必要的license key)

儲存過程是否被測試及確認?

備份的目的是保障網路系統的順利執行,在網路出現故障甚至損壞時,能夠迅速地恢復。災難恢復在整個安全保障體系中占有重要的地位。災難恢復操作通常分為兩類系統恢復、個別檔案恢復。

系統恢復:在伺服器發生意外災難導致資料全部丟失、系統崩潰或是有計畫的系統公升級、系統重組等,需要系統恢復。

個別檔案恢復:個別檔案恢復可能要比全盤恢復常見得多,利用網路備份系統的恢復功能,我們很容易恢復受損的個別檔案。只需瀏覽備份資料庫或目錄,找到該檔案,觸動恢復功能,軟體將自動驅動儲存裝置,載入相應的儲存**,然後恢復指定檔案。

將備份的檔案恢復到另乙個不同的位置或系統上去,而不是進行備份操作時它們當時所在的位置我們稱為重定向恢復。重定向恢復可以是整個系統恢復也可以是個別檔案恢復。重定向恢復時需要慎重考慮,要確保系統或檔案恢復後的可用性。

完整的備份方案,還需要做好詳細的災難恢復計畫,定期進行災難演練。災難演習,可以利用淘汰的機器或多餘的硬碟進行災難模擬,以熟練災難恢復的操作過程,並檢驗所生成的災難恢復軟盤和災難恢復備份是否可靠。

(3)雙機容錯系統

(4)雙機熱備份

雙機熱備份是當cpu出現故障時由閒置狀態的備份系統接替,但正在處理的交易有可能丟失,從而導致資料的不一致。雙機熱備份系統關鍵部件如cpu的故障將導致主系統停止執行,對應用產生很大的影響。當發生系統故障引起停機後,恢復執行時應用需要從磁碟或磁帶上重新啟動,需要耗費更多的寶貴時間。雙機熱備份採用「心跳線」保持主系統與備用系統的聯絡,一旦「心跳線」部分發生故障,系統很難分清是「心跳線」還是系統其他部分的故障,往往需要人工干預才能解決問題,應用也將受到影響。雙機熱備份備用系統的硬體和軟體資源處於閒置的冷狀態,浪費系統資源。

(5)三機表決系統

在三機表決系統中,三颱主機同時執行,由表決器根據三颱機器的執行結果進行表決,有兩個以上的機器執行結果相同,則認定該結果為正確。現在三機系統中較多採用的是將雙機備份和三機表決兩者結合起來的方式,當三機中壞掉一台後就當作雙機備份系統來用。

(6)集群系統

均衡負載的雙機或多機系統就是集群系統(clusting)。dec公司最早在其vax系統上實現了集群技術,多伺服器集群系統的主要目的是使使用者的應用獲得更高的速度、更好的平衡和通訊能力,而不僅僅是資料可靠性很好的備份系統。

圖為乙個計算機群集管理系統。三颱伺服器通過乙太網相聯,並通過scsi電纜分別接到磁碟陣列櫃上,磁碟陣列櫃作為三颱伺服器的共享資料儲存裝置。在三颱伺服器上,分別安裝了nt及lifekeeper容錯軟體包。三颱伺服器分別作三個應用,其中伺服器a用作sybase,伺服器b用作lotus notes,伺服器c用作internet服務,這三個應用都安裝在lec-380 8型磁碟陣列櫃上。正常工作時,三颱伺服器分別作各自的應用,並通過網鏈及scsi鏈相互偵測工作狀態。當有一台伺服器發生故障時,另兩台伺服器中工作量較少的一台伺服器自動接管發生故障的伺服器的資料、使用者及應用程序。故障伺服器恢復正常後,自動恢復到初始的正常狀態。

系統可靠性計算

系統可靠性計算 系統可靠性計算是軟考考試的乙個重點,近些年幾乎每次考試都會考到,但這個知識點的難度不高,了解基本的運算公式,即可輕鬆應對。可靠性計算主要涉及三種系統,即串聯系統 併聯系統和冗餘系統,其中串聯系統和併聯系統的可靠性計算都非常簡單,只要了解其概念,公式很容易記住。冗餘系統要複雜一些。在實...

DP 系統可靠性 題目 題解

description 乙個系統由若干部件串聯而成,只要有乙個部件故障,系統就不能正常執行,為提高系統的可靠性,每一部件都裝有備用件,一旦原部件故障,備用件就自動進入系統。顯然備用件越多,系統可靠性越高,但費用也越大,那麼在一定總費用限制下,系統的最高可靠性等於多少?給定一些系統備用件的單價ck,以...

串並聯系統可靠性計算 知識點4系統可靠性的計算

在功能安全開發的過程中,為達到相應的asil等級的要求,可以採取很多措施提高系統的可靠性和硬體相關的度量指標。這裡面包括但不限於系統自檢 輸入訊號有效範圍檢測 電源電壓監測 冗餘和看門狗等。更多的措施可以參考iso26262標準。這裡想從採用冗餘技術的系統的可靠性計算,來看如何對系統的可靠性進行量化...