為DELL 2900新增全域性熱備磁碟

2021-09-05 08:05:27 字數 3885 閱讀 5723

我們在規劃伺服器本地儲存的時候,一般是為伺服器配置raid,並在機房放置一塊同樣容量、大小的硬碟做為備用。並且定期巡檢機房,一旦看到磁碟報警(紅燈或黃燈),應該用備用硬碟替換故障磁碟,此時raid卡會檢測到硬碟替換,並在新替換的磁碟上重建資料。這種方式是目前大多數單位使用的方法,但是,伺服器一般都能正常使用

三、五年不出問題,開始的時候,可能還會定期檢查伺服器,之後可能管理員就很少去機房檢查,即使去機房檢查也很少一一檢視伺服器的硬碟指示燈。在配置raid5時,如果陣列中只有一塊硬碟出現故障,系統會正常工作,如果有多塊硬碟出現故障,則系統將不能正常工作。如果長時間不檢查,等發現系統出現問題時再去檢查,一般都是出現不止一塊磁碟出現故障,此時修復系統就比較麻煩。今天我就碰到一例,一台有6塊300gb硬碟、配置了raid5的伺服器,有兩個硬碟出現故障(一塊呈琥珀色閃爍,表示驅動器出現故障;另一塊呈綠色/琥珀色閃爍,驅動器預報故障)的問題。

一台工作多年的dell 2900伺服器,近期有一塊磁碟(位置為3)出現故障(呈琥珀色閃爍,離線),而另一塊磁碟(位置為0)亦開始呈綠色/琥珀色閃爍,該提示是驅動器預報故障。該伺服器共有6塊3.5寸、15k、300gb硬碟,配置raid5,這6塊磁碟依次插在0~5的位置。如圖1-1所示。

圖1-1 伺服器正面圖

此時伺服器已經不能進入系統(提示找不到系統盤)。我到機房之後,看到伺服器硬碟檔板都是灰塵(如圖1-2所示),先關閉伺服器電源,將每個硬碟拔下,先清理灰塵,注意不要一下把所有硬碟拔下來,而是乙個乙個清理灰塵,避免插錯位置。

圖1-2  硬碟檔板灰塵

等清理完灰塵之後,重新開啟伺服器的電源,按ctrl+r鍵進入raid配置配置,在"physical disk management"(物理磁碟管理)檢視中,可以看到03盤位的磁碟已經標記為"failed",如圖1-3所示。

圖1-3  磁碟03已經失敗

因為機房有一塊備用硬碟,換上備用硬碟之後,開始重建,如圖1-4所示。

圖1-4 磁碟3 rebuild

返回到"vd mgmt"介面,在"physical disks(物理磁碟組)"可以看到重建進度,如圖1-5所示。

圖1-5 重建進度

對於300gb的磁碟,在沒有進入作業系統介面、在raid卡配置介面中,大約需要70分鐘的時間就可以完成重建。如圖1-6所示,重建完成。

圖1-6 重建完成

在重建完成後,需要進行資料的一致性校驗。在"virtual disks(虛擬磁碟)"中,選擇每乙個邏輯磁碟,按f2鍵,選擇"consistency check(一致性檢查,以便驗證使用 raid 級別 1、5、6、10、50 和 60 的虛擬磁碟中的冗餘資料)",如圖1-7所示,檢查資料是否完好、正確。

圖1-7 一致性檢驗

一致性檢查速度較快,如圖1-8所示,這是檢驗進度。應該幾分鐘完成。注意,不要誤選中"initialization(初始化)",完全初始化將對所有已經存在的資料造成永久性破壞。

圖1-8  校驗進度

應該對每乙個邏輯磁碟進行校驗。檢驗完成後,退出raid卡配置介面,此時系統會得以恢復。

對於00位置的磁碟、間隔大約120秒閃爍一次黃燈的硬碟,為了防患於未然,也應該替換,但當前機房只有乙個硬碟,需要購買新的硬碟替換。

當前情況是,該單位有兩台dell 2900伺服器,每台伺服器都是6塊硬碟做raid5,在機房準備了一塊備用磁碟,發現那台伺服器磁碟出現問題就人工替換。由於伺服器已經使用多年,管理人員怕硬碟再次出現問題,畢竟不可能每天都來機房檢查。此時就引來乙個問題,有沒有辦法,不是人工替換硬碟,而是由伺服器自動替換損壞硬碟呢?這可以通過在伺服器中新增全域性熱備用磁碟來解決。

全域性熱備用磁碟,是在磁碟子系統中配置一塊或多塊額外的磁碟,額外的磁碟平常不用,處於備用狀態,一旦系統中出現有故障的磁碟,系統可以用備用的磁碟自動重建磁碟控制器上任何發生故障的驅動器。奇偶/映象資料用於將有故障磁碟中丟失的資料寫入到熱備用磁碟中,從而將處於臨界狀態的時間降為最低。

raid-0沒有必要採用熱備用驅動器,因為它不提供任何映象資料或奇偶校驗資訊,當然也不能實現磁碟重建。

如果要為所有伺服器都配置全域性備用磁碟,需要為每台伺服器再次配置一塊相同容量、效能的磁碟。

等過了幾天,磁碟到位之後,我們先在有故障硬碟的伺服器的空閒盤位上(磁碟位置07)插上新的硬碟,進入系統將這塊新新增的硬碟配置為全域性熱備磁碟,然後拔下00位置的故障磁碟,檢視全域性熱備是否啟用。主要步驟如下。

(1)進入raid卡配置介面,在物理磁碟管理介面,可以看到07位置已經新增了乙個同樣大小、介面的磁碟,狀態為ready(就緒),而其他正在使用的磁碟狀態為online,如圖1-9所示。

圖1-9  檢視磁碟

(2)選中新新增的磁碟,按f2,在彈出的快捷選單中選擇"make global hs(成為全域性熱備用)",如圖1-10所示。

圖1-10 標準全域性熱備

(3)在彈出的對話方塊中選擇"yes",如圖1-11所示。

圖1-11 確認

(4)設定為全域性熱備磁碟狀態為"hotspare",如圖1-12所示。

圖1-12 設定為全域性熱備

(5)返回到"vd mgmt"管理介面,可以看到07硬碟為全域性熱備,資訊為"global,affinity",如圖1-13所示。此時工作磁碟為00、01、02、03、04、05。

圖1-13  檢視配置

此時如果要退出raid配置介面,系統會正常使用。

(6)拔下位置0的故障磁碟,此時原來在"hot spares"磁碟07會替換0位置的磁碟,開始重建,如圖1-14所示。此時資料磁碟為01、02、03、04、05、07。

圖1-14 全域性熱備磁碟代替故障磁碟

(7)在00位置插上新買的磁碟,這個磁碟狀態為ready,如圖1-15所示。

圖1-15  新新增的00位置磁碟狀態

(8)之後將這個磁碟再次標記為全域性熱備,如圖1-16所示。

圖1-16 標準新新增磁碟為全域性熱備

(9)之後這塊新新增的00位置磁碟變為全域性熱備,而原來07位置狀態為rebuild,代替原來的00位置的磁碟,如圖1-17所示。

圖1-17 磁碟狀態

(10)返回到vd管理,檢視重建進度,如圖1-18所示。

圖1-18 重建進度

此時你可以等重建完成,也可以退出raid卡管理介面,進入系統繼續使用。資料重建會在後台繼續執行,起到資料同步完成。

對於另一台伺服器,也要在空閒位置新增新磁碟,並設定為全域性備用,這不一一介紹。

以後如果伺服器硬碟出現故障,系統會用全域性熱備磁碟替換。當管理員例行巡檢時看到故障磁碟之後,用新硬碟替換,並將新替換的硬碟設定為全域性熱備磁碟即可。這些就不再一一介紹了。

為DELL 2900新增全域性熱備磁碟

我們在規劃伺服器本地儲存的時候,一般是為伺服器配置raid,並在機房放置一塊同樣容量 大小的硬碟做為備用。並且定期巡檢機房,一旦看到磁碟報警 紅燈或黃燈 應該用備用硬碟替換故障磁碟,此時raid卡會檢測到硬碟替換,並在新替換的磁碟上重建資料。這種方式是目前大多數單位使用的方法,但是,伺服器一般都能正...

新奧能源簽約8Manage 為能源事業添「綠」動力

在新奧能源服務 就經營管理資訊化軟體的選型公開招標中,8manage脫穎而出,與新奧能源服務 達成合作。雙方將借助8manage fas共同搭建從商機管理 專案管理 經營績效管理的一體化管理平台,規範企業管理流程,提公升企業管理效率及人力資源利用率,促進管理層科學高效決策。新奧能源服務 是國內集方案...

超融合概念為融合架構市場再添一把火

據各調研資料顯示,超融合架構市場是目前增長最快的it市場之一。idc 2016年超融合架構市場達到15億美元。gartner說融合架構市場到2019年有50億美元。超融合市場如此熱鬧,這不evo rail的公升級版vxrail問世了。vxrail是emc聯邦成員vce推出的新一代超融合架構hci,它...