資料中心水冷系統備品備件管理新思路

2021-10-05 01:47:33 字數 3607 閱讀 4773

近年來,資料中心單機架功率密度呈上公升趨勢,根據colocation america資料顯示,單一機櫃機架功率密度由2023年的6kw,直線上公升至2023年的12kw。2023年,單一機櫃機架功率密度可能達到16.5 kw。而個別改造案例中,單一機櫃機架功率密度更是高達43 kw,高功率密度的機架假設為資料中心製冷系統提出了前所未有的高要求。水冷系統冬季通過冷卻塔、板式換熱器利用室外自然冷源進行製冷,全年能效比相比風冷空調更具優勢,在越來越多的大型資料中心得到應用。

典型的資料中心水系統通常由冷凍水、冷卻水系統組成,管路較長,法蘭、閥門、過濾器等管路附件較多,隨著使用年限的增加,水系統故障率隨之公升高。面對隨時可能發生的故障,水系統備品備可以說是應急搶修的保障前提。備品備件是指為保障系統正常執行和裝置修理要求,儲備、存放於庫房內備用的用於維護系統和裝置的可替換單元。

1 非常用型備品備件儲備

不同企業所需備品備件種類不同,根據現場實際情況,企業需制定生產、訂購、**、儲備等方面的備品備件管理方案。針對資料中心7x24小時平穩執行的需求,故障處理務必及時有效,備品備件存在種類多、數量大的特點。大型資料中心部分水冷系統管徑超過dn500,管路附件類配品備品備件並不常用,且尺寸、重量較大,出於非常用備品備件自損及庫房空間規劃的考慮,這些非常用型備品備件不會進行現場儲備。

但值得注意的是,這些非常用型備品備件一旦出現故障,很可能直接影響資料中心水系統執行。如果現場沒有儲備,而備品備件的**週期又長,資料中心就會直接面對製冷中斷的風險。

2 故障搶修案例分析

2.1 故障描述

某大型資料中心機房樓配備5臺冷水機組,故障發生前1#、2#、3#冷水機組執行,單台負載率均在60%以上。

2023年8月16日17:10,1#冷水機組冷卻水自清洗過濾器漏水,冷卻水缺水導致冷水機組停機,系統自動切換至4#冷水機組,切換後3臺冷水機組負載率均在60%以上。但由於5#冷水機組壓縮機故障無法啟動,現1#冷水機組不能啟動,導致製冷系統無冗餘,資料中心執行存在巨大風險。

資料中心立刻成立專項搶修組,爭取在最短時間內完成故障的恢復。

2.2 故障原因

自清洗過濾器是安裝在管路y型過濾器上的自動清洗排汙裝置,y型過濾器管徑為dn350。自清洗過濾器主要由法蘭盤、不鏽鋼內刷(含支架)、過濾網、鋼刷主軸、電機組成,漏水原因為自清洗過濾器執行時間較長,法蘭盤安裝孔處水封腐蝕,且鋼刷主軸磨損嚴重,安裝孔處冷卻水洩露。

雖然備品備件庫儲備了水封,但因自清洗過濾器尺寸較大、故障率低,故並未儲備。因鋼刷主軸磨損嚴重,故單純更換水封無法解決冷卻水洩露的問題。

2.2 故障處理

方案一:採購鋼刷主軸進行更換

因自清洗過濾器為定製裝置,主軸為異型件,製作週期最少為3-4天,且發生故障臨近下班時間,經**溝通,主軸的製作最快為第二天上午,這樣,冷機系統處於無冗餘備份狀態至少持續4-5天。採用方案一,資料中心將面對前所未有的執行風險。

方案二:利用未啟用水系統鋼刷主軸進行更換

除冷凍水、冷卻水在用主管路,該資料中心還配備水環加熱管路,且並沒有啟用。可利用管路上的自清洗過濾器鋼刷主軸進行更換。但自清洗過濾器為鑄鐵材質,自重較大,常規拆卸電機、法蘭盤及鋼刷主軸需要約2小時,故拆卸及安裝將耗時約4小時,且因自清洗過濾器較重,安裝過程極易造成水封變形,可能導致再次漏水,如故障搶修失敗,故障恢復時間將會延長。採用方案二,該資料中心亦將面對較長時間的執行風險。

2.3 故障分析

方案一風險過高,方案二雖然利用了閒置備品備件,但依然不能在短時間內完成故障搶修。

搶修組成員均認為方案一和方案二效果都不能達到短時間完成搶修的目的,並總結關鍵點如下:

(1)自清洗過濾器洩**為鋼刷主軸與法蘭盤的安裝孔;

(2)自清洗過濾器重量大是拆裝工作耗時較長的主要原因;

(3)自清洗過濾器利用內部鋼刷、排汙開關定時啟動,達到控制水質的目的。

針對以上三個關鍵點,搶修組提出了幾點疑問:

(1)不更換鋼刷主軸和水封,而是完全堵住安裝孔,是否可以解決漏水問題;

(2)自清洗過濾器更換是否可以減少工作量;

(3)1#自清洗過濾器不起作用,是否會對系統水質產生影響。

針對以上三點疑問,搶修組經過討論,最終得到答案:

(1)完全堵住安裝孔,可以解決漏水問題;

(2)工作量可降低至拆卸法蘭盤、鋼刷主軸及不鏽鋼內刷(含支架);

(3)1#冷水機組執行時,可加大另外兩台冷水機組自清洗過濾器的排汙量,不影響系統水質。

綜上,搶修組總結得出方案三:

拆除1#自清洗過濾器法蘭盤,並將鋼刷主軸、不鏽鋼內刷(含支架)拆除,臨時利用一款鐵板焊死安裝孔,再安裝回y型過濾器。

2.4 故障處理

(1)17:10—17:30

搶修組對現場故障做出評估,最終確定方案三;

(2)17:30—18:45

搶修組借調其他機房樓人員力量,關閉1#自清洗過濾器前後閥門,完成拆卸;

(3)18:45—19:00

搶修組現場利用一小塊鐵板將安裝孔焊死;

(4)19:00—19:30

搶修組安裝1#自清洗過濾器的法蘭盤。

(5)19:30—20:00

搶修組開啟1#自清洗過濾器前後閥門進行注水,觀察1#自清洗過濾器前後壓力恢復正常,安裝孔無洩漏現象。

至此,從搶修方案制定至故障處理完成,歷經約2小時30分鐘,2#、3#、4#冷水機組正常執行,1#冷水機組作為備機,該資料中心機房樓恢復n+1備份機制,執行風險消除。

3「非全尺寸」備品備件管理新思路

「非全尺寸」備品備件的靈感**於汽車的非全尺寸備胎。

3.1 非全尺寸備胎的優點

作為汽車設計領域的技術難點,備胎槽的大小會受到後懸架結構、排氣管布置、油箱位置以及後備廂上層設計的綜合制約。簡單來說,非全尺寸備胎胎寬小很多,後備廂地板下的空間就可以被壓縮,地板上的行李裝載空間就會更大。同時,鑑於備胎在現實用車過程中的使用率並不高,所以很多車企就壓縮了備胎,從而換取更大的後備廂儲物空間。

3.2 「非全尺寸」備品備件的特點

與非全尺寸備胎原理類似,「非全尺寸」備品備件特點鮮明:

(1)成本更低

與跟換整套自清洗過濾器相比,焊接鐵板的法蘭盤顯然成本更低;

(2)搶修時間更短

更換自清洗過濾器法蘭盤,免除了拆卸未啟用水系統法蘭盤、鋼刷主軸的步驟,大大節省了搶修時間;

(3)占用空間更小

可以想象,對比一整套自清洗過濾器,單獨的一塊法蘭盤顯然占用空間更小;

(4)功能性下降

安裝焊死安裝孔的法蘭盤,自清洗過濾器不再具有清洗及排汙功能。

3.3 「非全尺寸」備品備件管理的特點

「非全尺寸」備品備件的管理具有如下特點:

(1)備品備件採購成本更低

「非全尺寸」備品備件成本更低,且具有臨時應急搶修的作用,「全尺寸」備品備件可待「非全尺寸」備品備件使用後另行採購,降低了備品備件初期採購成本;

(2)備品備件庫空間進一步壓縮

因「非全尺寸」備品備件尺寸的優勢,資料中心在進行備品備件庫規劃時可壓縮「全尺寸」備品備件的儲存空間;

(3)備品備件應急性更加突出

因「非全尺寸」備品備件更換時間更短,應急搶修工作時效性更高。

4結論

1.「非全尺寸」備品備件的採購降低了備品備件採購成本、備品備件庫空間需求,提高了故障搶修的時效性;

2.「非全尺寸」備品備件只作為應急搶修用,搶修完成後仍需採購「全尺寸」備品備件進行更換,保證備品備件功能性的完整;

3.「非全尺寸」備品備件管理為各型別企業備品備件管理的提供了新思路。

水冷或風冷的資料中心?

水冷或風冷的資料中心?通常來說,針對資料中心應該使用水還是空氣冷卻方式進行熱學冷卻,我們有必要進行案例研究。作為向大型銀行提供諮詢服務的一部分,我建立了乙份基礎設施整合文件,能夠通過在多個地理位置實施的mdm程式來檢視基礎設施的使用情況。作為基礎設施合理化運用的一部分,我對風冷資料中心所採用的策略進...

Microsoft系統結構企業資料中心功能測試

基本部署 基本部署測試包含了以下所有活動 準備伺服器 裝載作業系統 裝載應用程式,將所有伺服器和網路硬體公升級到當前軟體修訂版,並配置整個系統的所有元件。差不多所有這些活動都在 msa edc構建指南 中進行了說明,在此部分的測試過程中,測試團隊將遵循該 構建指南 本測試部分的關注點是保證所編寫的 ...

資料中心佈線系統的規劃要點

當前,企業資訊化的程度越來越高,單體檔案的容量越來越大,資料中心所支援的應用越來越廣泛,這些都使資料中心內傳輸和儲存的資訊量日益增長。資料中心內的基礎網路設計和執行,不得不應對這一挑戰,在滿足企業高速率 高頻寬傳輸的同時,也要滿足高效能和可公升級性,並且合理控制預算。成本永遠是決定資料中心設計與建設...