大家都用得起的液冷伺服器

2021-09-04 15:09:08 字數 3292 閱讀 9501

採用間接混合冷卻方式的液冷伺服器曙光tc4600-lp,將液冷與風冷方式有機地結合一起,降低了液冷伺服器的使用門檻,在為資料中心使用者提高效能的同時,還節約了成本。

大到資料中心機房,小到一台伺服器,大多數都採用風冷的製冷方式。但是眾所周知,風冷的乙個致命缺陷是冷卻系統能耗高,因為空氣與液態冷媒相比,輸送功率大、傳熱溫差大、風扇功耗大。中科曙光資料中心產品事業部總經理沈衛東舉例說,採用風冷伺服器、機房空調機的資料中心,在不考慮ups系統的情況下,其pue指標也不可能低於1.4,而採用液冷伺服器、自然冷卻冷站的資料中心,pue值可以輕鬆降低到1.2以下。

在2023年6月舉行的isc14國際超級計算大會上,曙光發布了國內首款全浸泡式液冷伺服器phpc300,當時就有參觀者提出想購買。但是,全浸泡式液冷伺服器目前仍處在完善之中,距商用還有一段距離。看到使用者對液冷伺服器的強烈需求,曙光在今年8月又發布了間接混合冷卻式方式的液冷伺服器tc4600-lp,它將液冷與風冷方式有機地結合一起,已經實現了批量發貨。tc4600-lp伺服器的出現降低了液冷伺服器的使用門檻,在為資料中心使用者提高效能的同時,還節約了成本。

液冷與風冷的有機組合

沈衛東介紹說,曙光tc4600-lp伺服器採用「液冷+風冷」的冷卻方式,其中液冷部分採用間接式冷卻技術。所謂間接式冷卻,即冷媒與發熱元件被導熱材料分離,不直接接觸,而是通過液冷板、液冷頭等高效熱傳導部件將被冷卻物件的熱量傳遞到冷媒中。採用間接冷卻的液冷散熱系統,對計算機系統改動不大,僅需將原風冷散熱片替換為液冷散熱片(液冷頭),並將冷媒管路引出機箱即可。在間接冷卻方式中,冷媒有自身的通路,並不與電子器件直接接觸,只要求液體管路密封性好,冷媒不洩漏即可。

曙光tc4600-lp伺服器是乙個系統,由1個cru(冷卻櫃)和兩個伺服器機櫃共同組成乙個最小的冷卻單元。液冷與風冷兩套系統組合起來為伺服器提供散熱。cru機櫃內部包括cdm(液冷)模組及cim(風冷)模組。每個tc4600-lp伺服器機箱設計的發熱量為4kw, 其中液冷系統2.7kw,風冷系統1.3kw。單個cdm製冷量為10.8kw,負責左右兩個機櫃內部4個hcpu的製冷。cru機櫃內部共有3個cdm模組。

間接冷卻式液冷系統能直接將高溫熱源cpu和記憶體上的散熱量通過室內側製冷系統進行迴圈,同時利用列頭製冷模組的高效換熱與室外熱源進行熱交換。cru機櫃內建的每乙個cdm模組可幫助4箱的tc4600刀片伺服器進行熱量交換(左右各兩箱)。室內製冷系統內的冷媒在cdm內迴圈幫浦處獲取動力,通過管路系統輸配到左右機櫃內部4個hcpu處,再利用hcpu將液體輸送給主機板上配置的冷頭。冷媒在液冷頭內部吸熱後,溫度公升高,高溫冷媒流經hcpu進入cdm內的換熱器與室外冷源進行熱交換,又重新變為的低溫冷媒,再進入儲液罐內準備供給迴圈幫浦,進行下一迴圈。通過液冷方式,cpu表面的溫度會快速下降,cpu的效率和可靠性都能得到進一步提高。

液冷方式採用的冷媒通常包括三種:油、水和蒸發冷媒。tc4600-lp伺服器採用的是水。有人可能會擔心,採用液冷方式,萬一發生漏液怎麼辦?「漏液問題是實現液冷必須突破的技術難關。曙光擁有一些技術專利,可以通過負壓模式可以解決漏液問題。」沈衛東介紹說。

tc4600-lp伺服器採用的是非全浸泡液冷方式,也稱混合式製冷方式,因為液體製冷只能帶走三分之二的裝置發熱量,而主機板的發熱量仍然要依靠風冷方式帶走。「從這個角度講,混合式液冷並不是徹底的液冷技術革命。但是,混合式有它的乙個優點,就是只要對原有的風冷伺服器稍加改進,附加乙個液冷模組即可,很容易實現市場化。因此,今年,我們首推的還是這種混合式製冷的伺服器。」沈衛東解釋說。

一些國外的伺服器廠商也擁有液冷伺服器。沈衛東表示:「我們現在的研發方向與國際趨勢是一致的。目前市場上應用比較成熟的也是間接式製冷方式,全浸泡式液冷方式還有一些技術難點需要突破。以前,只有一些特殊定製的大型專案才會用到液冷方式。但我們認為,隨著間接式製冷方式的技術逐步成熟和成本不斷下降,在伺服器甚至工作站上使用液冷方式的條件已經具備。」曙光公司從2023年開始研究新的節能技術。將液冷基礎設施與伺服器完美融合的曙光tc4600-lp是比較適合大規模應用的採用新型製冷方式的伺服器。

目前,在全球範圍內,研究全浸泡式液冷伺服器的廠商屈指可數。全浸泡式液冷伺服器還沒有做到商品化,仍有許多技術難題要解決,包括排放液、密封、液體的儲存和新增等。沈衛東介紹說,曙光在全浸泡式液冷伺服器方面已經有了一些技術儲備,但是距產品上市可能還有一年時間。不過,在今年底,曙光會先發布一款全液冷的工作站產品。

不會增加成本

為了提高計算密度,許多使用者願意採用刀片式伺服器。但實際上,很少有使用者的機櫃是滿配的,因為刀片伺服器的散熱是乙個瓶頸。採用液冷伺服器,在提高製冷效率、降低能耗的同時,是否也能大幅提公升機櫃的裝置密度呢?

曙光tc4600-lp的乙個模組由5u高的刀片伺服器機箱和1u高的hcdu水平分液單元組成,在乙個標準的42u機櫃內,只能放7個模組,而採用風冷方式的刀片機箱可以放置8個。單純從數量上看,風冷伺服器超過了液冷伺服器。但是如前所述,風冷伺服器的機櫃很難滿配。「目前,採用間接式液冷的曙光tc4600-lp伺服器與風冷伺服器的密度差不多。但是如果以後我們針對液冷方式對刀片伺服器進行優化設計,那麼密度還可以進一步提高。」沈衛東解釋說。

在推出tc4600-lp液冷伺服器的同時,曙光還提供了乙個配套的greenlc解決方案。沈衛東表示,液冷伺服器需要乙個與之相配合的特殊的資料中心基礎設施。greenlc是與tc4600-lp伺服器相配套的液冷系統和配電監控機櫃系統。相對於風冷伺服器,液冷伺服器的初次採購成本會略有增加,但在整體擁有成本上,液冷伺服器還是具有明顯優勢的。

「tc4600-lp液冷伺服器是乙個自封閉、帶負壓、能主動報警的智慧型化系統,平時幾乎不需要維護。」曙光高效能產品總監戴榮博士補充說,「風冷伺服器必須配套具有更大功率的空調系統,這增加了風冷伺服器的運營成本。tc4600-lp配合greenlc基礎設施整體方案,可為乙個500kw的中型資料中心每年節省150萬元的電費支出。在裝置投資方面,與風冷版的tc4600伺服器相比,雖然液冷版的tc4600的採購費用有所提高,但配套的冷卻系統的成本有所下降,所以整個資料中心的裝置採購成本基本不變。」

高效能計算是突破口

曙光tc4600-lp液冷伺服器已經有了使用者,主要集中在高效能計算、電信和網際網路行業。戴榮介紹說:「一些採用高效能計算的使用者通常會定製自己的刀片伺服器系統。這些使用者會嘗試性地選擇液冷伺服器,看看液冷伺服器是否真的可以降低整體運營成本。液冷伺服器更適合部署在大規模的資料中心裡。」

曙光tc4600-lp針對的就是大型資料中心使用者。曙光tc4600-lp本身具有良好的可擴充套件性,目前一套裝置包括10個結點,未來可以擴充套件到100個甚至1000個結點。乙個資料中心使用者擁有的伺服器規模如果達到上萬台,它就會特別關注製冷的問題。戴榮表示:「採用液冷伺服器,使用者大約一年左右能收回前期的投資。高效能計算行業的使用者對間接式液冷伺服器比較感興趣,而網際網路企業的資料中心在使用液冷伺服器方面還有乙個教育和熟悉的過程。」

戴榮表示,未來,曙光會繼續推出採用間接式製冷方式的小型化的產品。

伺服器液冷散熱與風冷散熱

液冷散熱 液冷散熱是把cpu的熱量吸出來,通過液體降溫達到散熱的目的。也有將伺服器完全放在液體下執行的模式。風冷散熱 風冷散熱是通過散熱器將cpu發出的熱量轉移至散熱器塊,然後通過風扇將熱氣吹走。因此還需要空調給環境降溫。液冷散熱執行更安靜 沒有風扇產生的噪音 降溫效率更高,功耗更低,而且採用液冷技...

公告 向大家匯報伺服器的情況

今天中午13 15左右,伺服器發生了意外重啟。計算機已經從檢測錯誤後重新啟動。檢測錯誤 0x0000007a 0xc0384bb0,0xc000009c,0xe12ec004,0x30d8c880 已將轉儲的資料儲存在 c windows memory.dmp。當時,由於不知道伺服器具體情況,直接聯...

公告 向大家匯報伺服器的情況

今天中午13 15左右,伺服器發生了意外重啟。計算機已經從檢測錯誤後重新啟動。檢測錯誤 0x0000007a 0xc0384bb0,0xc000009c,0xe12ec004,0x30d8c880 已將轉儲的資料儲存在 c windows memory.dmp。當時,由於不知道伺服器具體情況,直接聯...