AI伺服器電源與散熱技術高峰論壇特別報導

AI算力競逐加速 液冷系統革命成關鍵

2025 年 12 月 24 日

液體冷卻,已從過去的選項,成為此刻的必需品。但「換上液冷」這四個字,並不像拔掉舊插頭、換上新燈泡那麼簡單。它不是單一技術的替換,而是一場牽一髮動全身的系統性革命。這是一場環環相扣的攻防戰,任何一個環節的疏漏,都可能讓千億投資的AI建設毀於一旦。液冷不是單一換裝升級,而是全面系統革命。

OCP制定新規則 因應TDP高牆

革命不能是各自為王的混戰。開放運算計畫(OCP)台灣區專案代表暨Submer台灣生態系與策略聯盟負責人Alex Chou指出,傳統氣冷的極限清晰可見,業界TDP預估值已喊到1000W甚至2500W。Alex Chou分析,液冷是唯一的出路,其中浸沒式冷卻是達成100%熱捕獲的終極方案。

開放運算計畫(OCP)台灣區專案代表暨Submer台灣生態系與策略聯盟負責人Alex Chou表示,未來散熱將是跨領域的綜合作戰。

他強調,OCP為此成立了「冷卻環境專案」,旨在為革命制定通用的規則,涵蓋冷板、冷卻液分配單元(CDU)、浸沒式以及最關鍵的「熱回收」。作為OCP的積極貢獻者,Submer的角色正是將開放理念付諸實踐,其SmartPod EXO方案能處理高達361kW的熱能,並支援高達55°C的進水溫度以極大化熱回收效益。

戰略思維轉變 從散熱走向創能

從開放標準的宏觀視野落地,首先,戰略思維必須徹底轉變。金運科技總經理郭丁賀直指,當AI伺服器單櫃功率動輒突破100千瓦,傳統氣冷已不適合。導入液冷的核心價值,也不僅僅是為了降溫。郭丁賀強調,數據顯示液冷能將PUE(電源使用效率)從氣冷的1.6大幅降低至1.2,這在1GW規模的資料中心,每年省下的電費可能高達千億台幣。

金運科技總經理郭丁賀直指,當AI伺服器單櫃功率動輒突破100千瓦,傳統氣冷已不適合。

 

但更關鍵的革命在於「熱回收」。郭丁賀點出,液冷最大的優勢是能產生高溫回水,過去被當作廢棄物的餘熱,現在成為了可以再利用的「熱資產」,這才是將AI基礎設施從「耗能」轉型為「創能」的關鍵一役。

浸沒式材料大戰 液體選擇是關鍵

然而,決定了液冷這條宏觀戰略,真正的考驗才剛開始。當我們決定將昂貴的伺服器直接浸入液體,第一個最根本的問題是:到底該用什麼「油」來泡?這引發了一場浸沒式冷卻的「液體內戰」。INVENTEC亞太區技術經理Steven Teh分析,主流的碳氫化合物(Hydrocarbon oil)與氟化液(Fluorinated)存在天壤之別。對資料中心營運商而言,安全性絕對是第一考量。碳氫化合物油雖然閃點高,但依舊存在火災風險,且油膩特性易造成工安危險。

INVENTEC亞太區技術經理Steven Teh解釋,氟化液更低的黏度帶來了遠勝於黏稠油品的流動性與均勻性。

 

相較之下,Thermasolv氟化液不僅沒有閃點,在測試中甚至展現出卓越的「滅火特性」。在效能的硬碰硬比較上,200°C的熱源在氟化液中能被壓制在71.5°C(單相)甚至52°C(兩相)。Steven Teh解釋,這不只是比熱差異,更低的黏度帶來了遠勝於黏稠油品的流動性與均勻性。更別提,碳氫化合物油被證實與EPDM橡膠、PVC等伺服器常見密封件存在嚴重的材料相容性問題。顯然,選錯液體,整組系統都可能報銷。

被忽視的電力基石 主動預測才是王道

當我們把散熱系統的戰略、材料都做到極致,卻可能忽略了這一切運轉的根本——電力。就算冷卻系統完美無瑕,但如果供電不穩,一切都是空談。根據Uptime Institute的數據,高達95%的資料中心曾遭遇非計劃性停機,其中更有80%的事故原本能夠被預防。

EATON Exertherm亞太區總監Jason Lim指出,高達95%的資料中心曾遭遇非計劃性停機,其中更有80%的事故原本能夠被預防。

 

EATON Exertherm亞太區總監Jason Lim指出,這正是因為傳統維運策略的盲點。AI時代的維運必須轉向「主動式」與「預測性」維護。

Exertherm的核心技術「連續性熱點監測」(CTM),便是透過安裝在電氣資產內部的永久性感測器,24小時7天全天候收集即時熱數據,並即時分析,一旦偵測到異常便能立刻發出警報。

Jason Lim特別強調,CTM能精確對準如匯流排(Bus Duct)接頭這樣的「關鍵弱點」,在災難性故障發生前就識別出它們。

小元件成決勝關鍵 接頭充當預警角色

CPC應用開發經理Gerate Lin指出,當QD出現堵塞或腐蝕時,它其實是在警告你,整個系統的流體健康或過濾已經出了大問題。

 

選對了安全的液體,也顧妥了電力基石,就高枕無憂了嗎?恐怕未必。在一個由數千個零件組成的複雜液冷迴路中,魔鬼藏在更微小的細節裡。CPC應用開發經理Gerate Lin指出,液冷系統的可靠性,已成為決定AI算力能否穩定輸出的勝負手。他以經典的「浴盆曲線」說明,元件的生命週期分為早期失效、正常壽命與損耗期,而一個看似微小的快速接頭(Quick Disconnect,QD),就可能導致系統崩潰。

Gerate Lin因此提出一個生動的譬喻,快速接頭(QD)往往是液冷系統的「礦坑中的金絲雀」。當QD出現堵塞或腐蝕時,它其實是在警告你,整個系統的流體健康或過濾已經出了大問題。

系統工程大整合 散熱成跨領域的全面戰爭

AI算力的競賽,表面上是晶片速度之爭,裡子上卻是一場橫跨標準、戰略、材料、電力到元件可靠度的嚴謹「系統工程」。從OCP的開放架構、金運的熱回收戰略、INVENTEC的氟化液材料、EATON的電力預測性維護,到CPC的「金絲雀」接頭可靠度,這五個維度勾勒出了AI資料中心成功的完整圖像。

這場冰與火之歌的勝利者,必須同時是高瞻遠矚的專家、錙銖必較的科學家,以及最謹慎細心的工程師。在AI的未來,沒有任何一個環節是理所當然的。

標籤
相關文章

支援AI推論/視訊轉換 OCP多節點伺服器擴大功效

2020 年 08 月 20 日

伺服器PSU面臨雙重挑戰 寬能隙元件機會來了(1)

2023 年 04 月 27 日

伺服器PSU面臨雙重挑戰 寬能隙元件機會來了(2)

2023 年 04 月 27 日

伺服器PSU面臨雙重挑戰 寬能隙元件機會來了(3)

2023 年 04 月 27 日

液冷系統革命成關鍵 AI算力競逐加速

2025 年 12 月 01 日

AI伺服器電源測試面臨三大挑戰 致茂提出全方位解決方案

2025 年 12 月 01 日
前一篇
貿澤電子供貨NXP MR-VMU-RT1176車輛管理單元 簡化移動機器人設計
下一篇
超赫科技總經理吳展興:台灣化合物半導體前景可期