數據中心如何降溫?風扇、液冷、沈浸式三大散熱方式完整解析
快速摘要
AI 時代的數據中心面臨前所未有的散熱挑戰。NVIDIA B200 單顆 GPU 功耗高達 1200W,2026 年平均機架密度已達 27kW(較兩年前成長 69%)。傳統風扇散熱的 PUE 約 1.5-1.8,直接液冷(DLC)可降至 1.1-1.3,沈浸式冷卻更可達 1.02-1.08。以 64 機架的數據中心計算,從風扇切換到液冷,五年 TCO 可從 4200 萬美元降至 3300 萬美元。本文完整比較三種散熱方式的原理、優缺點與成本,並說明液冷系統中閥門扮演的關鍵角色。
為什麼數據中心散熱這麼重要?
數據中心是 AI 運算的核心基礎設施,而散熱是數據中心營運中最大的能源消耗之一。
根據產業數據,數據中心的散熱系統通常佔總用電量的 30%-40%。當 AI 訓練和推論需求持續爆發,散熱效率直接決定了:
- 營運成本 — 散熱越有效率,電費越低
- 設備壽命 — 溫度每升高 10°C,電子元件壽命減半
- 運算密度 — 散熱能力決定每個機架能放多少 GPU
- 碳排放 — 更低的 PUE 代表更少的碳足跡
隨著 NVIDIA B200 GPU 的單顆功耗達到 1200W,傳統的風扇散熱已經逼近物理極限。2026 年,平均機架功率密度已達 27kW,高密度 AI 機架甚至超過 100kW — 這迫使整個產業重新思考散熱架構。
方式一:風扇散熱(傳統空冷)
運作原理
風扇散熱是最傳統的數據中心冷卻方式。它的核心概念很簡單:用冷空氣帶走伺服器產生的熱量。
典型的空冷系統包含以下組件:
- CRAC/CRAH 設備 — 電腦房空調(Computer Room Air Conditioner/Handler),負責製造冷空氣
- 高架地板 — 冷空氣從地板下方送入伺服器前方
- 熱通道/冷通道配置 — 將進氣與排氣分離,避免冷熱空氣混合
- 伺服器風扇 — 將冷空氣吸入機箱內部,吹過散熱鰭片帶走熱量
優點
- 技術成熟,維護人員經驗豐富
- 初始建置成本相對較低
- 適用於低功耗密度的一般伺服器(每機架 < 15kW)
- 不需要特殊冷卻液或管路配置
缺點
- PUE 通常在 1.5-1.8 之間,能效較差
- 無法應對高密度 AI 機架(> 30kW)
- 風扇噪音大,高密度環境可達 85dB 以上
- 佔用大量樓地板面積(需要通道間隔與空氣循環空間)
方式二:直接液冷 DLC(Direct Liquid Cooling)
運作原理
直接液冷是目前 AI 數據中心最主流的進階散熱方案。它透過冷板(cold plate)將冷卻液直接貼合在 CPU 和 GPU 的表面,以液體的高熱傳導效率帶走熱量。
DLC 系統的核心架構:
- 冷板 — 銅或鋁製的金屬板,直接安裝在晶片表面
- CDU(冷卻分配單元) — 負責調節冷卻液溫度與流量的中央設備
- 管路系統 — 連接 CDU 與各伺服器冷板的配管
- 球閥與控制閥 — 控制冷卻液流量、壓力與迴路切換
- 冷卻液 — 通常使用丙二醇與水的混合液
液體的散熱效率是空氣的 3000 倍以上,這就是 DLC 能大幅降低 PUE 的根本原因。
優點
- PUE 可降至 1.1-1.3,比空冷節省 40% 以上的冷卻能耗
- 可支援每機架 50-100kW 的高功耗密度
- 大幅減少噪音(無需高轉速風扇)
- 佔用樓地板面積更少(不需要熱通道/冷通道間隔)
- 精確的溫度控制,有助於延長硬體壽命
缺點
- 初始建置成本較高(管路、CDU、閥門等基礎設施)
- 需要專業的液冷系統維護人員
- 洩漏風險需要嚴格的密封和監控機制
- 記憶體、儲存裝置等非晶片組件仍需輔助風扇散熱
方式三:沈浸式冷卻(Immersion Cooling)
運作原理
沈浸式冷卻是目前散熱效率最高的方案。它將整個伺服器主機板浸泡在不導電的特殊冷卻液(介電液)中,所有組件同時被冷卻。
沈浸式冷卻分為兩種類型:
- 單相沈浸式 — 冷卻液始終保持液態,透過循環帶走熱量
- 雙相沈浸式 — 冷卻液在晶片表面沸騰汽化,蒸氣凝結後回流,利用相變化帶走大量熱能
優點
- PUE 可達 1.02-1.08,幾乎所有電力都用於運算
- 可支援超過 100kW 的極高機架密度
- 完全消除風扇噪音
- 所有組件均勻散熱,大幅延長硬體壽命
- 不受外部環境溫度影響
缺點
- 初始成本最高(特殊冷卻液價格昂貴)
- 硬體維護需要從液體中取出,增加維護時間
- 冷卻液的化學相容性要求嚴格(電纜、連接器、密封材料需相容)
- 供應鏈仍在發展中,技術標準尚未完全統一
- 部署經驗相對有限,營運團隊需要額外培訓
三大散熱方式完整比較
以下表格比較風扇空冷、直接液冷 DLC 與沈浸式冷卻在主要指標上的差異:
| 比較項目 | 風扇空冷 | 直接液冷 DLC | 沈浸式冷卻 |
|---|---|---|---|
| PUE 範圍 | 1.5 - 1.8 | 1.1 - 1.3 | 1.02 - 1.08 |
| 最大機架密度 | < 15kW | 50 - 100kW | > 100kW |
| 五年 TCO(64 機架) | 約 4200 萬美元 | 約 3300 萬美元 | 約 2800 萬美元 |
| 初始建置成本 | 最低 | 中等 | 最高 |
| 噪音 | 高(> 85dB) | 低 | 極低(接近靜音) |
| 維護複雜度 | 低 | 中等 | 高 |
| 技術成熟度 | 非常成熟 | 成熟(快速普及中) | 發展中 |
| 適用場景 | 一般伺服器、低密度 | AI 訓練/推論、HPC | 超高密度 AI、極端運算 |
這對閥門代表什麼?
無論是直接液冷還是沈浸式冷卻,液冷系統的核心都離不開精密的流體控制 — 而這正是閥門的領域。
在 CDU(冷卻分配單元)系統中,球閥扮演的關鍵角色包括:
- 流量控制 — 調節冷卻液在各伺服器迴路間的分配
- 壓力調節 — 維持系統管路的穩定壓力
- 迴路隔離 — 在維護或故障時隔離特定伺服器,不影響其他節點運作
- 緊急關斷 — 偵測到洩漏時快速切斷冷卻液流動
液冷系統對閥門的要求極為嚴格:
- 零洩漏 — 任何洩漏都可能損壞價值數百萬的 GPU 設備
- 耐腐蝕 — 必須能承受丙二醇等冷卻液的長期腐蝕,SS316 不鏽鋼是首選材質
- PTFE 密封 — 確保與冷卻液的化學相容性
- 精確控制 — 三片式球閥可在不拆卸管路的情況下進行維護,大幅減少系統停機時間
液冷閥門市場正在爆發性成長。預估到 2032 年市場規模將達到 18 億美元,年複合成長率 30.8%,其中球閥佔約 25% 的市場份額。
LINS Valve 自 1969 年起專注製造高品質 SS316 不鏽鋼球閥,具備 ISO 9001:2015、CSA、ASSE 等國際認證。從鑄造、CNC 加工到組裝的一條龍生產能力,加上 80 年以上服務 Honeywell、WATTS、Zurn Elkay 等 Fortune 500 企業的 OEM 經驗,讓我們成為液冷系統閥門的可靠供應商。
如果您正在尋找符合數據中心液冷系統規格的球閥方案,歡迎聯繫我們取得報價。