「它(浸沒冷卻)的設計,就是一個大水箱,對我們做金屬機構的廠商來說,這部份相當熟悉。」晟銘研發中心協理闕仲輝博士向本刊道出瞄準浸沒冷卻的第一關鍵。
闕仲輝表示,浸沒冷卻的散熱原理看似簡單,但水箱這樣的機構,不但佔浸沒冷卻箱體成本7成以上,若沒有開發過金屬模具或機構的業者想要投入,光廠房或產線的投資成本就不低,加上防水設計經驗不足,要累計可靠度的時間,也會比早已跨入的業者來得久。
不過,他也坦承,浸沒冷卻設備除了(放不導電油體)水箱,裡面還得裝上幫伺服器導熱的鰭片式分配器(CDU)或板熱交換器,這一部分並非晟銘強項,一開始光要了解CDU導熱原理,還曾遇過不小挑戰,一度萌生過尋找外面散熱元件廠一起配合,所幸最後終於靠著團隊打磨了解找到克服良率的學習曲線。
有別於氣冷,水冷與浸沒已被視為AI伺服器的散熱兩股新勢力,但水冷因為可以沿用原本氣冷機房架構導入,初期建置成本比浸沫低,伺服器業者導入意願相對於浸沫來得高且快。
對此,闕仲輝並不擔心,研發出身的他分析,水冷固然比氣冷有較高的散熱能力,但通過水冷板(Cold Plate)導熱的地方通常以GPU跟CPU為主,其他像DRAM、硬碟也會發出很多的熱耗,「唯有整個系統直接泡在液體裡,才能將通通會發熱的元件快速吸走熱能。」他指出。
至於導入成本過高的問題,他也認為不能看短線,原因在於,浸沒水箱能置放的伺服器密度高還不用在機房加裝風扇,長期下來,節電隨著PUE的有效降低,整個成本是下降的,要符合高運算需求的資料中心,終極散熱解決方案還是得靠浸沒。
根據本刊曾針對浸沒冷卻技術引據工研院的試算數字,在一個設有2,000台伺服器的雲端資料中心內,分別採用浸沒散熱與氣冷散熱進行成本及耗能比較,前者初期建置雖複雜、費用較昂貴,但伺服器不用吹空調,可省下一大筆空調運轉費用,一年所需電費大幅降低近78%,也讓資料中心能源使用效率最重要的指標PUE(Power Usage Effectiveness,電源使用效率)大幅降低至1.12,10年下來的營運成本,整整減少4.4億元。