【導讀】4月8日,曙光數創正式發布全球首個MW級相變浸沒液冷整機柜及基礎設施整體解決方案(C8000 V3.0),標志著液冷技術從“可選項”變為AI計算的“必選項”。該產品單機柜功率密度高達900kW,PUE低至1.04以下,通過自研冷媒、金剛石銅導熱材料及高壓直流供電等五大技術突破,實現了散熱效率與能效的跨越式提升。曙光數創高級副總裁張鵬與資深技術專家黃元峰在采訪中深入剖析了液冷成為未來AI計算首選方案的深層邏輯,并分享了C8000 V3.0在實際項目中的創新應用與未來“算熱聯產”的生態愿景。
TrendForce預計,液冷技術在AI數據中心的滲透率將從2024年的14%大幅提升至2026年的40%,并在未來數年持續增長。
液冷成為未來AI計算首選方案
英偉達預測,AI基礎設施市場規模在2027年可能達到萬億美元級別。從其AI計算平臺演進來看,單機柜功率密度持續攀升。
“高密部署是下一代AI計算的重要趨勢,國內外新建數據中心的功率密度正快速上升?!秉S元峰解釋道,目前國際主流GPU功耗已達1.8kW,CPU超過650W。受制程影響,國產芯片功耗更高,預計到2027年,國產主流GPU功耗可能突破3000W,CPU突破1000W。
黃元峰強調,在這樣的趨勢下,液冷成為未來AI計算的首選方案,是未來AIDC發展中最具應用潛力的方向,前景廣闊。

曙光數創資深技術專家黃元峰
曙光數創是一家研發驅動型企業,其技術產品在國內乃至全球都處于領先地位。如今發布的C8000 V3.0是曙光歷經十年積累的成果,并非一蹴而就。早在2017年,曙光數創就推出了第一代相變浸沒式產品,單機柜功率為210kW,。第二代產品于2023年推出,單機柜功率達到575kW。第三代產品C8000 V3.0單機柜功率已達到900kW,這已是對標英偉達2028年“費曼架構”的水平。
C8000 V3.0有何亮點
C8000 V3.0整體結構擁有五個特點:
第一,電力供給方面,系統采用自主研發的HVDC 2.0架構,支持市電、電池等多種輸入,可輸出直流800V、±400V、336V、240V及交流380V等多種電壓,靈活配比。穩壓精度達±0.5%,響應速度2.5毫秒每安,功率密度較傳統方案提升20%。服務器內部采用高壓直流直接進柜供電,并配備智能監控與模塊化運維,確保穩定可靠。
第二,相變浸沒冷媒技術方面,主要包括自研冷媒新材料與材料兼容性。冷媒于2017年與中科院過程所合作研發,2018年實現進口替代,目前成本已降至進口產品的30%以下。材料兼容性方面,公司投入超億元,建立了國內首個相變浸沒材料兼容性數據庫,檢測超過2000種材料,并形成材料使用的黑名單與白名單。
第三,相變換熱核心技術方面,沸騰環節采用金剛石銅材料,導熱系數較純銅提升100%,熱膨脹系數降低60%以上。經過4000次高低溫循環沖擊,性能零衰減。散熱鰭片采用一體化成型技術,加工精度達毛細血管級別,換熱面積為熱源面積的百倍以上。微流道中的微納復合結構增強了相變效率,整體實測芯片性能提升10%,溫度降低5度以上。冷凝環節采用釬焊換熱器,換熱面積增加40%,換熱能力提升85%。點陣交錯式通道配合微納米表面技術,確保汽體快速冷凝。
第四,自控技術方面,系統可在5秒內完成15%至100%的無波動流量調節,。配備故障診斷系統,采用雙閉環控制和模型預測前饋策略,提高診斷的穩定與準確性。同時具備全局調優能力,實現供能、負載與配電的整體能效優化。
第五,機電轉接與結構密封方面,實現汽、液、電、網四維熱插拔,泄漏率小于10??量級,內部潔凈度達到ISO 7級以上。

“我們認為,單機柜功率超過200kW時,采用兩相浸沒式液冷優勢明顯,全生命周期看成本更優且長期可收斂?!秉S元峰表示,主要體現在四個方面:高功率下單位冷卻成本遞減、介質成本降至進口產品的30%以下、PUE≤1.04大幅節省電費,以及規?;蓭淼目臻g與配件成本優化。因此,相變浸沒式液冷既高效又好用。
以中科曙光scaleX640超節點為例,這是全球首例已落地的兆瓦級AI解決方案,特點可概括為:高效散熱、成本可控、省電節能、性能穩定、算力密度全球領先。
走進實際項目
那么,C8000 V3.0在實際機房中如何讓液冷技術發揮出其最大價值。張鵬介紹,AIDC相對于傳統的數據中心,完全是不同的物種。面向未來的AIDC機房設計,必須采用創新的設計理念,不能再以傳統眼光看待新事物。具體來說,其在項目中設計主要涵蓋四個方面:
第一是冷卻,AIDC有三類冷卻需求:高密度核心機房、通用計算區以及配套服務區域。C8000 V3.0可實現單機柜900kW以上的極致散熱能力。
第二是供電,它是C8000 V3.0最重要的創新之一。團隊設計了占地僅17平方米的中壓直轉系統,內置變壓器和直流柜,可直接掛接電池。該裝置支持“交直流互用”,3150kVA可輸出交流或直流,以及240V、400V、800V等多種電壓。核心機房下方開挖了160個孔洞,使高壓線纜以最短距離接入計算機,替代了傳統管井方案,節省成本約4000萬元。這一布局將供配電系統盡量靠近機器,縮短低壓線纜,減少用銅量。
第三是智能管理系統,曙光智創引入了“健康度”概念,實現故障預診斷。通過AI綜合分析溫度、流量、壓力等參數,系統可提前判斷換熱器、冷媒、水泵等設備的健康狀態,而不是等到故障發生才報警。同時,將全年運行數據輸入AI模型進行學習,系統可自動給出更節能的運行參數。在實際運營中,AI調優可使冷卻系統能耗再降低10%。
第四是余熱利用方面,曙光數創也有自己的理解。張鵬指出,由于液冷排出的水溫約為40~50℃,品位處在不高不低的狀態,芯片允許的工作溫度在80~90℃之間,受熱阻限制,外部水溫很難再提高。即便使用熱泵升溫,能耗反而得不償失。因此,最現實的做法是直接為這40~50℃的熱水尋找合適的應用場景。目前曙光數創已識別出十多個潛在場景,例如中水處理廠中用于分解有機物的菌落需要這種溫度的熱量,皮革廠烘干工序同樣適用,此外還包括農業大棚等。

曙光數創高級副總裁張鵬
但余熱利用的推廣不能僅靠企業單打獨斗,需要政府引導和政策支持,比如對實施余熱利用的項目給予電費優惠等激勵。張鵬將其概括為“算熱聯產”理念,目前數據中心占中國用電量約3%,遠期有可能上升至30%,余熱利用將變得愈發重要。
從芯片外圍到芯片封裝
“液冷只有走完最后一微米,算力的能量才能真正被釋放?!睆堸i表示,回顧多年的技術積累,芯片的熱密度持續增大,目前的工作仍主要圍繞芯片外圍展開。未來,一個重要的趨勢是向芯片內部發展。熱量從底層電路傳遞到表面的短短幾百微米,其熱阻可占整個鏈路的三成。此前主要降低的是外圍熱阻,而未來的“最后一微米”將是行業突破的關鍵。
展望未來5~10年,一個值得突破的方向是芯片“封裝”內部的熱阻問題。黃元峰對此解釋,目前液冷技術多在芯片外部做文章,但隨著芯片功耗增大,封裝本身帶來的溫差成為瓶頸,只有降低內部熱阻,外部冷卻的效率才能最大化。
通過攻克高功率密度散熱、供電架構革新及余熱利用等關鍵難題,該方案在性能、成本與能效上均展現出顯著優勢,助力中國智算基礎設施在關鍵指標上實現對國際領先水平的“代差”超越。未來,隨著“散熱即算力”理念的深化,液冷技術將向芯片封裝內部的“最后一微米”延伸,而開放生態與產學研協同將成為推動行業規模化落地的核心動力,為全球數字經濟發展注入綠色、高效的持久動能。



