英伟达新世代GB200因TDP(热设计功耗)达1200瓦,超出传统气冷散热所能解的热,成为散热系统设计迈向水冷的关键转折点,且因英伟达加快晶片迭代速度,规划每年推出新平台,据了解,明年第三季将亮相的GB300晶片TDP将进一步提高到1400瓦,使得水冷散热的重要性更为提升,相关厂商包含双鸿、奇鋐、高力、力致、尼得科超众可望受惠。
散热厂指出,AI服务器所需解的热不仅来自GPU芯片,CPU功耗也逐步提升,另有内存、电源供应器、以及在高速传输需求下增设的AI加速卡等,都会增加散热范围。 以内存为例,HBM(高带宽内存)单颗TDP就超过30瓦,一机柜需搭配6颗,整体就达约200瓦。
细究水冷产品的产值,业者指出,目前水冷的关键零组件而言,单片水冷板单价约为200-300美元,整组价格在500-800美元,一组分歧管单价约为1.2~1.5万美元,CDU(冷却液分配装置)则根据解热瓦数不同,价格落在1万~3万美元不等,其余散热零组件包含风扇、风扇背门、水冷背板等; GB200整机柜散热产值将高达9万美元,为3D VC气冷散热方案的10-15倍。
而以水冷在市场的采用度而言,散热模组大厂双鸿董事长林育申认为,水冷与气冷可简单以AI、非AI服务器应用做区分,以销量来看,明年水冷的渗透率约达10~15%。
也因散热的产值喷发,除了既有的散热业者外,ODM厂、电源厂等都积极抢进该领域,双鸿分析,这当中的竞争点很多,包含制程能力、产品整合能力、对客户的掌握能力等。 林育申强调,「做产品是基本,能接到订单才是本事」。
林育申回顾,今年公司在量产H系列水冷板等零件时,一些关于厂商投诉哪里又漏水了的恶梦总缠身; 他指出,万分之一的不良率在制程上听起来还可以,但单一项目的不良对于客户信任度的建立影响很大。
而要获取客户的信任,第一道门槛将会是「拿到英伟达的RVL(推荐供应商)资格」,目前服务器所有零件的验证都是由英伟达主导,为此,供应商需要花约6个月的时间取得其认证,才更有机会获取订单。 据了解,目前在水冷板、分歧管方面,完成认证的竞争者包含双鸿、奇鋐、Cooler Master、宝德(前Aavid)。
业者指出,在接单上,系统厂有自己的解决方案,不过大部分CSP客户会自己定义整个服务器运作模式,先与散热厂商沟通,再交由ODM业者生产; 亦有部分情况是客户放给ODM厂商决定设计规格,而他们多数也会希望选用英伟达认证过的供应商。 这凸显了该认证的重要性,且散热厂对CSP厂、ODM/OEM厂商,两边的客户关系都需要有所经营。
而除了目前多数厂商率先切入的水冷板、分歧管以外,业界预估,明年随着GB200开始放量,快接头零组件缺料问题恐再次浮上台面,据了解,GB200一机柜需要300颗快接头,而GB300用量将会倍增到600颗,过去该产品用在油管、油压设备上,去年正式导入服务器应用,需求倍增下,对原本的供应商而言出货压力大。
为此,双鸿、奇鋐都投入快接头自制,双鸿就指出,现在产品认证方面只差可靠度验证,明年可望在供应链缺货时补足产能。
此外,市场也关注高单价的水冷散热零件何时会迎来价格崩跌,业者则指出,现阶段属于数据中心、AI 服务器初期建置期,客户只求有,不求便宜,供应商的砍价不见得会像消费电子一样逐季进行,因此认为价格应可维持很长时间,且现在产品供不应求,跌价可能性不高。