传英伟达GB200液冷服务器一关键组件也面临短缺!

英伟达GB200液冷服务器关键组件也面临短缺!

8月13日消息,据《经济日报》报道,AI芯片大厂英伟达(NVIDIA)面向服务器的Blackwell GPU由于设计缺陷正遭遇出货延迟之际,由于GB200的服务器由风冷转向液冷,所需的关键零部件——快换接头(UQD)也遭遇了严重短缺,也影响了纬创、富士康、美超微(Supermicro)等AI服务器供应商的出货时间。

快换接头厂商往往有专利保护,从生产到供货,往往还需要经历包括OCP认证、客户端认证在内的重复验证,而原有供应商扩产意愿低,这也导致了当这类产品需求大涨的情况下,整体供货周期拉长

Supermicro首席执行官Charles Liang在上周的财报电话会议上表示:“一些关键新零部件短缺将约8亿美元的收入出货推迟到7月,这降低了我们6月份的每股收益,并将在9月份的季度得到确认。而该关键零部件正是快换接头。

液冷对于高性能 AI 服务器至关重要。AI 服务器中的液体冷却系统通常由六个组件组成:冷却分配单元 (CDU)、冷板、机柜、风扇壁、冷却液分配歧管 (CDM) 和快速接头。快速接头连接冷板和冷却分配单元 (CDU) 之间的冷却液流,对于液冷 AI 机器至关重要。

一些快速接头容易发生泄漏,其质量至关重要。由于对 AI 服务器的需求量很大,每个机柜需要数百个这样的组件,因此市场对快换接头的需求也激增。因此,快速接头的价格急剧上升,从每件 40 美元上涨到 60 美元,买家愿意支付更高的价格来购买它们。这种价格上涨反映了需求的增加以及由于供应商短缺而在满足需求方面面临的主要挑战。

目前快速接头市场由七家公司控制,其中两家位于中国大陆。然而,由于与中美科技冲突相关的制裁,中国公司面临限制,限制了他们供应这些零部件的能力,加剧了短缺。Global Tek、Fositek 和 Lotes 等台湾公司正在利用这种情况,加快生产和认证流程。这些公司看到了一个巨大的机会,可以填补大陆供应商受限留下的空白,并满足不断增长的需求。

Global Tek正在积极与无锡和桃园工厂的合作伙伴合作,目前正在对样品进行测试。该公司预计,到2024年第四季度或明年初,这些努力将产生收入。

值得注意的是,美银(Bank of America)最新发布的一项调查报告称,英伟达Blackwell GPU初期出现延迟是正常且合理的现象,2025年初将会大量出货,但整个产业仍面临严重的供给短缺。这也使得英伟达H100/H200系列产品生命周期可望延长,将有利于广达、鸿海、台达电、纬创等台系AI服务器厂商。

美银表示,其在走访相关供应链后,得出二大结论:

首先,由于英伟达Blackwell平台上线需要大量的研发与测试工作,因此初期出现延迟正常且合理。台系硬件供应链确认今年第四季将小量出货,2025年将正式大量产出货。

其次,AI产业仍面临严重的供给短缺,需求依然强劲,短期供应问题仅影响出货,而不是需求。数周以来,美国超大规模云端业者已提高资本支出,例如微软就将明年预估资本支出从540亿美元调高到580亿美元,并且强调仍持续投资在AI。

美银认为,Blackwell如果延迟出货,英伟达可能会延长Hopper系列GPU(H100、H200)的产品生命周期,有利于相关台系供应链。例如,纬创在H100、H200服务器基板的市占率高达95%,在GB200计算板的市占率约为50%。

对硬件厂商来说,美银认为最大的问题可能在于散热。GB200是英伟达第一个采用液冷系统的芯片,因此供应链可能要花更多时间去改善设计并提升性能。虽然传出液冷系统所需的关键零部件——快换接头也遭遇了严重短缺,但是鉴于GB200服务器平均售价高昂(200-400万美元),供应链应该也有更多资金及资源去处理相关问题。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容