英特尔中国“特供版”AI芯片Gaudi 2 供不应求

图片

9月19日消息,据Digitimes 援引供应链人士的话报道称,英特尔面向中国市场推出的“特供版”AI 处理器Gaudi 2 订单快速增长,使得英特尔向台积电大举追加订单。

自今年以来,随着以ChatGPT为代表的生成式AI的持续火爆,带动了对于AI加速芯片的需求的暴涨,其中英伟达(NVIDIA)A100及H100系列更是成为了抢手货,特别是在台积电 CoWos 先进封装产能不足的情况下,英伟达的A100及H100持续短缺,即便是面向中国市场特供的A800 与 H800也是供不应求。

同样,目前AMD MI300 系列暂未大规模上市,主要也是受制于台积电的产能。供应链人士还透露,Meta、微软、谷歌、AWS 北美四大云服务商(CSP)相当期待的 AMD MI300 系列也因为台积电产能问题大受影响。

在此背景之下,能够在一定程度上替代英伟达AI加速卡的英特尔Gaudi 2自然也受到了市场的追捧。

供应链人士称,Gaudi 2 订单能见度已经到了 2024 年年中,而下一代采用台积电 5/4 nm制程的 Gaudi 3 也正在加速上市进程,预计 2024 年面世。

资料显示,Gaudi 2是英特尔在2022年5月发布的新一代的高性能深度学习AI训练处理器,采用7nm制程工艺制造,拥有24个可编程Tensor处理器核心(TPCs),96GB HBM2e 内存和 24 个 100GbE 端口。根据英特尔展示的性能对比数据来看,Habana Gaudi2在RestNet50 Training Throughput和BERT Tralning Throughput等视频及自然语言处理的模型测试中,性能都达到了NVIDIA A100的2倍左右。

AI性能达英伟达A100两倍,英特尔Habana Gaudi2发布

根据第三方机构MLPerf于今年6月发布的MLCommons MLPerf 基准测试数据显示,Gaudi 2在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势。比如,在计算机视觉(ResNet-50)和自然语言处理(BERT微调)方面的表现优于英伟达A100,在计算机视觉方面几乎与H100不分伯仲。

此外,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能。在最近的Hugging Face评估中,其在大规模推理方面的表现,包括在运行Stable Diffusion2(另一个用于从文本生成图像的最先进生成式AI模型之一)、70亿以及1760亿参数BLOOMz3模型时,在行业内保持领先。

2023年7月11日,英特尔在北京召开发布会,正式面向中国市场推出“定制版”的Gaudi 2芯片,可不受美国出口管制限制(应该是将I/O速度限制到了600GB/s以下)。目前,这款芯片已获得浪潮、新华三、超聚变等服务器巨头采用。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容