7月14日消息,据中国台湾媒体报道,英特尔旗下AI训练芯片Habana Gaudi2,以及未来要推出的Gaudi3芯片,还有Goya AI推理芯片等,都已交由芯片设计服务厂商世芯来为其做后端设计与流片服务。
Habana Gaudi 2是英特尔在2022年5月发布的新一代的高性能深度学习AI训练处理器,采用7nm制程工艺制造,拥有24个可编程Tensor处理器核心(TPCs),96GB HBM2e 内存和 24 个 100GbE 端口。根据英特尔展示的性能对比数据来看,Habana Gaudi2在RestNet50 Training Throughput和BERT Tralning Throughput等视频及自然语言处理的模型测试中,性能都达到了NVIDIA A100的2倍左右。
根据第三方机构MLPerf于今年6月发布的MLCommons MLPerf 基准测试数据显示,Gaudi 2在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势。比如,在计算机视觉(ResNet-50)和自然语言处理(BERT微调)方面的表现优于英伟达A100,在计算机视觉方面几乎与H100不分伯仲。
此外,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能。在最近的Hugging Face评估中,其在大规模推理方面的表现,包括在运行Stable Diffusion2(另一个用于从文本生成图像的最先进生成式AI模型之一)、70亿以及1760亿参数BLOOMz3模型时,在行业内保持领先。
2023年7月11日,英特尔在北京召开发布会,正式面向中国市场推出“定制版”的Gaudi 2芯片,可不受美国出口管制限制(应该是将I/O速度限制到了600GB/s以下)。目前,这款芯片已获得浪潮、新华三、超聚变等服务器巨头采用。
最新的消息显示,世芯已经获得了英特尔Gaudi 2及后续AI芯片的后端设计服务订单。而除了英特尔之外,世芯还拿下了云服务大厂亚马逊AWS的AI芯片后端设计服务订单。
资料显示,世芯电子虽然是一家在台湾上市的半导体企业,但是其却是一家地道的中国大陆公司,于2002年在上海注册成立,并在上海、北京、无锡、合肥、深圳、广州、济南设有SoC设计中心或销售中心。此外,世芯电子在日本、美国以及台湾也设有SoC设计中心或销售中心。全球拥有超过400名ASIC工程师,其中90%在中国。同时,世芯电子大约70%的营收也都是来自于中国。
近年来,随着高性能计算及AI芯片需求的持续增长,来自该领域的营收占比已经达到了世芯总营收的80%左右。这主要是由于AI与HPC相关芯片往往需要利用先进制程来生产,流片服务价格也较高,为世芯带来的营收贡献也跟着提升。最新的财报数据显示,今年上半年世芯的合并营收达新台币136.45亿元,年增幅度高达1.44倍。
编辑:芯智讯-浪客剑