当地时间10月9日,处理器大厂AMD 在美国旧金山举行的 Advancing AI 活动期间正式发布了第 5 代 EPYC CPU(代号为 Turin),它用全新的Zen 5核心架构,再次带来了实质性的代际提升,并进一步提升了 AMD 在数据中心领域的竞争力。
根据AMD的数据显示,自推EPYC CPU推出以来,其在服务器领域的市场份额已经由2018年的2%提升到了34%的市场份额。AMD EPYC平台正在被一些世界上最大的科技公司使用,拥有超过950个云实例和超过350个OEM平台。
全新Zen5 / 5C内核,最高192核心,IPC提升37%
代号为“Turin”的第 5 代 EPYC CPU 系列,旨在实现三个目标,扩大AMD在服务器 CPU 的领先地位,推动高效的现代化,并提供端到端的 AI 领导平台。为了实现这些目标,AMD 正在使用其最新的 Zen 5 内核架构为该系列提供动力。此前我们曾详细介绍了Zen 5 架构。
对于其第 5 代 EPYC 系列,AMD带来了两种解决方案:
第一个是“Scale-Up”版本,采用4nm制程,具有多达 16 个“Zen 5”CCD,提供多达 128 个内核和 256 个线程;
第二个是“Scale-Out”版本,采用了3nm制程的“Zen 5C”内核和多达 12 个 CCD,提供多达 192 个内核和 384 个线程。
Turin 封装最多了达 17 个小芯片,整个芯片晶体管最高达1500 亿个。这些CPU将配备AVX-512支持,具有完整的512b数据路径和高达5GHz的时钟速度。芯片可以在 1P 或 2P 服务器中配置。
在 IPC 改进方面,AMD 表示,Zen 5 比上一代提供了“非凡的提升”,企业和云平台增加了 17%,HPC 和 AI 平台增加了 37%。
EPYC Zen 5C:多达 192 个内核,384 MB L3 缓存(与 Zen 4C 相比,内核数/L3 缓存增加 50%)
EPYC Zen 5 :多达 128 个内核,512 MB L3 缓存(与 Zen 33 相比多 33% 内核/L3 缓存)
该系列从 8 个内核扩展到 192 个内核,TDP 从 155W 扩展到高达 500W。至于平台本身,两种版本都依赖于相同的 SP5 插槽,这使得它可以轻松地从之前的热那亚和贝加莫“Zen 4”版本进行直接升级。
该平台仍然提供12通道内存解决方案,但现在DDR5速度配置为高达6400 MT/s,支持ECC,每个插槽的容量为6 TB,还有128个PCie 5.0/CXL 2.0通道。Turin 的新功能是支持 x4 和 x8 ECC RDIMM 的 PPR 或动态后包修复。在安全方面,可以获得可信 I/O、FIPS 140-3 正在处理和硬件信任根支持。
AMD EPYC 9005 SKU系列:最高5Hz
第 5 代 AMD EPYC“Turin”系列将包括总共 27 个 SKU,其中包括 192 核“Zen 5C”旗舰产品的 EPYC 9965、128 核“Zen 5”旗舰产品的 EPYC 9755,以及作为首款 5 GHz EPYC SKU 的 EPYC 9575F “Zen 5”芯片。
AMD EPYC 9965 将配备 192 个内核、384 个线程和 384 MB 的 L3 缓存。该芯片将具有 2.25 GHz 基本时钟和 3.7 GHz 升压时钟。CPU 的默认 TDP 配置为 500W,售价为 14,813 美元,明显低于英特尔顶级至强 6900P 产品的售价 17,800 美元。这比英特尔的 17 个内核旗舰产品的价格高出 128%。
基于标准 Zen 5 内核的 EPYC 9755 将配置 128 个内核、256 个线程、512 MB 的 L3 缓存、2.7 GHz 的基本时钟、4.1 GHz 的升压时钟和 500W 的 TDP。这款芯片的价格为 12,984 美元,再次远低于英特尔的 6980P 芯片,相差 -27%。
AMD 还有 64、48、32、24 和 16 核版本的几个频率优化版本。最强的是 EPYC 9575F,它提供 64 个内核、128 个线程、256 MB 的 L3 缓存、400W TDP、3.3 GHz 的基本时钟和 5.0 GHz 的升压时钟。该芯片的售价为 11,791 美元。最后,我们应该提到入门级 8 核 SKU,即 EPYC 9015,它配置了 125W TDP,基本时钟为 3.6 GHz,升压时钟为 4.1 GHz,L3 缓存为 64 MB。这款芯片售价 527 美元。
AMD EPYC 全面超越 Intel Xeon
现在让我们谈谈性能,在整个幻灯片中,AMD 将其第 5 代 EPYC CPU 与第 4 代 EPYC 和第 5 代 Intel Xeon 系列进行了比较。AMD首先在 SPEC CPU 2017 整数吞吐量测试中展示了一项世界纪录,领先英特尔 2.7 倍,领先第 4 代 EPYC 近 60%。
在 SPECrate 2017 INT 基础测试中使用 32 核部件测得的每核性能方面,第 5 代 EPYC CPU 比英特尔第 5 代 Emerald rapids 提高了 40%,比第 4 代 EPYC SKU 提高了 27%。AMD 甚至强调,在虚拟化领域,以相同的许可成本提供强大的性能。
在工作负载性能方面,AMD EPYC 9965 192 核 CPU 的视频转码(FFMPEG raw 到 vp9)提高了 2.3 倍,开源数据库 (MySQL OLTP) 提高了 3.9 倍,图像渲染 (vRay 5) 性能提高了 3 倍,与英特尔第 5 代至强 SKU 相比,图像渲染 (vRay 5) 性能提高了 3 倍。EPYC 9965 提供的内核确实是提供 3 个内核的 Intel Xeon 8592+ 芯片的 64 倍。
那么,使用相同核心数的性能如何,AMD 还展示了 64 核 EPYC 9575F 与 EPYC 9554 和 Xeon 8592+ 的比较。具有相同内核数的 Zen 5 部件在一系列企业 HPC 工作负载(如 Ansys LS-DYNA、Altair Radioss、Ansys Fluent 和 Altair AcuSolve)的性能上仍然领先高达 1.6 倍。
开源HPC性能在密集线性求解器和建模与模拟工作负载中也有了很大的提升,EPYC 9965x提供了比Intel Xeon CPU高出2.1到3.9倍的提升,与第四代EPYC “Genoa” CPU相比提高了2倍以上。
在 AI 性能方面,AMD 还吹捧了一些巨大的收益,主要来自 AVX-512 512b 功能,这些功能确实产生了令人印象深刻的 3.8 倍性能提升。更快的 SKU(如 5 GHz EPYC 9575F)可将 GPU 编排任务的速度提高 28%。
Turin扩大了AMD的TCO领导地位,新的NVIDIA HGX/MGX?& INTRINCT解决方案
AMD 的 EPYC 平台以提供卓越的性能和超值而闻名,Turin 平台也延续了这一理念。AMD 表示,借助Turin,数据中心公司可以从基于旧 CPU 平台的 1000 台服务器迁移到仅配备 EPYC 9965 CPU 的 131 台现代服务器。这种7对1的方法将允许数据中心公司轻松迁移到最新的芯片,同时保留相同的x86架构集,相同的成熟生态系统和相同的强大工具供他们使用。
AMD EPYC Turin 平台可将功耗需求降低多达 68%,服务器空间减少多达 87%,并在 3 年内将总拥有成本降低 67%。AMD 还提出,额外的保存间隔可用于将数据中心的 AI 和计算能力提高超过 110 万个TOPS,仅使用 416 个 GPU,并且来自这些新的 640 CPU 机架的计算性能提高了 2.5 倍。
AMD 还将其 EPYC 平台用作 AMD Instinct 和 NVIDIA MGX/HGX 平台的 AI 主机 CPU。该解决方案可以配备多达8个OAM MI300X或MI325X GPU以及使用EPYC 9575F 5 GHz芯片的配置,并且可以在AI推理中实现高达20%的性能提升,在训练中实现高达15%的提升。
对于 NVIDIA,MGX 解决方案最多可配备 16 个 AI 加速器 (Hopper/Blackwell),而 HGX 配置最多可配备 8 个加速器和最多 2 个 EPYC CPU。AMD和NVIDIA宣布了一项技术合作,推荐了一系列EPYC CPU,范围从32、48和64个核心来看,如下所示:
总体而言,AMD 的第 5 代 EPYC“Turin”系列看起来是另一个颠覆性的发布,尤其是考虑到它们提供的性能和价值。AMD 目前没有分享与 Intel Xeon 6900P 的性能数据,但随着这两款芯片的广泛使用,我们可以期待未来几个月的一些更新。
编辑:芯智讯-浪客剑 编译自:wccftech