AMD推出全新第四代EPYC处理器:Zen 4c内核的Bergamo和拥有3D V-Cache的Genoa-X

6月14日消息,处理器大厂AMD在美国旧金山举行的 “数据中心与人工智能技术发布会”,对面向HPC领域的第四代EPYC处理器家族进行了更新,包括面向云原生计算的“Bergamo”系列新产品,以及面向需求大缓存的高性能计算工作负载的代号为Genoa-X的第四代 EPYC 3D V-Cache CPU等。此外还有一个代号为Siena的产品,面相电信基础设置和边缘计算市场,预计会在今年下半年推出。

图片

AMD现有的第四代 EPYC 产品代号为 Genoa,采用 5nm 工艺,支持 PCIe 5.0 及 CXL 扩充技术、支持 DDR5。

据介绍,新一代的AMD EPYC Genoa 在云工作负载中的性能是英特尔竞争处理器的 1.8 倍,在企业工作负载中的速度是英特尔竞争处理器的 1.9 倍。

苏姿丰表示,绝大多数人工智能都在 CPU 上运行,而AMD 的产品在这方面性能方面比竞争对手的Xeon 8490H 具有绝对领先优势,性能高出 1.9 倍,效率也同样是竞争对手的1.8 倍。

新推出的Bergamo处理器则是向云原生计算,采用全新的Zen 4c 内核,最高具有 128 个核心、256 个线程,拥有820 亿个晶体管,兼容 x86 ISA 指令,支持DDR5-4800,可相对满足深度云计算的应用需求。

图片

据介绍,全新的Zen 4c核心,可将每个内核所需的面积减半。AMD分享的数据显示,Zen 4的单个核心+L2缓存尺寸是3.84mm2,而Zen 4c+L2缓存只有2.48mm2,的核心面积降低了35.4%,明显紧凑很多,两者都拥有1MB的L2缓存,这意味着L2缓存单元占用着相同的面积,AMD通过让L2控制逻辑电路更紧凑来减少L2缓存的区域面积,而在不包含L2和相关电路的区域,核心面积缩小了44.1%之多,前端和执行区域面积几乎减半。但浮点单元缩小的程度没有那么大,这可能是出于散热的考虑,因为FPU通常来说是内核最热的部分,另外内核的SRAM单元布局也更加紧凑,核心面积减少了32.6%。这也使得Bergamo处理器得以容纳8个16核CCD,达到128核的峰值。

图片

图片

Zen 4c单个CCD内拥有两个CCX,每个CCX拥有8个内核和16MB L3缓存,每个内核的L1和L2缓存与Zen 4是一样的,也就是每个核心拥有32KB的L1数据和指令缓存,1MB的L2缓存。Zen 4和Zen 4c的IFOP设计是一样的,包括两个GMI3链路,然而好像并没有两个都有使用,两个CCX的信号需要通过单个链路多路复用与IOD通信,而且似乎与Zen 2架构一样CCD内部的两个CCX相互通信是要经过IOD的。

EPYC 97x4系列一共有三款,包括128核256线程的EPYC 9754,以及禁用了同步多线程只有128线程的EPYC 9754S,还有112核224线程的EPYC 9734。

图片

最顶级的EPYC 9754核心数量较EPYC Genoa最顶级的EPYC 9654多出32个,TDP同样维持在360W,最高可提升至400W,当然了频率会低一些,基础频率从2.4GHz降低到2.25GHz,最高频率从3.7GHz降低至3.1GHz,总L3缓存从384MB降低到256MB。

性能方面,AMD列举了EPYC 9754和对手最强的Sapphire Rapids第四代至强铂金8490H处理器的对比,由于后者只有60核,所以基本上是在单方面碾压。实际上它真正针对的是来自苹果、亚马逊和Google的更多核心数量的ARM服务器产品,以及Intel明年推出采用全E-Core架构的Sierra Forest至强处理器。

苏姿丰表示,云原生工作负载是一类快速增长的应用程序,在设计时考虑了云架构,并且可以快速开发、部署和更新。Bergamo作为一款着力于“云计算”的处理器,可提供 AMD 目前最大的 vCPU 运算密度,并可提供“最好的能源效率”、“相比于 AMD 此前的 EPYC 处理器,Bergamo 处理器可最高提升 2.7 倍能源效率,并提供三倍容器数量”。

接下来就是采用3D V-Cache技术的EPYC Genoa-X了,这个其实是意料之中的产品,因为去年AMD就推出了带3D V-Cache的Milan-X,而Genoa-X EPYC 9084X系列只是这条技术路线延伸下来的产品。

结构方面其实EPYC 9084X所用的CCD和桌面的锐龙7000X3D是完全一样的,就是在普通Zen 4 CCD上叠了一层64MB的SRAM,让单个CCD的L3缓存容量从32MB暴增到96MB,只不过在EPYC上是12颗CCD全都用上了3D V-Cache,所以最大L3缓存容量高达1.1GB。

EPYC 9084X的型号同样有三个:EPYC 9684X是96核192线程,频率2.55-3.7GHz,拥有1152MB L3缓存,TDP 400W;EPYC 9384X是32核64线程,频率3.1-3.9GHz;EPYC 9184X是16核32线程,频率3.5-4.2GHz,后面两款都拥有768MB L3缓存,TDP 320W。

AMD提供了两个性能对比,分别是两家顶级的EPYC 9684X与至强铂金8490H之间的性能对比,以及同是32核的EPYC 9384X和至强铂金8462Y 的对比,大缓存带来的性能优势相当明显。

目前EPYC 9704和EPYC 9084X系列处理器均已经上市,插槽与现有的EPYC 9004系列处理器相同的SP5,平台相互是兼容的,目前AMD已经向客户批量出货。

0

付费内容

查看我的付费内容