64核128线程!AMD发布首款7nm数据中心处理器挑战Intel!

美国旧金山当地时间11月6日上午9点(北京时间11月7日今夜凌晨1点),AMD举办了主题为“Next Horizon”的新品技术沟通会。AMD正式公布了新一代采用7nm工艺的CPU、GPU核心,同时还发布了两款Radeon Instinct计算卡,展示了全球首款基于7nm工艺Zen 2架构的数据中心处理器Epyc Rome。

台积电7nm工艺加持

AMD目前的处理器、显卡均采用14/12nm工艺,接下来将跨过10nm而直奔7nm,代工伙伴本来是从AMD独立出去的GlobalFoundries,但是后者不久前已经正式宣布放弃7nm及之后的更先进工艺,因此AMD的7nm CPU/GPU都全面转向台积电代工。

虽然这次宣布很突然,但是种种迹象表明,AMD早早就完成了代工伙伴的迁移,对新产品的研发、发布进程并无明显影响,所以才有了这次的发布会。

根据台积电提供的数据,7nm相比于目前的14/12nm可以将晶体管密度提高一倍,同等频率下功耗可以降低一半,而同等功耗下性能提升可以超过25%。

如果说12nm更多地是在“数字”上领先Intel 14nm,这一次7nm则是在技术上完全实现超越,也能稍微领先Intel仍在难产的10nm。

更先进的制造工艺一直是Intel最强有力的武器,但这次竟然被AMD完全超越,实在是令人唏嘘,即便是Intel一再强调自己的10nm相当于其他家的7nm也无济于事,毕竟人家的产品马上就要出来了。

7nm Zen 2架构

AMD的Zen架构自推出以来,取得了空前成功。而现在我们终于迎来了基于最新的7nm工艺加持的第二代Zen 2架构。

AMD Zen 2架构解析:7nm加持 吞吐翻番

AMD Zen 2架构解析:7nm加持 吞吐翻番

Zen 2这是世界上第一个7nm工艺的高性能x86 CPU,除了新工艺主要变化包括:CPU核心执行增强、更深入的安全增强、模块化设计灵活配置并降低制造难度。

AMD Zen 2架构解析:7nm加持 吞吐翻番

Zen 2实现了两倍于第一代的吞吐能力,这主要得益于执行流水下的改进、浮点单元和载入存储单元的翻番、核心密度的翻番、每操作功耗的减半。

在前端设计上,Zen 2重点改进和优化了分支预测、指令预取、指令缓存、操作缓存。

AMD Zen 2架构解析:7nm加持 吞吐翻番

而在浮点方面,Zen 2将浮点宽度翻了一番达到256-bit,载入存储带宽同样翻了一番,并提升了分发/回退带宽,所有模块都保持着很高的吞吐。

安全性方面,AMD重点强调了新架构可以在硬件层面免疫Spectre幽灵安全漏洞。

AMD Zen 2架构解析:7nm加持 吞吐翻番

Zen 2架构支持更多核心,但并不是单纯地增加核心数量,而是采用了特殊的组合结构:EPYC霄龙最多单路64核心128线程,分为八个Die,每个Die内八个物理核心,同时外部还有一个单独的I/O Die,集成内存控制器、Infinity Fabric高速总线、I/O输入输出,专门负责联络各个Die与物理核心。

这种新的模块化设计更加灵活,可以单独针对每个模块进行优化、调配,同时借助I/O Die大大优化了整体延迟与功耗。

不过注意,CPU Die部分用的是7nm工艺, I/O Die部分则还是14nm,因为后者大部分都是模拟电路,对新工艺并不敏感,即便上了7nm也不会带来集成度、性能、功耗的明显改善,成本却会明显增加,所以采用了这种混合工艺模块组合。

事实上,Intel也正在同一颗芯片内尝试不同工艺的组合,都是出于同样的目的。

AMD Zen 2架构解析:7nm加持 吞吐翻番

以上说的都是Zen 2架构的理论部分,最终落实到EPYC霄龙、Ryzen锐龙产品上,还会有不同的表现,但可以预料,新架构新工艺,必然会带来明显更高的频率、更低的功耗,而且无论桌面还是服务器,AMD这几年都会保持前后代兼容。

此前,AMD已经多次公开强调,7nm工艺Zen 2架构的Ryzen锐龙、EPYC霄龙处理器都会在2019年如期发布,后者已经向客户交付样片。

AMD Zen 2架构解析:7nm加持 吞吐翻番

AMD还首次确认,Zen 3预计在2020年走上7纳米 制程,Zen 4开发已接近尾声,相关产品推出时间上估计至少会在2021年。

 

7nm GPU

除了CPU处理器转向7nm工艺,AMD GPU图形计算也迎来了7nm时代,但首款产品不是Radeon RX游戏卡,而是Radeon Instinct计算卡!

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

AMD今天正式宣布了全新一代Radeon Instinct MI60、Radeon Instinct MI50,均基于7nm工艺的升级版Vega架构核心,是全球首个7nm GPU。

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

AMD表示,7nm Vega核心架构拥有灵活的高性能、世界最快的FP64/FP32 PCI-E浮点性能、机器学习训练和推理、领先的显存和扩展性、唯一的硬件虚拟化、端到端的ECC纠错保护。

7nm Vega核心集成了132亿个晶体管,比目前的14nm Vega 125亿个增加了6.4%,而核心面积为331平方毫米,比现在的484平方毫米缩小了足足31.6%,晶体管密度翻了一番。

同等功耗下,新核心性能提升超过25%,而同等频率下,新核心功耗降低50%。

显存搭配最多32GB HBM2,带宽达1TB/s,內建ECC纠错。

MI60、MI50的具体规格暂未公布,有点类似RX Vega 64/56的区别,不过可以确认MI60的热设计功耗为300W。

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

7nm Vega还是世界首个支持PCI-E 4.0技术的GPU,双向带宽64GB/s,同时借助带宽高达100GB/s的Infinity Fabric系统总线,支持四路GPU并行,而且扩展性极佳,双路性能提升99%,四路比单路提升298%,八路比单路提升664%,几乎完美。

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

性能方面,MI60 FP64双精度浮点最高7.4TFlops,FP32单精度最高14.7TFlops,INT整数最高118Tops,相比于同样10nm Vega核心的MI25专业性能提升最多达8.8倍,同时超越或者基本持平NVIDIA目前最强大的Tesla V100。

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

AMD同时宣布了开源计算平台ROCm 2.0,并继续承诺完全开源。

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

未来,AMD还将继续推出下一代的MI-NEXT,性能更强,连接性更好,软件兼容性更佳——或许是Navi架构?

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

全球首个7nm GPU!AMD宣布Radeon Instinct MI60/MI50计算卡

全球首款7nm数据中心处理器

CPU/GPU齐发!AMD 7nm工艺新品沟通会图文直播

▲AMD CEO苏姿丰展示全球首款7纳米数据中心CPU“Rome”原型

AMD还在会上公布了全球首款7nm服务器处理器 Rome的部分参数规格:

  • 包括多个7nm的用于运算的x86 chiplet,比Zen 1“Naples”EPYC性能大幅提升
  • 另外,还有一个14纳米的I/O芯片
  • DDR4,Infinity Fabric,PCIe和其他I/O都在I/O芯片上
  • 支持第四代PCIe
  • 能够连接GPU,并在I/O芯片上通过Infinity Fabric协议进行GPU间通信。因此,对于同一CPU,则不同需要再使用PCIe或NVLink的交换芯片
  • 每个Socket有64核,128线程

AMD CEO苏姿丰在会上表示:“它是业内最好的数据中心处理器,我们绝对有望在2019年推出Rome。这是我们公司的主要领域,也是我们以后会发展的领域。”

而此时,英特尔还困在与10nm的苦战里,产品预计推迟到2019年底发布。

如果AMD能够尽早推出7纳米CPU,这将成为该公司在历史上首次超越英特尔,在处理器工艺节点上占据领先地位。AMD的7纳米处理器预计将比英特尔14纳米的芯片更快、更密集、能耗也更低。

苏姿丰回顾了AMD EPYC数据中心处理器推向市场的历程,上市15个月后,AMD EPYC 的市场表现良好,在高性能计算(HPC)、云、超大规模和虚拟环境中都扮演着重要角色。AMD认为,到2021年他们在数据中心将有290亿美元的机会,随着行业转向人工智能和机器学习,GPU正在发挥越来越大的作用。

至于2017年面市的Radeon Instinct,AMD知道自己在软件方面不行,并表示其发展关键将是力推开源。

不仅如此,亚马逊AWS也宣布采用新的AMD EPYC云服务虚拟机,AWS EC2也将提供从R5、M5a和T3a虚拟机(R5虚拟机是大型内存,M5则是数据库和企业服务的主流应用,T3虚拟机则用于博客和其他低端应用)。据称,这些虚拟机都将比AWS的英特尔虚拟机性价比高出10%。

编辑:芯智讯-林子

0

付费内容

查看我的付费内容