同样是大小核设计，英特尔、AMD和Arm有什么不同？

2023年09月15日

AMD第四代EPYC 97×4系列确定使用L3缓存容量减半的Zen 4c「小核」，近期也陆续传出AMD将在Ryzen 7040U处理器后期型号，采用混合Zen 4和Zen 4c的大小核组态，而AMD Zen 5世代将延续这种模式。那么，同样是大小核设计，英特尔、AMD和Arm玩法究竟有哪些不同之处？

1、英特尔大核（P-Core）和小核（E-Core）属不同体系，前者起于Core，后者源于Atom，后来因AVX-512指令集问世，追求节能的小核就无福消受会激增晶面面积和耗电量的怪兽。

▲可处理512位宽度数据的AVX-512指令集变成英特尔的烫手山竽。

所以即使英特尔小核从Alderlake搭载的Gracemont性能有重大突破，相同功耗时，单核单线程性能比Skylake高40%，相同性能时功耗降低超过40%，四核Gracemont对上双核Skylake时，领先幅度更拉到80%，但Gracemont（Alderlake、Raptor Lake）和后继Crestmont（Meteor Lake、Sierra Forest）还是只有AVX2，让大核不得不关闭AVX-512指令集，以维持大小核的软件兼容性。很讽刺的是，英特尔就这样平白把AVX-512优势送给AMD，商业蒙受重大损失后才匆忙想亡羊补牢。

▲英特尔Alderlake的E-Core有巨大性能突破，但还是无法弥补缺乏AVX-512的缺点。

英特尔补洞方法是另外定义AVX10指令集，让大小核可同时执行「256位化」的AVX-512变种，顺便统一混乱不堪的历代版本。但要等到新型小核问世，还需要好一段时间。为何英特尔不在小核仿照AMD的「数据路径砍半偷吃步」方法，这就真的让笔者摸不着头绪了。

▲英特尔并非一次升级AVX-512至AVX10，而是拆成过渡期AVX10.1和完全体AVX10.2，追求「大核P-Core与小核E-Core」共同胜利，不让自己创造的AVX-512反过来变成AMD的致命武器。

2、AMD方法就比较直截了当：让每个核心分到的L3缓存容量砍半，调低时脉，其余完全相同。AMD好处在不会有软件兼容性和性能调校问题（无论Zen 4还是Zen 4c都基于相同微构架，也都有AVX-512和BF16），且节省研发成本，缺点是能缩小幅度和可削减功耗很有限。以台积电5奈米制程Zen 4c为例，缩减面积也只有35%，4奈米还得再观察，或许AMD还握有不为人知的怪招。