AMD第四代EPYC 97×4系列确定使用L3缓存容量减半的Zen 4c「小核」,近期也陆续传出AMD将在Ryzen 7040U处理器后期型号,采用混合Zen 4和Zen 4c的大小核组态,而AMD Zen 5世代将延续这种模式。那么,同样是大小核设计,英特尔、AMD和Arm玩法究竟有哪些不同之处?
1、英特尔大核(P-Core)和小核(E-Core)属不同体系,前者起于Core,后者源于Atom,后来因AVX-512指令集问世,追求节能的小核就无福消受会激增晶面面积和耗电量的怪兽。
▲可处理512位宽度数据的AVX-512指令集变成英特尔的烫手山竽。
所以即使英特尔小核从Alderlake搭载的Gracemont性能有重大突破,相同功耗时,单核单线程性能比Skylake高40%,相同性能时功耗降低超过40%,四核Gracemont对上双核Skylake时,领先幅度更拉到80%,但Gracemont(Alderlake、Raptor Lake)和后继Crestmont(Meteor Lake、Sierra Forest)还是只有AVX2,让大核不得不关闭AVX-512指令集,以维持大小核的软件兼容性。很讽刺的是,英特尔就这样平白把AVX-512优势送给AMD,商业蒙受重大损失后才匆忙想亡羊补牢。
▲英特尔Alderlake的E-Core有巨大性能突破,但还是无法弥补缺乏AVX-512的缺点。
英特尔补洞方法是另外定义AVX10指令集,让大小核可同时执行「256位化」的AVX-512变种,顺便统一混乱不堪的历代版本。但要等到新型小核问世,还需要好一段时间。为何英特尔不在小核仿照AMD的「数据路径砍半偷吃步」方法,这就真的让笔者摸不着头绪了。
▲英特尔并非一次升级AVX-512至AVX10,而是拆成过渡期AVX10.1和完全体AVX10.2,追求「大核P-Core与小核E-Core」共同胜利,不让自己创造的AVX-512反过来变成AMD的致命武器。
2、AMD方法就比较直截了当:让每个核心分到的L3缓存容量砍半,调低时脉,其余完全相同。AMD好处在不会有软件兼容性和性能调校问题(无论Zen 4还是Zen 4c都基于相同微构架,也都有AVX-512和BF16),且节省研发成本,缺点是能缩小幅度和可削减功耗很有限。以台积电5奈米制程Zen 4c为例,缩减面积也只有35%,4奈米还得再观察,或许AMD还握有不为人知的怪招。
▲AMD Zen 4和Zen 4c,除了每个核心分到的L3缓存容量外,其余完全相同。
3、主导手机市场的Arm就极单纯:终极性能的大核(Cortex-X)、高度能效的中核(Cortex-A700)和极致省电的小核(Cortex-A500),TCS23(Total Compute Solution 2023)全部统一为Arm v9.2构架。
▲Arm玩法一直没变,三种核心。
行文至此,就来看看苹果。苹果类似英特尔个别打造截然不同大小核,但应该没有指令集兼容性差异。对标榜「极简主义的华丽」的苹果,看起来也不会像Arm搞出三种核心。
▲AMD也尝试过大小核分立策略,但后者唯一商业成就只有家用游戏主机。
话说回来,假以时日,当AMD拥有足够研发能量,会不会也回到「推土机」和「山猫」分立策略,就让我们慢慢等着看。
来源:Technews