9月6日,华为正式发布了最新的麒麟990系列处理器,其中麒麟990 5G作为首款集成5G基带芯片的5G SoC,更是拿下了六个全球第一。不过,大家也注意到,麒麟990及麒麟990 5G都并未采用最新的Arm Cortex-A77 CPU内核,而是沿用了原来麒麟980的Cortex-A76内核架构,只是对主频进行了提升。同样,麒麟990 5G也并未采用Arm最新的Mali G77 GPU内核,依然是沿用了麒麟980的Mali G76 GPU内核,只不过在核心数量上提升到了16核。
值得注意的是,日前三星发布的5G SoC芯片Exynos 980以及联发科此前曝光的5G SoC均采用了Arm最新的Cortex-A77 CPU内核和Mali G77 GPU内核。那么麒麟990 5G到底是为什么没有采用A77和G77内核呢?
余承东:A77功耗太高,麒麟990性能已超出用户的需求!
对此,华为消费者终端业务CEO余承东在发布会之后接受外媒采访时解释称,华为没有采用最新的Cortex-A77内核是基于对设备续航方面的考虑。根据余承东的说法,在7nm制程下,采用Cortex-A77功耗还是太高,会对电池寿命及设备续航产生负面影响,这也是没有采用Cortex-A77内核的原因。华为宁愿让消费者拥有一部电池续航给力一点的手机,而不是将注意力全放在提升运行速度而牺牲了电池续航时间。
余承东进一步指出,虽然,Arm此前曾表示Cortex-A77在同等能耗的情况下,比Cortex-A76性能可提高约20%,不过华为在实验及调查后发现情况并非像Arm说的那样。
余承东补充到,麒麟990芯片目前的性能已经“超出用户的需求”,并且就算是使用Cortex-A77架构,也只是会是让各项数据更亮眼一些而已。不过未来,当全面升级至5nm工艺生产时,新麒麟芯片很有可能就会采用Cortex-A77架构。
Cortex-A77的能耗真的过高吗?
根据之前Arm公布的资料显示,Cortex-A77虽然仍然是基于ARMv8.2 CPU内核,但是做了非常多的升级,例如采用了高达6发射的前端设计,引入了MOP缓存结构,加强了ALU和提供了更好的负载/存储设计,拥有64KB一级缓存,256KB和512KB独立的二级缓存,高达4MB的三级共享缓存。支持DynamIQ Shared Unit(DSU),同时支持 big.LITTLE架构,可以与 Cortex-A55 相搭配。
具体性能表现上,根据Arm官方的数据显示,在同样的7nm制程、3GHz主频下,在SPECint 2006测试(移动设备中最典型的基准测试)下Cortex-A77在性能上将会比Cortex-76提升20%。
另外Arm还公布了一些数据,显示在SPECint 2006上,Cortex-A77承诺IPC的增长会在23%左右,但在SPECfp 2006则增加了高达35%。整数工作负载的增加或多或少与CPU内核的改进一致。但是FP部分增加30%~35%则完全出乎意料,尤其是没有任何有关FP执行单元变化的资料和说明。其中一种解释是SPEC的FP测试套件比整数测试套件更加占用内存,而Cortex-A77能够在这种高负载情况下提供更好的性能。
▲Cortex-A77架构带来了显著的性能提升
在能耗比方面,ARM表示Cortex-A77处理器会和Cortex-A76完全一致。因此,这也意味着Cortex-A77的20%的性能提升,可能需要付出更多的功耗。另外需要指出的是,在相同制程下Cortex-A77的核心面积依旧比Cortex-A76大17%,而这会带来一些成本的提升,同时这也是导致其功耗增加的一个原因。
不过,目前多数的芯片厂商,并不会同时采用四个大的A77内核,而是会采用两个A77大核+两个A77中核+4个A55小核,或者是两个A77大核+6个A55小核,这样整体的功耗可以得到控制。
总的来说,相比Cortex-A76来说,Coretx-A77的性能提升还是比较明显的,当然功耗确实也增加了,但是通过内核搭配组合设计,整体的功耗是可以控制的。
不过,目前已确认,7nm工艺的联发科的5G SoC和三星8nm工艺的Exynos 980都采用了Cortex-A77和Mali-G77内核。显然,这两款芯片的制程工艺都不如麒麟990 5G,但是都用上了Cortex-A77和Mali G77内核,功耗问题应该并不是大问题。不然三星和联发科肯定脑子都坏了。
即便Cortex-A77有功耗上的问题,但是同样也可以通过降低主频来控制,而麒麟990 5G的CPU性能的提升,主要也是依靠Cortex-A76主频的提升。
显然,余承东的解释,并不能令人满意。
即便是Cortex-A77确实存在难以解决的功耗问题,但是这并不能解释,为何不采用性能更强、能效比更高的Mali G77 GPU内核。
Mali G77:全新架构、性能提升60%、能效比提升30%
相对于Mail-G76来说,Mali-G77采用了全新的Valhall构架,这是继上一代Bifronst架构的发布三年之后的又一次重大升级。
在性能上,与上一代的Mali-G76 GPU相比,Mali-G77具有近40%的性能提升。同时Mali-G77还在关键的微构架上进行强化,包括引擎、texture pipes和load store caches,并将功耗效率以及性能密度均提升了30%。也就是说,Mali G77在能耗上是要比Mali G76更低的,在同等功耗下,Mali G77的性能将会提升30%。
除此之外,Mali-G77同时带来60%的机器学习性能提升,显著提升推论与神经网络(NN)性能,为设备带来更先进的片上人工智能功能。
显然,相对于Mail G76来说,Mali G77性能更强,并且有着大幅的提升,而且功耗还更低。华为麒麟990 5G为会选择单纯的提升Mali G76的核心数量(肯定会带来功耗的提升),而不用最新的更高效的Mali G77 GPU内核呢?
没有用A77和G76是因为时间上赶不上?
对于麒麟990 5G并没有用上Cortex-A77和Mali G77的问题,有网友也表示,可能是开发周期太短,因为时间上来不及,赶不上麒麟990系列的节奏。
确实,同样采用Cortex-A77和Mali G77的三星Exynos 980和联发科的5G SoC可能最快也要年底量产,而华为的麒麟990系列则是9月19日就由Mate 30系列首发了,即便是发售时间拖到10月,那至少也要比三星和联发科5G SoC芯片商用快近一个季度的时间。
不过,从之前华为麒麟芯片的发布节奏来看,华为应该是有能力在9月首发基于Cortex-A77和Mali G77的芯片的。
2018年8月31日,华为发布了麒麟980,同样拿下6个第一,其中首发Cortex-A76和Mali G76就占了两个第一,而Cortex-A76和Mali G76是Arm在2018年6月才正式对外发布的,实际上,Arm在新的内核IP设计之时可能就已经开始与一些客户沟通,在正式对外发布之前数月,往往就已经与客户达成了合作。这也是为什么,Cortex-A76和Mali G76正式对外公布三个月不到,基于Cortex-A76和Mali G76的华为麒麟980就正式发布了。
今年Arm的 Cortex-A77与Mali-G77 内核的发布时间是5月27日,所以从时间点上来看,华为是完全有实力在9月拿下 Cortex-A77与Mali-G77首发的,想象一下,拿下8个全球第一的麒麟990 5G,是不是要更牛X一些?在营销宣传上显然也要更占优势。能多拿两个第一,但是却并不去拿,而让联发科抢了首发(今年5月底Arm联合联发科做的发布),什么原因?
余承东给出的原因也并不是时间上来不及(即使是也不会承认),而是Cortex-A77功耗太高。但是这个原因并不能令人满意,更不能解释为何不用性能更强、能耗更低的Mali G77?
那么,或许真实的原因可能是“禁令”之下,Arm与华为的合作确实受到了影响。
是否与Arm的合作受禁令影响有关?
北京时间今年5月16日,美国将华为列入了实体名单,受此影响,众多美系厂商纷纷终止了与华为的合作。5月22日晚间,Arm被爆出其员工已被指示停止与华为的“所有有效合同,支持权利以及任何未决的约定”。
我们都知道,Arm的总部是在英国,并且是属于日本软银的子公司,按理说根本不会受到美国对华为禁令的影响。 但是Arm的IP如果包含有“美国原产技术”,或者其中有超过25%的技术是来自于美国,那么就无法供给华为。
资料显示,Arm在美国德克萨斯州奥斯汀和加利福尼亚州圣何塞设有研发中心,这两处的研发中心开发了一些处理器IP,这也使得这些IP属于美国禁令管辖范围之内。
随后在今年6月,Arm母公司软银集团董事长孙正义首次回应了“Arm断供华为”事件。孙正义表示,Arm没有停止与华为的合作关系,但确实受美国禁令影响,超过25%的技术或材料源自美国,就不能供给华为,Arm需要调查哪些部分要遵守相关限制,以及限制规定细节。
也就是说,Arm与华为的合作并未完全中断,但是部分源自美国或者来源于美国的技术占比超过25%的IP都受到了影响。那么Cortex-A77和Mali G77是否都包含在其中呢?如果是,那么麒麟990系列用不了也就不奇怪了。
不过,正如前面所说,Arm在新的内核IP设计之时可能就已经开始与一些客户沟通,在正式对外发布之前数月,往往就已经与客户达成了合作。所以,华为其实很可能在今年5月被列入实体名单之前就已经拿下了Cortex-A77和Mali G77的授权,这也意味着,这两款IP的使用有可能将不受禁令的影响。
那么既然如此,为何华为麒麟990系列还是没有用上呢?芯智讯猜测,有可能新的IP的开发需要Arm的协助,而如果Arm无法给予技术支持,那么华为的开发进度肯定会受影响。由于5月中旬出来的禁令的影响,打乱了华为的计划,因此华为临时启动了Plan B,即在麒麟980基础上做升级,比如CPU核心主频提升,GPU核心数增加,集成5G基带等。而已拿下的Cortex-A77和Mali G77则为明年的新一代麒麟处理器的升级留下了空间。因为华为可能无法获得Arm下一代的新内核,如果届时禁令仍未解除的话。
在麒麟990系列发布会之后,余承东接受采访时也表示,“对于Arm的新架构,如果未来我们无法使用,我们也准备了我们自己的CPU,所以不用担心,我们的CPU也许表现更好,就像现在我们的NPU一样有着很棒的表现。CPU、NPU我们都有备胎版本。我们依然支持Arm架构,正如我们支持安卓生态系统一样,如果他们不让我们使用的话,那个时候我们会用自己的,甚至还会有更好的表现。”
▲AI Benchmark现已公布了主流AI芯片的测试跑分榜单。华为麒麟990 5G的AI Benchmark跑分为52403分,超过紫光展锐虎贲T710(Unisoc Tiger T710)的28097分以及高通骁龙855 Plus的24652分,登顶AI Benchmark跑分排行榜单。
当然,这并不是没有办法可以解决。首先,华为已经拿到了ARMv8指令集的授权,华为可以利用该指令集来打造自己的处理器,但是这需要时间,另外在GPU上可以与Imagination合作,不过鉴于华为一直用Arm的Mali GPU,所以双方即使合作,也仍需要时间磨合。
此外,还有一个更为直接的解决方案,那就是,Arm从5月开始就将其下一代(可能来不及了,因为研发可能早已经开始了),或者下下一代的CPU/GPU内核的研发完全放到英国或者其他非美国以外的研发区域,同时将其中的来自于美国研发中中心的技术占比控制在25%以下,那么如此一来,华为后续的麒麟处理器将仍然可以使用Arm最新的CPU/GPU IP。不过正如前面所说,Arm明年要发的下一代CPU/GPU内核,或许华为用不上了,但是依然还是有Cortex-A77和Mali G77可以用。需要指出的是,余承东也表态了,下一代的5nm麒麟处理器会上Cortex-A77内核。如此一来,2021年推出的麒麟处理器将有望自然过渡到不受禁令影响的新的Arm CUP和GPU 内核IP。
作者:芯智讯-浪客剑