2017年5月29日,ARM在2017台北国际电脑展前夕宣布推出基于ARM DynamIQ技术的全新处理器,包括ARM Cortex-A75处理器、ARM Cortex-A55处理器和ARM Mali-G72 图形处理器,旨在进一步加速提升人工智能体验。
人工智能为我们的日常生活带来便捷和改变,同时每天都有人工智能创新的概念产生或得到验证。然而,复制人脑的学习和决策能力有赖于需要大量云端计算能力的算法。如果我们希望那些能够改变生活的人工智能无处不在并且更贴近用户,以实现实时推理和更安全的隐私,那么以云为中心的方法从长期看并非最理想的解决方案。事实上,我们即将公布的一项调查数据显示,85%的全球消费者对人工智能技术的安全性表示担忧,这也明确表明,需要更多地在设备端进行个人信息的处理和存储,从而建立人们对人工智能隐私的更强信心。
ARM副总裁暨计算产品事业部总经理Nandan Nayampally表示:“考虑到ARM技术已被全球70%的人口所使用,实现安全的、无处不在的人工智能已经成为ARM的基础指导性设计原则。同样,ARM也有责任为人工智能和其他类人计算(human-like compute)体验重新定义计算架构。为此,我们需要赋予从网络节点到云端的计算以更快速、更高效和更安全的分布式智能(Distributed Intelligence)。”
今年3月推出的ARM DynamIQ技术是从芯片到云部署智能的首个里程碑,而今天推出首批基于DynamIQ技术的ARM Cortex-A75 和Cortex-A55 处理器则是又一个重要里程碑。两款处理器都包括有:
• 针对人工智能性能任务并基于DynamIQ技术的专用指令,助力ARM在未来3-5年实现人工智能运算性能50倍的提升
• 采用DynamIQ big.LITTLE技术,在单一计算集群上实现更强大的多核功能和灵活性
• 作为数以亿计的设备的安全基础,ARM TrustZone技术在终端设备中为SoC提供安全防御
• 赋予高级驾驶辅助系统(ADAS)和无人驾驶更出色的功能安全性能
为了针对分布式智能和设备端机器学习而对系统级芯片(SoC)进行进一步的优化,全球出货量第一的ARM Mali GPU系列今天也发布了最新的高端产品Mali-G72图形处理器。该处理器基于Bifrost架构,专为新一代要求严苛的应用而设计,诸如在设备端运行的机器学习,以及高保真移动游戏和移动虚拟现实。
Cortex-A75:实现单线程性能突破
据介绍,10nm的Cortex-A75主频可以提升到3GHz主频,性能是16nm Cortex-A72的1.4倍左右,能效则是16nm Cortex-A72的1.8倍左右。
资料显示,在GeekBench 4中,Cortex-A75的性能是A73的1.34倍,也就是提升了34%(注意,该柱状图起点不是0,所以显得夸张,大家注意甄别)。
同时,在LMBench memcpy、Octane 2.0、SPECFP2006、SPECINT2006中的提升幅度分别为16%、48%、33%和22%。
ARM称在不牺牲能效优势的情况下,Cortex-A75能够大幅提升单线程性能。Cortex-A75能够实现高达50%的性能提升以及更为强大的多核功能,帮助合作伙伴在智能手机的功耗水平下满足笔记本电脑、网络和服务器等高性能应用的需求。
Cortex-A55:高效能处理方面全新的行业领导者
2013年,基于Cortex-A53的SoC面世,至今为止,ARM合作伙伴的累积出货量已突破15亿,并仍在高速增长。这也为后继产品设置了非常高的标杆。
不过,此次推出的Cortex-A55并非传统意义的后继产品,它还具备专用人工智能指令,与当今基于Cortex-A53的设备相比,能实现高达2.5 倍的每毫瓦性能效率提升。
ARM Cortex-A55基于DynamIQ big.LITTLE技术,可在单一计算集群上实现8核A55,如果再结合类似联发科的三丛集架构,那么这也意味这12核、16核手机处理器也不无可能。
ARM称,Cortex-A55将是全球应用范围最广泛的高效能处理器。
赋予更多日常设备以灵活的big.LITTLE性能表现
从端到云实现分布式智能时需要考虑不同级别的计算需求。通过首次在单一计算集群上实现大核和小核的配置,DynamIQ big.LITTLE能实现更强大的多核灵活性,支持更多性能层级和用户体验。
从系统级的核心需求出发, DynamIQ big.LITTLE的灵活性满足了分布式智能的需求。灵活的CPU集群、GPU计算技术、专用加速器以及全新的ARM Compute Library相结合,可有效提升、扩展人工智能的性能。免费、开源的ARM Compute Library汇集了一系列针对Cortex CPU 和 Mali GPU架构进行了优化的底层软件功能。这也再次体现了ARM通过对软件更多的投入来最大限度提升硬件性能并且不牺牲效率的承诺。单单在CPU方面,无论是在现有还是在全新的基于ARM的SoC上, ARM Compute Library可以提升人工智能和机器学习性能10-15倍。
Mali-G72:针对下一代真实内容进行优化
ARM系统级方案支持包括GPU在内的跨多个计算IP块的创新。Mali-G72图形处理器延续了前一代产品Mali-G71的成功,并对Bifrost架构进行了改良,从而实现高达40%的性能提升,使得我们的合作伙伴能够推动移动虚拟现实体验,并将高保真移动游戏提升至新境界。此外,Mali-G72还被设计用于具有最高效率和性能的机器学习,这得益于算法优化和增加的缓存,从而降低了带宽需求,为机器学习效率带来17%的提升。
Mali-G72实现了25%的功耗效率提升和20%的性能密度提升,并针对机器学习进行了优化,从而使得ARM能够在整个SoC上更高效地现实分布式智能。
分布式智能由此开始
全新发布的下一代CPU 和 GPU IP,旨在实现最先进的计算。下图所示是可用于端设备的、经过最佳优化的基于ARM的SoC示例,包括完整的计算、媒体、显示、安全和系统IP,它们被一起设计和验证,旨在提供最高性能和效能的移动计算体验。
除此之外,同时发布的还有支持这些IP的一系列全新的移动系统指导(System Guidance for Mobile,SGM-775),包括从SoC架构到详细的投产前分析文档、模型和软件等所有内容,ARM合作伙伴可免费获得。ARM POP IP也可用于Cortex-A75处理器,加速产品上市以及优化实施,从而确保最优的性能和效率。
领先的软件生态系统,从端到云
软件是未来高效、安全的分布式智能的核心。ARM生态系统在提供广泛的颠覆性软件创新方面拥有独一无二的优势,而这些创新是开启人工智能革命所必需的。为了支持我们最新的CPU和GPU IP,一套完整的软件开发环境也随着全新的CPU和GPU IP同时发布。通过ARM虚拟原型和DS-5 Development Studio,ARM生态系统能够在硬件可用之前就开发针对DynamIQ技术优化的软件。
ARM 协同合作伙伴,致力在未来5年内实现下一个1000亿颗基于ARM芯片出货量的目标。ARM生态系统正引领从物理计算向自然计算的转型,自然计算的体验将永不间断、更直观与智能。此次发布的产品将帮助我们迈向智能时代,并离全面计算(Total Computing)的愿景更进一步。
编辑:芯智讯-林子