2016年初,随着AlphaGo大败围棋世界冠军李世石,人工智能概念大热,各类人工智能产品也迎来了爆发。众多的科技巨头也纷纷在人工智能领域投下了重注。根据国外调查机构Tractica的统计预测数字显示,到2024年人工智能的市场规模将达到406亿美元(约合人民币2700亿)。相比之下2015年人工智能市场规模仅为490亿元,而这也意味着整个人工智能市场将呈现出爆炸式增长。
面对这样一个巨大的市场需求,ARM也开始了行动。2017年3月21日下午,ARM在北京金隅喜来登酒店召开发布会,正式发布了全新的有针对人工智能及机器学习进行优化的DynamIQ技术,而这项技术也将作为未来下一代ARM Cortex-A系列处理器的基础。ARM称DynamIQ将是下一代计算革命的开始,将重新定义计算,可以覆盖覆盖从端到云的安全、通用平台。将被广泛应用于汽车、家庭以及数不胜数的各种互联设备,这些设备所产生的数据会在云端或者设备端被用于机器学习,以实现更先进的人工智能,从而带来更自然、更直观的用户体验。
ARM计算产品事业部总经理Nandan Nayampally表示:“ARM是当今行业的架构首选,我们已解决无所不在的计算需求为己任,推动人工智能、自动控制系统的发展,并加速虚拟世界与混合现实体验的整合。为此,我们推出全新的ARM DynamIQ技术,帮助我们的合作伙伴在不牺牲效率的同时实现较以往任何时候都更高的性能表现。”
DynamIQ技术详解
自2011年ARM big.LITTLE技术推出以来,它已经成为了目前运用非常广泛的多核架构技术。而全新推出的DynamIQ技术则是big.LITTLE技术的重要演进。
原有的big.LITTLE技术是将多个大核组成一个计算集群、多个小核组成另一个计算集群,然后进行协作运行。而全新的DynamIQ big.LITTLE将允许在单一计算集群上进行大小核配置,可以出现比如1+3、1+7、3+5等诸多类型(目前最多可以支持配置8核),将可配置性提升到了一个新的台阶。同时,DynamIQ big.LITTLE还可以对每一个处理器进行独立的频率控制以及开、关、休眠状态的控制,可以实现高效的、无缝的在不同任务间切换最合适的处理器。
此外,DynamIQ还对内存子系统进行了重新设计,可以对内存进行更细颗粒度的管理,实现更快的数据读取和全新的节能特性。
而DynamIQ的这些特性都将使得DynamIQ big.LITTLE在功耗上的表现也更为突出。
ARM称DynamIQ技术代表了多核处理设计行业的转折点,其灵活多样性将重新定义更多类别设备的多核体验。
这里需要强调的是,DynamIQ big.LITTLE不仅可以在单一计算集群上进行大小核配置,同时也可以通过结合Corelink等技术,实现多个计算集群的组合,而这也意味着,未来可能会出现一个(5+3)的大核计算集群+一个(2+6)小核计算集群或者更多的四五个计算集群的架构。
在发布会后的QA环节,ARM处理器事业部总经理兼副总裁Nandan Nayampally也表示,未来将会推出基于DynamIQ技术的大小核。而且2018年,就会有相应的终端出现。DynamIQ技术将会率先被用在智能手机领域,此外也将会进入汽车、嵌入式领域、企业级市场等。
Nandan称,在智能手机这样的移动终端上,可能使用一个8核的DynamIQ计算集群就足够了,但是在企业级市场,确实可能会可能会用到多个DynamIQ计算集群,所以将会用到16核甚至更多核的情况,而这也是为什么说DynamIQ也非常适合企业级市场的原因。
另外,目前现有的ARM内核将不支持DynamIQ技术,需要等到下一代的ARM V8.2版本才能支持。而对于芯片设计厂商来说,DynamIQ技术也并不会带来芯片设计上太大的变动。同时在IP授权模式上也将会与ARM以往的策略一样。
DynamIQ为什么适合人工智能?
ARM前面强调了DynamIQ技术将会被广泛的用于人工智能和机器学习领域,那么它在这些方面到底有何优势呢?
首先,全新的DynamIQ big.LITTLE架构就非常适合人工智能和机器学习的。以语音识别为例,当需要唤醒设备时,这个时候关键词激活设备,只需要启动一个小核就可完成,而随后的语音识别就会立刻需要性能更强的核心;如果是面部识别则可能设备一开始就需要更强的性能,而当识别完成后,工作则迁移至小核。不难看出,人工智能对于大小核之间的调配、无缝切换都要求很高,显然全新的DynamIQ big.LITTLE架构是非常适合的,将会为机器学习和人工智能应用带来更快的响应速度。
其次,DynamIQ还特别加入了针对人工智能的指令集和优化库,下一代ARM V8.2版本的指令集将支持神经网路卷积运算,可以极大的提升人工智能和机器学习的效率。
据ARM透露,针对人工智能和机器学习的全新处理器指令集在采用DynamIQ技术的Cortex-A系列处理器在优化应用后,可实现比基于现有的Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。
与此同时,DynamIQ还加入了针对目前现有的各种人工智能算法的接口支持。这也意味着原有的人工智能算法厂商也能够基于DynamIQ的芯片来进行产品设计。
此外,在人工智能与机器学习目前比较热门的应用领域——自动驾驶方面,DynamIQ技术也能够为ADAS解决方案带来更快的响应速度,并能增强安全性,确保合作伙伴能够设计ASIL-D合规系统,即使在故障情况下仍然能够安全运行。
以上这些特性都使得DynamIQ非常适用于人工智能与机器学习领域。不过需要注意的是,基于DynamIQ的SoC依然是通用型SoC,它并不会替专用型代人工智能和机器学习芯片,它的优势在于拥有更加广泛的和更加灵活的适用性,可以适用于更多类型的市场。同时它也可以与专用型芯片结合起来应用。
DynamIQ将推动人工智能在智能手机上的应用
从2016年底开始,智能手机市场掀起了人工智能热。不少手机厂商都在强调其智能手机具有人工智能,并以此为卖点进行宣传。比如去年年底华为推出的荣耀Magic就号称是“人工智能手机”。但实际上,目前所谓的人工智能手机并不是真正的人工智能,或者可以说只是人工智能的一部分,比如面部识别、语音识别等、语音助手等功能。
但是不可否认,人工智能将是未来智能手机发展的一个重要方向。此前,《福布斯》就有文章称“未来人工智能将与智能手机深度融合,成为人们生活中的好帮手。它们就能够进一步使智能手机从被动的工具变成主动的合作伙伴,帮助我们做决策,甚至替我们做决策。”
虽然谷歌、Facebook、苹果等公司在云端使用深度学习软件来完成诸如脸部识别和语音识别的任务,但是这需要始终保持联网状态,所以仍然还需要本地化的人工智能,此前高通也打造了软件开发工具包将深度学习技术从云端转到智能手机,但是性能却很有限。
而ARM DynamIQ的推出则将在一定程度上帮助手机芯片厂商解决这一问题。再结合目前智能手机厂商对于人工智能的热情,这势必也将推动人工智能在智能手机端的应用。
ARM计算产品事业部总经理Nandan在会上也表示,DynamIQ虽然可适用于各种领域,但是首先还是会应用于智能手机上。
据Nandan透露,目前已经有部分芯片厂商拿到了DynamIQ的授权,其中就包括有大陆芯片厂商。而从此前大陆厂商与ARM之间的配合度来看,此前麒麟960就是首款采用了ARM最新的A73 CPU内核和最新的Mali G71 GPU内核处理器。再加上此前,华为积极推出号称“人工智能手机”的荣耀Magic的态势来看,华为下一代的麒麟970有可能会采用ARM DynamIQ技术,从而打造真正的“人工智能手机”。
DynamIQ将引领下一个1000亿ARM架构芯片出货
从1991年开始直到2001年,花了11年左右的时间,ARM架构的芯片出货才达到了10亿颗;很快,2005年全年的出货量就达到了10亿颗;2010年单季度的芯片出货就达到了10亿;2011年每个月的出货就达到了10亿;2013-2017年,ARM与其合作伙伴用了4年时间就实现了翻番,达到了500亿颗的出货量!根据ARM预测,从2017-2021年,ARM架构的芯片出货量将再翻一番达到1000亿颗。
Nandan表示,过去20多年ARM之所以能够持续保持高速的增长是因为ARM选择了一条正确的道路(移动市场),而接下来ARM要想在2021年与合作伙伴一起完成1000亿颗基于ARM架构的芯片的出货目标,推动人工智能在各个领域的广泛应用将是一个重要途径。
作者:芯智讯-浪客剑