德国当地时间9月2日下午1点,华为在柏林IFA2017大展上举办新品发布会,正式发布了传闻已久的新一代旗舰级芯片——麒麟970,同时这也是全球首款内置神经元网络单元(NPU)的人工智能处理器。
台积电10nm工艺加持,性能大幅提升
根据资料显示,麒麟970采用了台积电10nm工艺,面积约100平方毫米,其中集成了55亿个晶体管,作为对比,此前的骁龙835是31亿颗,苹果A10则是33亿颗,足见麒麟970的复杂度更高。
具体参数方面,正如之前外界所传闻的那样,麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构,大核主频为2.4GHz,小核主频为1.8GHz,虽然CPU内核沿用了之前麒麟960的架构,不过得益于10nm工艺的加持,麒麟970的能效相比麒麟960提升了20%。
GPU方面,麒麟970采用的是ARM最新推出的Mali-G72 MP12。
根据此前ARM的资料显示,基于Bifrost架构的Mali-G72实现了多种创新,相比上一代的Mali-G71,性能提升了40%、能效提升25%、每平方毫米的芯片面积效能提升20%,同时机器学习效率提升17%。
具体到麒麟970的GPU(Mali-G72 MP12)性能上,比麒麟960(Mali-G71 MP8)提升了20%,能效比提升50%。
在视频编解码方面,麒麟970开始首次支持HDR10,支持4K@60fps视频解码以及4K@30fps视频编码。
集成NPU人工智能芯片
在麒麟970发布之前,华为就曾多次为其造势,称之为“人工智能处理器”。确实此次发布的麒麟970也集成了NPU(Neural-Network Processing Unit)即神经网络处理器。
从技术角度看,深度学习实际上是一类多层大规模人工神经网络。它模仿生物神经网络而构建,由若干人工神经元结点互联而成。神经元之间通过突触两两连接,突触记录了神经元间联系的权值强弱。每个神经元可抽象为一个激励函数,该函数的输入由与其相连的神经元的输出以及连接神经元的突触共同决定。为了表达特定的知识,使用者通常需要(通过某些特定的算法)调整人工神经网络中突触的取值、网络的拓扑结构等。该过程称为“学习”。在学习之后,人工神经网络可通过习得的知识来解决特定的问题。
由于神经网络计算的类型和计算量与传统计算的区别,导致在进行神经网络计算的时候,传统CPU、DSP甚至GPU都有算力、性能、能效等方面的不足,所以激发了专为神经网络计算而设计NPU的需求。
虽然手机芯片目前的CPU、GPU、DSP都可以做运算,但是更具高通的数据显示,同样的一个算法在GPU上速度要比CPU快4倍,如果在DSP上则要比CPU快8倍。在能效方面,GPU运算要比CPU节省8倍,DSP则可节省25倍。但是,如果集成专用的NPU来做神经网络运算则能效会更高。
根据此前寒武纪团队公布的数据来看,其 “寒武纪一号”(代号DianNao,为单核处理器,主频为0.98GHz,峰值性能达每秒4520亿次神经网络基本运算,65nm工艺下功耗为0.485W,面积3.02平方毫米)平均性能已超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级;与主流GPU相比性能相当,但是面积和功耗仅为其百分之一。
据华为介绍,麒麟970集成的NPU专用硬件处理单元,设计了HiAI移动计算架构,其AI性能密度大幅优于CPU和GPU。相较于四个Cortex-A73核心,处理相同AI任务,新的异构计算架构拥有约50倍能效,以及25倍性能优势,面积只有CPU的1/2,运算能力达到了1.92T FP16 OPS,图像识别速度可达到约2000张/分钟。
根据华为公布的数据显示,识别同样的200张照片,CPU需要120秒,而其NPU只需6秒,速度达到了CPU的20倍。并且其NPU识别1000张照片仅消耗0.19%电量。
同时华为宣布将把麒麟作为人工智能移动计算平台开放给更多的开发者和合作伙伴,让开发者利用麒麟970的强大AI算力,开发出更具想象力和全新体验的应用。可以看到,麒麟人工智能移动计算平台除了支持caff、coffe2,还包含了对Google TensorFlow等神经网络和模型框架的支持。
基带突飞猛进:支持1.2Gbps
虽说很多手机CPU都是拿的ARM的内核来做,但是要把它们整合优化好并不是一件容易的事。而如果要自己来做手机通讯基带芯片的话,则更是难上加难。因为这块的技术壁垒、专利限制和资金投入需求更大。
早在2009年10月,华为推出了业界首款支持TD-LTE的多模终端芯片“Balong 700”。
2012年巴塞罗那MWC大会上,华为发布业界首款支持LTE Cat.4的多模LTE终端芯片Balong 710,下行速率达到150Mbps,并整合在麒麟910系列处理器中。
2014年华为又推出麒麟920,整合基带Balong 720,全球率先支持Cat.6 300Mbps。此后的麒麟950也依然沿用的是Balong 720。
2015年,华为展示了Balong 750,全球范围内第一个支持了LTE Cat.12、Cat.13 UL网络标准,理论下载速率高达600Mbps,而上传也达到了150Mbps,与高通的骁龙X12相当。去年发布的麒麟960搭载的正是这款基带,同时还告别祖传的55NM外挂基带,真正实现了则全网通(开始支持CDMA)。
而此次发布的麒麟970则更是令人意外,其基带可以支持LET Cat.18(4.5G,Pre 5G),支持5载波聚合,4×4 MIMO以及256QAM,能够将数据的传输效率最大化,超过了高通去年推出的千兆级基带芯片骁龙X16,达到了与高通最新发布的骁龙X20一样的1.2Gbps的下载速率。
此外麒麟970还支持双卡双4G双VoLTE,并内建TEE和inSE安全引擎,拥有更高的安全性。
自主双ISP
手机拍照性能是近两年华为手机的主打功能。而要想拍出好的照片,不仅要有好的镜头,还需要强大的ISP(图像信号处理)。
众所周知,CPU负责处理通用逻辑数据,GPU则负责处理图像方面的多媒体数据,ISP则是负责处理拍照模组反馈的信息,也是另一颗重要的处理器。当相机打开快门的瞬间,光线透过镜头、光圈之后,折射并传递到摄像头感光元件(CMOS)上,产生光电效应,这个时候CMOS传感器就会将这些数据传递到ISP进行处理,最终将电信号转化为肉眼可见的数码相片,显示在屏幕上。整个过程中,ISP起到关键作用,不仅仅需要准确还原CMOS上得到的数据,还要对部分有瑕疵和损坏的数据(例如噪点、亮度衰减、肤色苍白)进行算法优化。
麒麟970相比原来的麒麟960的单ISP,升级成了华为自主设计的双ISP。双核ISP架构相比单核ISP也有明显的优势。两个ISP核心可分工合作,一个用来负责实时预览,也就是我们看到屏幕的取景画面,另一个负责拍照。如果单ISP就需要同时负责预览和拍照,则反应速度会下降,功耗也会提升。
根据华为公布的数据显示,新的双IPS可以带来更快的响应速度,数据吞吐量提升25%,相应时间提升15%;快速对焦,支持四种混合对焦模式;支持运动检测,实时识别运动速度并对焦拍摄,同时支持人脸追焦技术;支持增强降噪及低光增强,可以使夜景拍摄效果更自然通透。
小结:
通过前面的关于麒麟970的四大主要提升的介绍,我们不难看出,麒麟970相比上一代的麒麟960确实有很大的提升。不论是CPU性能、GPU性能还是功耗方面都有了不小的提升。特别是基带方面的提升,确实称得上是突飞猛进,1.2Gbps的下行速率不仅追平了高通最新发布的骁龙X20以及7月底曝光的三星最新的基带,成为了全球第三款支持1.2Gbps下行速率的芯片,而且麒麟970还将抢先于高通、三星之前率先实现商用。这也意味着华为首次在基带技术上追上了高通。
华为宣布10月16日在德国慕尼黑将召开新品发布会,Mate 10、Mate 10 Pro将作为麒麟970的首发机型登场。
更为令人兴奋的是,麒麟970还集成了NPU,成为了全球首款人工智能处理器,当然虽说这其中会有些噱头,但是相信对于智能手机用户来说,还是会带来实际体验的大幅提升。
目前智能手机是全球数量最为庞大也是用户最多的智能终端产品,同时也是人们每天使用最为频繁的智能设备,在智能手机上部署人工智能已是大势所趋。强大的感知能力和人工智能将会使得智能手机成为人们的得力“助手”。
作者:芯智讯-浪客剑