芯片是战略要地。目前GPU芯片在深度神经网络训练领域获得大范围的应用,但受制于功耗、应用优化性等方面的限制,仍有众多的巨头和初创公司在该领域积极探索,英特尔2016年发布Nervana AI处理器,可加速各类神经网络。谷歌2016年也发布了自己的ASIC芯片TPU,用于加速深度神经网络,微软、AMD、百度等也相继加入战局。
2016年4月,北京中科寒武纪科技有限公司(成立于2016年3月)研发了国际首个深度学习专用处理器芯片(NPU),当时中科寒武纪科技首席执行官陈天石就表示,他们研发的“寒武纪”处理器正在走产业化之路,一年半左右就会进入市场。时隔整整1年之后,中科寒武纪科技执行董事罗韬4月26日对外表示,目前寒武纪深度学习处理器,若以阶段性论,还处于相当于“ARM”的授权阶段,未来一年内,将推动芯片商用,并拟与台积电先进工艺展开合作。
“寒武纪”或将推动人工智能进入新纪元
寒武纪是地球生命大爆发的年代,从那时起,地球进入了生命的新纪元。 中国科学院计算技术研究所陈云霁、陈天石课题组之所以把他们研制的深度学习处理器命名为“寒武纪”,是希望这世界上第一款模拟人类神经元和突触进行深度学习的处理器,能开启人工智能的新纪元。
不同于Google采用的通用处理器,“寒武纪”是一款针对智能认知等应用开发的专用芯片,专门面向深度学习技术,优势集中在人脸识别、声音识别等人工智能方面,比如传统手机或个人电脑主板上嵌入“寒武纪”IP盒子或芯片后,将极大提高处理速度。
课题组的深度学习处理器指令集“DianNaoYu”直接面向大规模神经元和突触的处理,一条指令即可完成一组神经元的处理。模拟实验表明,“寒武纪”相对于传统执行x86指令集的芯片,有两个数量级(几百倍)的性能提升。
寒武纪之所以定位为一款专用的深度学习处理器,因为有必要有专门的深度学习处理处,来提升效能与克服降低功耗。通用芯片与专用芯片相比,就像是一把万能的瑞士军刀与菜刀之比,想要切菜得好,必须有专用的菜刀堪用。而深度学习是处理智能应用迄今最好的方法。
罗韬表示,AI已经在很多领域超越了人脑。但是传统的CPU/GPU处理深度学习效率低下,他举例,AlphaGo使用上千个CPU和数百个GPU,下一盘棋的电费就高达3000美元,相当耗能。
相比之下,如果将战胜李世石的AlphaGo用的芯片换成“寒武纪”架构,一个小盒子就能装下整个平台。而寒武纪的目标,据称,是要让1瓦以内功耗的摄像头、手机、甚至手表都能和AlphaGo一样“聪明”。
光靠NPU指令集就已赚钱
虽然北京寒武纪科技有限公司成立至今近一年左右的时间,并且寒武纪芯片也并未量产商用,但是目前其IP指令集,已大范围授权集成到手机、安防、可穿戴设备等终端芯片中。
据罗韬介绍,2016年寒武纪就已经凭借指令集授权拿到了1个亿元人民币的订单。他也分享目前寒武纪的近況。就在2016年国际计算机体系结构年会中,约有1/6的论文都引用寒武纪开展神经网络处理器研究。
目前寒武纪设立了三条产品线:首先是智能终端处理器IP授权,智能IP指令集可授权集成到手机、安防、可穿戴设备等终端芯片中,客户包括国内顶尖SoC厂商,目前已经开始投入市场。而2016年全年就已拿到1个亿元订单。这也使得寒武纪研发了国际首个深度学习专用处理器芯片,于2016年第一年成立,就实现盈利。
其次,在智能云服务器芯片领域:作为PCIE加速卡插在云服务器上,客户主要是国内的知名服务器厂商。
另外,家用智能服务机器人芯片:从智能玩具、智能助手入手,使服务机器人独立具备看听说的能力。客户是各类下游机器人厂商,产品的推出将比智能云服务器芯片更晚一些。
日前中科院还注将资1000万元,这1000万元专项资金(将会在18个月内注入)一方面用于人工智能芯片的基础性研究,探索下一代人工智能芯片的架构、算法以及在一些新型场景(如AR/VR)中的应用开发方法。另一方面将会用于把寒武纪芯片推广到各种智能终端和机器人中,争取在18个月内奠定市场中的地位。
下一阶段重点:流片量产商用
据指出,DianNao是寒武纪系列的第一个原型处理器结构,平均性能超过主流CPU核的100倍,但面积和功耗仅为1/10,效能提升可达三个数量级。
寒武纪处理器能直接面对大规模神经元和突触处理,一条指令完成一组神经元处理,相比传统执行x86指令集的芯片,有数量级的性能提升,未来在云服务器和智能终端上的图像识别、语音识别、人脸识别等方面有着较广应用前景。
而迈入下一个阶段,寒武纪从IP指令集授权,到推出商用芯片问世,预料是目前紧锣密鼓筹备的重点。
相关人士也指出,寒武纪目前锁定与台积电最先进的工艺合作,其中对其量产成熟的14纳米工艺很有兴趣。预期最快一年后流片。
行业人士还指出,国内现在高端芯片设计领域的实力已经提升,但是国内晶圆代工厂的工艺制程还没跟上节奏,包括展讯14纳米找英特尔代工、兆芯14纳米CPU也都选择与台积电合作。
相关人士表示,目前看国内芯片厂的技术节点仍落于国外两到三个世代,在28纳米工艺还未站稳脚跟的当下,在国内选择综合考量上,高端芯片会多倾向以选择台积电、GLOBALFOUNDRIES为主,而台积电则又较具两岸优势。
编辑:芯智讯-林子 稿源:digitimes