寒武纪发布两款重量级AI芯片,下一代华为麒麟会用吗?

寒武纪发布了两款重量级AI新品,下一代华为麒麟会用吗?

摘要:2018年5月3日,寒武纪在上海举办2018产品发布会,其创始人陈天石在会上披露了寒武纪最新一代终端IP产品——Cambricon 1M、最新一代云端AI芯片——MLU100及搭载MLU100的云端智能处理卡……

近年来,英特尔、英伟达、Facebook、微软、Google、IBM、苹果、华为等科技公司都在积极布局AI芯片,复杂的深度学习网络计算需求很高,除了云计算,需要有更多更强大的本地计算资源。咨询公司TracTIca的预测数据显示,到2025年,与人工智能相关的深度学习芯片组市场收入,将由去年的5亿美元飙升至122亿美元的规模,复合年均增长率超过40%。

寒武纪是如何成为“独角兽”的?

2017年8月份,寒武纪科技获得了价值1亿美元的A轮融资,该轮投资由国投创业领投,阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点(天使轮领投方)、涌铧投资(天使轮投资方)联合投资。在本轮融资过后,这家背靠中科院计算所的创业公司估值已接近10亿美元,成为了全球第一家智能芯片领域独角兽公司。去年10月,华为发布了搭载全球首款“人工智能处理器”麒麟970的手机Mate10系列(以及其后发布的华为P20、荣耀V10系列等),其芯片架构中就包含了寒武纪的Cambricon-1A神经网络处理器。1A也由此成为了全球首个成功商用的深度学习处理器IP产品。

寒武纪的两位创始人陈云霁与陈天石均毕业于中国科学技术大学少年班,随后又先后进入中科院计算所,可谓是“少年天才”。在读博期间,两兄弟的研究方向有所不同,陈云霁的研究方向是芯片,陈天石主要是做人工智能,不同的技术研发路线使得他们成为技术上的合作者,也为他们创立寒武纪公司打下了基础。

陈云霁与陈天石俩兄弟“双剑合璧”,在2014年—2016年横扫体系结构学术圈,在顶级学术会议上教老外说中文的Diannao系列:Diannao(电脑)是ASPLOS‘14最佳论文(亚洲第一次),DaDiannao(大电脑)是MICRO’14最佳论文(美国以外国家的第一次),PuDiannao(普电脑)、ShiDiannao(视电脑)、还有指令集Cambricon等后继工作都连中ASPLOS、ISCA。目前,国内还没有其他研究小组能在ASPLOS 、ISCA、 MICRO几大旗舰级学术会议中最佳论文、最佳论文候选、评分最高论文轮着拿。 可以说,陈氏兄弟是全球AI基础学术领域的先驱者,目前这些已经发布的顶尖学术论文已经成为AI芯片开发领域的必读作品。陈天石在发布会现场表示,论文只能影响学术界,为了将AI研究成果影响到实际用户,他们创立了寒武纪公司。

2018年5月3日,寒武纪在上海举办2018产品发布会,其创始人陈天石在会上披露了寒武纪最新一代终端IP产品-Cambricon 1M、最新一代云端AI芯片-MLU100及搭载MLU100的云端智能处理卡。包括联想、中科曙光、科大讯飞在内的“中科院系”的企业纷纷到场为寒武纪展台,同时也对寒武纪最新AI产品进行了点评。《电子工程专辑》记者也受邀对此次发布会进行了第一时间报道。

从端到云,寒武纪发布两款AI新品

20180503-cambricon-2

寒武纪创始人及CEO陈天石博士首先登台,介绍了本次发布会的海报,其主旨是向伟大的科幻电影《2001太空漫游》致敬,海报中将寒武纪芯片比作电影中的神秘黑色石板,共同开启全新的智能时代。

“寒武纪一直带有很强的学术基因,开放、合作、共赢,我们要和上下游伙伴一起把产品做好。去年寒武纪预告了今年要发布的一些产品,寒武纪从来不吹牛,我们也鼓励大家不要吹牛。”陈天石表示,寒武纪的1A处理器是世界上首款智能终端处理器IP产品。第一代1A已经在四款华为手机中使用,在第二款寒武纪的IP 1H的产品今年也会跟消费者见面。“这些场景里只需要一颗处理器核心,之所以做到第三代IP产品,就是秉承开放、合作、共赢的学术精神,让大家花最低的代价享受技术红利。” 20180503-cambricon-3

去年11月6日,寒武纪在北京举行了公司成立以来的首场发布会,陈天石在会上披露了 1M IP的发展计划。到本次发布会上,1M的参数终于曝光,作为第三代机器学习专用IP,其性能超越此前广泛使用的寒武纪1A十倍。1M 使用 TSMC 7nm 工艺生产,其 8 位运算效能比达 5Tops/watt(每瓦 5 万亿次运算)。

20180503-cambricon-4

寒武纪提供了三种尺寸的处理器内核(2Tops/4Tops/8Tops)以满足不同场景下不同量级智能处理的需求,用户还可以通过多核互联进一步提高处理效能。“这样的组合有不同的处理器核,允许做多核互联,使得芯片厂商有很高的自由度去订制自由处理的能力。”陈天石表示。

寒武纪1M延续了前两代 IP 产品(1H/1A)的完备性,可支持 CNN、RNN、SOM 等多种深度学习模型,此次又进一步支持了 SVM、k-NN、k-Means、决策树等经典机器学习算法的加速。这款芯片支持帮助终端设备进行本地训练,可为视觉、语音、自然语言处理等任务提供高效计算平台。如果要做比较复杂的智能驾驶,去获得比较高的处理器性能,如果做流行的边缘计算,多核的配置也是必须的,寒武纪具有非常卓越的通用性,得益于寒武纪1M的架构设计,支持非常经典的机器学习算法。

1M还有一个全新的特性,支持终端实现本地的学习任务。在终端做本地训练的好处:1.根据用户行为做个性化学习,比如语音识别的时候用户口音会对用户数据进行调整。另外节省云端数据中心的功耗和开销。与此同时,在本地做训练和数据,可以避免把数据上传到云端,带来隐私安全。“它是全球第一款支持本地机器学习训练的智能处理器产品,相信是继寒武纪1A后的划时代产品。有了寒武纪1M,天下没有难做的智能终端处理器芯片。”陈天石表示。据了解,目前1M可应用于智能手机、智能音箱、摄像头、自动驾驶等不同领域。

除了1M的发布,此次发布会的另一个重头戏是最新一代云端AI芯片-MLU100。陈天石表示,2015年寒武纪就完成了第一款测试芯片的研发,为由端入云做准备。在现场,陈天石也展示了寒武纪1M以及搭载1M的板卡产品。MLU100 采用寒武纪最新的 MLUv01 架构和 TSMC 16nm 工艺,可工作在平衡模式(主频 1Ghz)和高性能模式(1.3GHz)主频下,等效理论峰值速度则分别可以达到 128 万亿次定点运算/166.4 万亿次定点运算,而其功耗为 80w/110w。与寒武纪系列的终端处理器相同,MLU100 云端芯片具有很高的通用性,可支持各类深度学习和常用机器学习算法。可满足计算机视觉、语音、自然语言处理和数据挖掘等多种云处理任务。搭载这款芯片的板卡使用了 PCIe 接口。

20180503-cambricon-5

陈天石表示,寒武纪的软件平台已经在终端市场经理了千万量级的用户大规模商用检验,经历了视觉、语音和机器学习的应用。

合作伙伴到场站台,“中科院系”兄弟企业构建生态

在发布会上,寒武纪的合作伙伴们展示了基于寒武纪芯片的部分应用方案。其中联想推出了基于Cambricon MLU100的服务器ThinkSystem SR650。该产品为2U2路机架式规格,支持两个MLU100智能处理器计算卡。这款服务器打破了37项服务器基准测试的世界纪录。

20180503-cambricon-6

中科曙光也在发布会上推出了基于 Cambricon MLU100的服务器产品系列“PHANERON”。这款服务器可支持 2-10 块寒武纪MLU处理卡,面向多种智能应用任务。其中PHANERON-10集成了10块寒武纪人工智能处理单元,可以为人工智能训练应用提供 832T 半精度浮点运算能力,在推理时提供1.66P整数运算能力。中科曙光副总裁任京旸 表示,新一代服务器可以在典型场景下将能效提升30倍以上。

20180503-cambricon-7

中科曙光副总裁任京旸

任京旸表示,目前曙光在全国大量部署先进计算中心,作为做计算平台的从业人员,一直在苦苦追求强大的芯片,尤其是强大的中国芯,今天很高兴寒武纪推出了新一代云端产品。“确实是一款非常牛的产品,简单举个例子,就这一个4U的节点,相当于200个普通服务器形成的集群,对于做计算的人来讲这是梦寐以求的功能。惊艳的是功耗还很低,放到这一款机器上,这么一台功耗只有1.3千瓦,跟传统功耗能效比提高了30倍,这是惊人的跨越。” 任京旸表示,为什么中科曙光和寒武纪的合作这么紧密?一方面缘于共同的追求和梦想,另一方面也是两家公司基因非常的相近,下一步曙光和寒武纪的合作,将不仅是存在于整机领域,还会在垂直一体化的全面合作。

20180503-cambricon-8

科大讯飞副总裁、上海讯飞瑞元信息董事长程甦

科大讯飞也在发布会上披露了与寒武纪的深度合作研发项目。科大讯飞副总裁、上海讯飞瑞元信息董事长程甦表示,科大讯飞也是中科院体系的公司,与寒武纪的团队很熟,两家有很多合作。通过使用寒武纪的AI芯片,科大讯飞的AI应用得到了很大提升。深度学习的计算芯片的发展从CPU、GPU、FPGA到专用ASIC芯片,可编程的芯片寒武纪从终端和云端表现都非常出色,科大讯飞也是非常早和寒武纪开展合作,计算芯片在不同的阶段解决不同的问题,CPU解决原始的方案,第三代处理器主要解决能效比的问题,未来会产生突破特定领域适合AI应用的芯片。也是基于算力的需求,讯飞也在持续的跟进计算芯片的发展。 “寒武纪的AI芯片是其中的佼佼者,所以讯飞和寒武纪很早就开始合作,2014年讯飞就和寒武纪开始讨论语音算法的处理时限,2016年讯飞天使轮投了寒武纪,2017年在寒武纪正是芯片上开始测试。”程甦表示。

EDA大厂Cadence鼎立支持

20180503-cambricon-9

Cadence中国区总经理徐昀

做芯片需要很多工具和支持,终端芯片要支持DSP\CORDEC,让这些模块能共同合作,需要丰富的经验和强大实力。Cadence中国区总经理徐昀也分享一下Cadence在AI芯片上的布局。从设计封装上来看,寒武纪的芯片是规模非常大,设计非常复杂,工艺上也非常先进,寒武纪用了TSMC 7NM最先进工艺,能效比有很高的要求。

在验证和数字实现上提出了很高的挑战,验证上Cadence的方案是覆盖率、有效性非常强的方案。寒武纪也有采用Cadence的全部验证方案。另外,寒武纪今天推出的MUL100也有使用Cadence的IP。无论是音频、视频、安防都有云端到终端的解决方案,Cadence也在构建完成的生态系统,跟国内的算法、OEM公司来做全面的合作。

最后寒武纪表示,旗下的终端和云端产品均原生支持寒武纪 NeuWare 软件工具链,可以方便用户进行智能应用的开发、迁移和调优。陈天石表示,寒武纪科技创立的初衷就是要让全世界都能用上智能处理器。寒武纪本次提出了“端云协作”的理念,这次发布的 MLU100 芯片可以和此前寒武纪 1A/1H/1M 系列终端处理器进行适配,协同完成复杂的智能处理任务。至此,寒武纪已经形成了覆盖智能终端设备、自动驾驶以及云端服务器的 AI 智能芯片 IP 产品线。

小贴士:A股不为人知的“中科院系”

在今天寒武纪的新品发布会上,值得一提的是到场助阵的众多拥有中科院背景的企业,这些企业彼此互相扶持,共建生态。比如科大讯飞就是寒武纪的天使轮投资人之一,中科曙光也与寒武纪有战略合作。据了解,A股市场有着中科院“血统”的上市公司包括科大讯飞、中科曙光、福晶科技、奥普光电、中科三环、东方中科、中科信息、汉王科技、超图软件、天地科技、东宝生物等。

细看“中科院方阵”上市公司,基本上是各自细分领域的技术龙头,这也说明了中科院在技术布局和产业化方面的战略性、前瞻性。与此同时,与资本市场的深度结合,也成为中科院推动技术创新和产业发展的“催化剂”。

来源:国际电子商情     作者:李坚

0

付费内容

查看我的付费内容