英特尔20亿美元收购AI芯片公司Habana Labs

英特尔发布新CEO上任后首份财报,意外大幅下调全年预期-芯智讯

美国当地时间2019年12月16日,英特尔公司宣布以20亿美元收购Habana Labs。该公司总部位于以色列,是一家为数据中心提供可编程深度学习加速器的厂商。此次收购将增强英特尔的人工智能产品组合,并加快其在快速增长的人工智能芯片新兴市场的发展。英特尔预计,到2024年,这一市场规模将超过250亿美元。

英特尔数据平台事业部执行副总裁兼总经理孙纳颐(Navin Shenoy)认为:“此次收购推进了我们的人工智能战略,即:从智能边缘到数据中心,为客户提供适合各种性能需求的解决方案。具体来说,通过高性能训练处理器系列产品和基于标准的编程环境,Habana Labs大大增强了我们数据中心人工智能产品的实力,以应对不断变化的人工智能负载。”

英特尔的人工智能战略基于这样一个信念:要想充分利用人工智能的力量来改进业务成果,就需要广泛的软硬件技术组合以及完整的生态系统支持。现在,英特尔人工智能解决方案正在帮助客户把数据转化为业务价值,并为公司带来可观的收入。2019年,英特尔预计人工智能业务带动的收入将超过35亿美元,同比增长20%以上。英特尔和Habana将共同为数据中心加速带来一流的人工智能产品,满足客户不断变化的需求。

孙纳颐同时表示:“我们了解到,客户们在寻求易于编程的专用人工智能解决方案时,也需要在各种工作负载和神经网络拓扑上拥有卓越的可扩展性能,而Habana在这些方面的骄人纪录有目共睹,因此我们很高兴Habana这样的人工智能团队加入英特尔。我们整合后的知识产权和专业知识,将为数据中心的人工智能工作负载提供无与伦比的计算性能和效率。”

收购完成后,Habana将作为一个独立的业务部门,并将继续由当前管理团队来领导。 Habana将向英特尔数据平台事业部报告,该事业部也是英特尔广泛的数据中心人工智能技术的大本营。此次收购将使Habana能够充分利用英特尔人工智能能力,其中包括过去三年人工智能软件、算法和研究方面的深厚专业知识和积累的大量资源,将有助于Habana不断扩展并加速发展。

Habana董事长Avigdor Willenz同意担任该业务部门以及英特尔的高级顾问。Habana的总部将继续设于以色列不变,该地英特尔也有长期投资和布局。此次交易之前,英特尔投资是Habana的投资方。

Habana首席执行官David Dahan表示:“由于之前就有英特尔的投资,我们很幸运能够了解英特尔的业务并与之合作,如今,我们很高兴正式加入英特尔大家庭。英特尔创建了世界一流的人工智能团队和能力。我们很高兴与英特尔合作,加快并扩展我们的业务。携起手来,我们将更快地为客户带来更多人工智能创新。”

展望未来,英特尔计划充分利用不断增长的人工智能技术产品组合和人工智能人才,为客户的人工智能工作负载提供无与伦比的计算性能和效率。

Habana的人工智能训练和推理产品

Habana Labs成立于2016年,最初的业务是开发专为深度神经网络训练和生产环境中的推理部署而优化的处理器平台。2018年,Habana Labs发布了第一款产品,即AI推理处理器「Goya」;9个月后,Habana Labs又宣布推出AI训练处理器「Gaudi」,不断完善自己的产品版图。

据Habana Labs首席商务官Eitan Medina介绍,其团队成员主要是来自处理器、DSP、系统设计以及网络设计等领域全球知名企业的精英,能够支持Habana Labs从软件到硬件的研发需求。同时,他还直接“放话”—— 要做人工智能芯片产业的领导者。而其底气,就是Goya和Gaudi两款产品。

▲Habana Labs首席商务官Eitan Medina

据了解,Goya是一款基于PCle的双槽位处理器,可基于ResNet-50推理基准实现每秒15,000张图片的吞吐量,延迟时间仅为1.3毫秒, 功耗仅为100瓦。它主要用于传统服务器环境,提供推理和预测支持。

“这些数字与英伟达最新的GPU产品T4相比,性能上是其3倍,能耗上是其1/2,而延时也更低。可以说,我们几乎可以做到实时的图片处理。”Eitan Medina表示。

▲Goya与CPU、GPU在性能方面的对比

 

Gaudi则是一款完全可编程且可定制的处理器,搭载基于第二代Tensor处理核 (TPC) 并集成开发工具、库和编译器。基于ResNet-50,Gaudi可以提供每秒1650张的图片处理能力——这是在业界单一处理器中最高的计算能力。同时,Gaudi的创新架构可以实现训练系统性能的近线性扩展,即使是在较小Batch Size的情况下,也能保持高计算力。这意味着,基于Gaudi处理器的训练性能可以实现从单一设备扩展至由数百个处理器搭建的大型系统的线性扩展。

和英伟达的V100相比,基于ResNet-50基准测试,Gaudi所表现出来的计算性能、功耗比和延迟时间仍然相当出色,在速度上要比V100快3.8倍。比如,在性能方面,V100单卡大概每秒处理600多张图片,而Gaudi单卡则可以处理1600多张;在功耗方面,V100处理600多张图片的功耗达到了300瓦,而Gaudi处理1600多张图片的功耗只有150瓦左右。

Gaudi与V100在性能方面的对比

除了性能,Gaudi处理器片上集成了 RDMA over Converged Ethernet (RoCE v2) 功能,能够让人工智能系统使用标准以太网扩展至任何规模。借此,用户还可以利用标准以太网交换进行人工智能训练系统的纵向扩展和横向扩展。同时,以太网交换机已被数据中心应用于计算系统和存储系统的扩展中,在速度和端口数方面可提供几乎无限的可扩展性。在这一方面,与Habana的标准设计相比,基于GPU的系统则依赖于专有的系统接口,对系统设计人员来说,这从本质上已经大大限制了其可扩展性和选择性。

另外,Habana Labs还推出了一款名为HLS-1的8-Gaudi系统,配备了8个HL-205子卡、PCIe外部主机连接器和24个用于连接现有以太网交换机的100Gbps以太网端口,让用户能够通过在19英寸标准机柜中部署多个HLS-1系统实现性能扩展。

HLS-1

Eitan Medina介绍,Gaudi配备的是32GB HBM-2内存,目前提供两种规格:一种是HL-200 - PCIe卡,设有8个100Gb以太网端口;另一种是HL-205 - 基于OCP-OAM标准的子卡,设有10个100Gb以太网端口或20个50Gb以太网端口。

据悉,Habana Labs已在今年下半年面向特定客户提供Gaudi的样品。

编辑:芯智讯-林子  综合自网络

0

付费内容

查看我的付费内容