定制型AI语音芯片会是大势所趋吗?

集微网消息(文/九畹芳),亚马逊Echo、阿里天猫精灵等AI智能音箱的爆发,倒逼上游语音芯片迎来了新格局。5至7月,国内有超过5家语音技术创业公司对外发布AI语音芯片。

5月16日,云知声发布首款面向物联网领域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,出门问问发布旗下首款AI语音芯片模组问芯Mobvoi A1;7月2日,Rokid发布旗下AI语音专用SoC芯片KAMINO18;而在同一时间,思必驰CEO高始兴确认公司正在打造AI语音ASIC芯片,预计今年下半年流片。语音芯片“三步曲” AI语音未来已来? 

语音芯片的发展经历了三个阶段,通用芯片、专用芯片和AI芯片。在智能语音设备早期阶段(2014-2015年),由于芯片研发周期漫长(18-24个月),研发投入高昂,在终端销量难以支撑芯片规模爆发的情况下,市场均采用通用芯片。

通用芯片,指AP芯片/平板芯片等 Codec芯片/DSP芯片等组合的方式,由Codec芯片进行数模信号的转换,DSP对数字信号进行处理,包括回声消除、噪声抑制、语音降噪/增强等,最后加入云端的计算支持。代表芯片是联发科MT8563和全志R16(平板芯片)。

专用芯片,是语音芯片发展的第二个阶段,其采用适合做语音处理的CPU,加上多通道麦克风阵列接口,在语音算法上支持回声消除、噪声抑制、声源定位、语音增强等技术,并兼具运算能力和低功耗的考量。代表芯片有联发科MT8516、科胜讯CX20924、晶晨半导体A113、瑞芯微RK3036和北京君正X1000。这类芯片未内置神经网络加速器,AI多借助云端实现。

有分析人士指出,专用芯片的特点是,语音识别、语义理解、语音合成、任务执行等都是在云端进行,但云端存在着语音交互“时延”的问题,对网络的需求限制了设备的使用空间,并带来了数据与隐私危机。

而作为第三代语音技术的AI语音芯片正好解决了这些问题:(1)集成了专用AI处理器模块(NPU),用以对本地的机器学习算法进行加速;(2)语音AI芯片不但集成CPU、NPU,还集成DSP信号处理、Wi-Fi/蓝牙等模块;(3)能够实现“端侧”智能,将常用功能由云端转换到本地,可离线操作并解决用户数据隐私问题。成都启英泰伦在2016年推出的CI1006,杭州国芯在2017年10月底推出的GX8010,是典型的AI语音芯片代表。

以上是语音芯片发展的“三步曲”,从目前终端市场对上述三类芯片的采用比例来看,专用语音芯片独占鳌头,有数据显示,在2017年3000万台智能音箱的销量中70%被MTK囊括。分析人士认为,专用芯片占据主导的原因有二,一是通用芯片已经过时,多是借用平板/OTT的AP芯片,只是简单的将多媒体数字编码器与DSP相结合,其在语音上发挥的功效并不大;二是初出茅庐的AI芯片才刚起步,生态尚在建立当中。

Rokid副总裁及基础平台负责人周军表示:“目前,通用芯片已难满足智能音箱的场景需求,我们早期的产品也采用的是通用芯片,其最大的挑战在于实时唤醒功能,需要两个核长时间同时工作,功耗高且不便携,有时需要四核甚至八核的运算速度。”

目前,联发科、科胜讯、晶晨、瑞芯微、君正、炬芯等厂商是专用语音芯片出货的主力,那么,随着国芯、Rodik、出门问问、云知声等更多AI语音公司出现,AI语音芯片会最终取代专用语音芯片,主导终端应用市场吗?

杭州国芯人工智能事业部总经理凌云对 集微网记者表示,目前难以下定论AI语音芯片是否会全面替代专用语音芯片,AI芯片的最终目的是要应用,是要让产品落地,各家有自己不同的路线和做法,找到合适自己的应用场景就行。

中天微智能语音平台负责人劳懋元也告诉记者:“当前处于AI芯片早期,很多企业都在构建自己的技术路线,基于之前的积累做AI解决方案,暂时难以判断谁会最终胜出。更为关键的是,目前还不是厮杀的时候,需要产业界合力共同打造这个市场。”

有不愿透露姓名的受访人士表示,随着智能语音终端量的爆发,云知声、出门问问、Rokid、思必驰等语音技术处理公司,通过跟国芯等芯片公司“定制”的方式,加入到AI语音芯片/模组开发的阵列中来,虽然时间上落后于MTK、AMLogic、君正、炬芯等,但是借助AI芯片本身的优势,注定将得到更多市场的拥戴。

据集微网记者了解,国芯研发的AI芯片提供数字信号处理器DSP、神经网络处理器NPU以及USB/IIS/IIC/UART等标准接口。出门问问、Rokid等厂商不需要做IP设计,只需要进行架构集成,这些集成大多是麦克风阵列信号处理、降噪、唤醒技术、声纹识别以及一些语音技能。云知声虽是自研设计的uDSP和DeepNet架构,但在功能上与以上两款芯片基本相当。总之,三类语音芯片仍各有市场,最终表现还有待观察。

场景定制芯片 千万级应用方能收回成本

目前,特殊场景对AI芯片的需求各有不同。“在AI场景应用中,只有深度芯片定制,才能更好的实现AI的功能”已成为业界的共识。然而,定制芯片的成本高昂,是摆在诸多厂商面前的一道坎。

有业界人士指出,AI芯片一方面要有足够的算力去运行各种语音算法,另一方面还要针对各种场景做大量接口的适配,同时让成本和功耗满足大规模量产的商业要求。这本身就是一个很大的挑战。

“如果是企业自行研发AI芯片,采用40nm工艺,那么成本可能会上涨而不是降低。芯片必须靠规模分摊研发成本,40nm工艺仅流片费就高达1000万元,分摊给100万PCS(某一产品单位数量),平均每片成本高达10元,这还不包括更加高额的研发费用。”有行业人士表示。

炬芯科技在接受集微网记者采访时也表达了同样的观点,芯片的毛利本身就很低,以一颗55nm的芯片为例,大概需要投入几百万美金,研发费用还要除外。他表示,只有那些能拿到融资的有实力的公司才有能力去做芯片定制。

对此,Rokid平台研发负责人朱斌并不认同:“智能设备采用通用芯片是杀鸡用牛刀,特殊需求需要特殊芯片来解决痛点,定制AI芯片恰恰是在降低成本,人工智能硬件对算力有需求,低端的通用芯片算力不够,高端的通用芯片又有许多冗余设计,造成高功耗。”

与朱斌的观点相同,云知声IoT事业部副总裁康恒同样认为,定制芯片是为了省成本而不是提高成本,“电视、空调等大家电产品的利润足以覆盖语音模组的高成本,但风扇、电灯等小家电成本限制较大,模组的优势便削弱了,客户想做更多的智能品类,下沉到低端产品,但市场上根本找不到合适的芯片,一款百元以内的产品,通用芯片并不划算。打造自己的AI芯片后,云知声可以把语音AI技术的芯片方案开放给客户,在成本及供应周期上有了更大的主动权。”

上述两个截然不同的观点,出自芯片公司跟算法公司完全不同的出发点。据记者了解,尽管定制AI芯片是天价投入,但为了实现智能终端更接近AI功能,仍有不少厂商开始做定制芯片。

2016年,Rokid联合杭州国芯开发的KAMINO18就是定制芯片的代表,思必驰的定制芯片下半年即将流片。无独有偶,据今年3月外媒Information的报道,亚马逊也正在设计定制用于支持智能音箱Echo的AI芯片,当时消息称亚马逊已经拥有449名有芯片专业知识和技能的员工。

定制芯片有一个原则,就是要有足够的量来支撑成本的回收。至于Rokid、思必驰、亚马逊在芯片定制化过程中投入了多少成本,这个成本需要依靠卖出多少终端才能收回,目前记者没有获取详细的信息。不过,杭州国芯凌云表示,一颗芯片要达到收支平衡,至少使用这颗芯片的终端要达到千万级的量,如果是定制的话,至少是百万级。

Rokid联合创始人王舜德也曾表示,定制芯片最重要的一个点就是量,芯片关键的利润点,量要达五百万颗以上。

“这也是国芯的AI芯片跟谷歌、英伟达AI芯片的区别,”凌云表示,谷歌、英伟达更多是在做云端的芯片,云端芯片对成本和功耗不敏感,且单颗芯片的规模就能做很大,但端侧不同,端侧必须要从应用场景出发,根据实际场景去做定制,一旦这个场景的销量难以支撑起芯片定制的成本,就会亏本。

那么,短期内有何行之有效的解决方法呢?凌云强调说:“从零开始定制一颗芯片并不理智,成本周期太长,建议芯片公司定义芯片开发时,尽可能去覆盖更多的应用场景,同时建议下游厂商经常跟上游芯片公司沟通,让芯片商尽可能在前端设计时就将客户需求考虑进去,如此就无须支付额外的成本。”

目前,据了解,基于Rokid、云知声AI芯片以及出门问问AI模组的产品已经开始铺向市场了,有企业已经获得百万级订单,这是一个好兆头。Rokid周军告诉集微网记者:“目前Rokid芯片与方案已经成熟了,得到了诸如互联网公司、儿童教育市场的采用,我们有信心定制更好的芯片来支撑客户更好的发展。”

作为国内做“核”的厂商,中天微智能语音平台负责人劳懋元坚定地表示:“百箱大战让AI语音交互成为炙手可热的焦点,但智能音箱只是冰山一角,万物互联才是最终的目标!一颗芯片不可能覆盖所有的市场,如AI音箱芯片就不可以做进车载。我们会坚持自己的路线,做专用AI语音芯片和定制化解决方案。”

总而言之,AI芯片定制成本是一个大的问题,但诸多受访者仍一致认为,场景定制AI芯片的价值会更大,是大势所趋。至于如何解决成本问题,还得看Rokid、云知声、思必驰为代表的AI芯片定制公司,能否在预定时间内达到收支平衡,从而给行业树立信心。(校对/乐川)

0

付费内容

查看我的付费内容