继4月20日,阿里巴巴(以下简称“阿里”)宣布全资收购国内自主嵌入式CPU IP Core公司中天微,加强IoT领域布局之后,5月3日,阿里宣布全资收购语音识别技术领域的创业公司——北京先声互联科技有限公司(以下简称“先声互联”),具体交易细节并未公布。
阿里收购先声互联之后,先声互联创始人、中科院声学所前研究员付强将入职阿里达摩院机器智能技术实验室,负责语音交互前端处理技术和方案的研发。而先声互联创始团队的多名专家,也和付强一同入职阿里达摩院。
资料显示,先声互联成立于2016年12月。创始团队主要来自于中国科学院声学所和国际知名声学企业等,是国内最早从事语音增强及远讲语音交互接口技术研究的团队,是一支学术积累深厚,实践经验丰富的团队。其核心成员具有二十多声学、语音和音频相关研究和开发经历,创造过多项行业第一,主持制订过语音相关国家标准。
先声互联的定位是面向消费应用市场,如家居、车载等领域,行业应用市场,如安防、会议、医疗和教育等领域,为有人机交互和人人通信功能需求的客户,提供包括:声学结构设计测试、硬件模组设计加工、终端语音模块研发、端云一体语音交互、场景定制NLP开发、产品准入认证与评测等在内的端云一体、软硬结合的一站式(Turnkey)解决方案。
特别在远场语音交互解决方案方面,先声互联研发了自己独有的多通道语音前端信号处理引擎,综合利用了多麦克风空间滤波、语音分离、解混响和声源定位等多项基于物理建模的信号处理技术,并融合了基于机器学习的数据建模机制,可以适用于远场免提模式的语音识别和通信应用,帮其抑制背景噪声、非平稳干扰、设备回声、房间混响等不利声学因素,提升声学效果及相关用户体验。
据了解,先声互联曾为阿里、百度、小米等多家公司提供远场语音交互软硬件的解决方案。
此外,付强与团队也正在筹建两个声学实验室。其中一个是标准的全消音实验室,另一个则用于复杂声学环境下的语音交互系统在线端到端测试的实验室。它的主要作用在于在局部区域内建立真实的声场场景(家庭、车载等),在此环境中建立自动化的一整套测试流程,从而提升对语音交互IoT终端设备的赋能效率和产品质量。这将会令语音交互技术落地到更多实实在在的应用场景。
在过去的几年,随着亚马逊Echo的推出,智能音箱市场持续火爆,而这其中的关键推力就是语音交互技术的快速发展。语音业已经被认为是继触控之后的下一代人机交互关键技术(交互更简单,更自然)。
显然,在收购先声互联之后将极大提升阿里在语音交互领域的技术实力,同时这也将进一步完善阿里的IoT生态,为阿里的IoT生态赋能,加速语音交互技术在IoT领域的落地。
此前马云在接受媒体采访时就曾表示,阿里收购中天微,研发芯片并非为了竞争,而是要让芯片更具普惠性。“阿里投入数十亿美金研发芯片并不是控制技术,我们想让每个年轻人,每家小公司都能以性价比更高的方式分享这项技术。我们不是为了竞争,而是为了应用,阿里巴巴达摩院会致力于降低技术门槛,让更多人和小企业分享低成本的技术。”
显然,按照马云给出的这个理由,此次阿里收购先声互联,也正是为了“应用”,为了“降低技术门槛,让更多人和小企业分以性价比更高的方式分享这项技术”。
由于芯片是支撑许多技术运行的核心器件,而阿里只有掌握了芯片技术,各行各业才能够以低成本分享技术。所以阿里此次收购先声互联,似乎也预示着阿里未来或将推出语音专用芯片。
而付强在接受采访时也表示,随着阿里在芯片上的战略布局,比如收购了中天微,他们也会在语音专用芯片上有更多进展。
作者:芯智讯-林子