可以说今年最为火爆的智能硬件产品当属智能音箱,而智能音箱之所以备受关注,主要还是因为智能语音助理功能的加入,使得智能音箱具备了一定的个人助理的能力。而且语音交互的方式,也更像是人与人之间的交互,更加的自然,能够给用户更好的交互体验。当然,这背后也离不开语音识别技术的助力,与此同时,为了提升对于用户家庭安全及隐私安全的保护,声纹识别技术也开始进入智能家居市场。
比如年初推出的京东叮咚智能音箱,天猫精灵X1都加入了声纹识别。此外,苹果iPhone 7之后的语音助手Siri也加入了声纹识别功能。而作为国内语音识别领域的领军企业,科大讯飞自然也非常的具有话语权。目前科大讯飞的语音识别技术已经获得了众多厂商的广泛采用,与此同时,科大讯飞的声纹识别技术也已成熟。在日前“2017生物识别技术与应用论坛”上,科大讯飞 消费者BG 智能硬件业务部产品总监张良春详细介绍了科大讯飞的声纹识别技术。
声纹识别是一项根据语意波形中反应说话人声理和行为特征的语音参数,自动识别说话人的一种技术。其主要特点是:具有唯一确认性,虽然每一个人从小到大,长大过程中声音是不断变化的,但一旦成人之后声纹特征是极其稳定的,也是唯一的,无论别人怎么模仿相似都是有细微差距;第二,非接触式的生物识别,可以通过语音传递进行声纹信息,从而不用接触到机器本身,就可以进行声音识别。这两个特点有使得声纹识别可以应用在很多领域,比如可以进行远程认证。
不过,声音跟虹膜、人脸都存在同样的受环境干扰的问题,比如人脸、虹膜会受到光学环境的干扰,而声纹则会受到环境噪声的干扰。当然在没有光的情况下是可以用声纹识别的,如果是不能开口的情况下,则只能用其他的识别技术。
声纹对比之后得到了两个结果,通过或者不通过,对比样本是非常固定的,精度比较高,计算量比较小,速度比较快。
- △科大讯飞消费者BG智能硬件业务部张良春
据张良春介绍,科大讯飞的声纹技术目前在公共安全、车载、电子商务、电信、司法领域、金融等领域得到了应用。 在今年的CES2017展会上发布新的叮咚音箱就集成了科大讯飞的声纹识别技术。
可以看到,早在2014年10月,科大讯飞的声纹识别技术就已经加入到了讯飞的开放平台。业内的厂商和广大的开发者都能够通过这个平台来获取到讯飞的语音技术的支持。据了解,目前语音听写识别率现在已经达到了97%,人脸识别已经到了99%,语音唤醒95%,自然度已经超过普通人,语音云的应用数超过30万,活跃终端数10亿以上。同时科大讯飞还有智能硬件业务部,包括语音能力,集成商、硬件商。
- △科大讯飞远场声纹识别方案
此外,科大讯飞还针对家庭推出了远场声纹唤醒声纹方案,这里面用了麦克风阵列、语音唤醒、声纹识别,主要是为智慧家电提供先进的声纹鉴别方案。其具有以下几个特性:第一,可以实现远距离识别,拾音距离超过3米,集成国际领先的回声消除技术,消除量可达50dB,同时支持声源定位,定位精度在±10°以内;第二,可定制化、可持续化的唤醒技术。具有低功耗、高唤醒率(总体超过93%)、可定制唤醒词、可与远场拾音方案共同优化等特点 ;第三,声纹鉴别技术可以带来个性化体验;第四,唤醒词与声纹固定文本保持一致,唤醒可知身份,贴近生活场景。同时,讯飞提供了模块化集成方案,比较容易集成。
据张良春介绍:“科大讯飞的声纹识别技术,可以在未声纹注册情况下,可识别性别和年龄段;合音效果是非常出色,EER小于2%;鉴别范围比较广,可以达到10个人复杂场景下依然可以有效识别;分布式声纹库,离线情况下也可以使用。”
“我们认为现在的声纹技术是没有做到99.99%精度这么高,但是在家庭环境下,一些非金融的场景,或者说即使错了,大家也可以接受的场景里面,让声纹技术先进入到大家的生活中。”张良春表示:“我们用唤醒+声纹+远场,这主要想放在音箱或者机器人里面,现在的音箱都是远场交互,你把它唤醒的时候,它在这个时刻知道你是谁,后面根据你这个人做业务上的个性化,人工智能会使产品显得有趣,好玩,我们的目标主要是这个。
作者:芯智讯-浪客剑