声扬科技首席科学家张伟彬:声纹识别技术将是下一个风口!

说起生物识别技术,大家最为熟悉的可能还是指纹识别和人脸识别,相比之下声纹识别技术的关注度并不高。

但是事实上,声纹识别技术早已有之,而近几年随着深度学习推动语音AI技术的爆发,语音识别技术在智能手机和智能音箱市场被广泛应用,也开始推动了声纹识别技术的应用。

9月20日,由芯智讯主办的“2019生物识别技术与应用高峰论坛”上,声扬科技首席科学家张伟彬博士分享了生物识别技术的进展,同时他认为,声纹识别技术将是生物识别领域的下一个风口。

▲声扬科技首席科学家张伟彬博士

在声扬科技首席科学家张伟彬博士看来,声纹识别技术的发展可以分为三个阶段:

第一阶段,基于模板匹配的方法,像人脸一样要先做注册,再做验证,注册时您说的内容要和验证时是一样的。注册时要说“中华人民共和国,验证时也要说中华人民共和国”。这就相当于验证时被限制了,只是比较这两个声音像不像。

第二阶段,开始于2000年基于概率模型的研究,我们知道声音有时间的长度,长度是可长可短,有的人说话快,有的人说话慢,首先我要把可变长度的向量变成物理程度,这是基于高斯模型概率统计的。识别率勉强达到95%的概率,95%在很多应用场景是达不到的,因为需要考虑噪声、干扰的影响。

第三阶段,则是2012年左右深度学习在很多方面带来爆发性的影响,其中在声纹领域,最近比较大的事件是2017年X-Vector系统的提出,对声纹识别带来很大的提升。

“特别是近两年,市场也对于声纹识别有了比较强烈的需求,这一方面得益于声纹识别技术的进一步成熟;另外一方面,在国家政策方面,去年10月左右央行发布了声纹识别技术在移动金融上的应用标准。这是在国家层面、政策层面承认声纹识别技术达到大规模商业应用的门槛,可以满足金融等场景对高安全语音技术需求的应用;第三个方面则是,近几年国内非接触式犯罪比较猖獗,而声纹识别技术可远程通过声音识别身份对此类犯罪案件的帮助极大。所以我们认为声纹识别将是一个新的风口。”张伟彬博士说到。

那么声扬科技的声纹识别技术又有着哪些优势呢?

张伟彬博士表示,声纹跟文本内容、语言无关,所以技术上要做到跟语言、文本内容无关是非常大的挑战。就像人脸一样,有了认证就有攻击,声纹识别除了模仿外,还有比较简单的录音播放,如何防止被攻击也是非常大的挑战。另外,早期声纹识别注册时,用户需要说几分钟的语音,用户体验非常差。声纹识别的应用被严重限制了,而声扬科技的技术克服了了这几个技术难题,也在多个场景下实现了大型项目的落地。

另外,跨信道也是声纹识别面临的一大问题,因为声音进入到电子系统是需要通过麦克风采集,但是不同的麦克风的差异性会非常大。所以需要克服不同麦克风信道带来的差异,这也是很大的挑战。此外,海量亿级数据库的检索也是一大挑战。不过,目前的声纹比对还是还是在非常低资源的情况下做比对。目前最大的声纹库可能也只是百万级别的。

虽然,声纹识别面临的挑战很多,但是声扬科技依靠自身在声纹识别、语音识别、语音信号处理等领域多年的技术积累,在人工智能语音领域拥有数十项自主发明专利,创新性地攻克了多个技术难题,其中核心的声纹识别技术在复杂噪声环境、千万级以上的声纹数据库中可快速、精准地识别出说话人身份,准确率业内领先。特别是在声纹注册环节,目前声扬科技的声纹识别注册,用户只需说出八个中文数字就可以完成,而且声纹验证准确率也非常的高。

“我们的优势在于,我们技术上不是只有声纹识别,我们还做语音信号处理,如语音降噪,使得输入声纹识别系统的声音更加干净。另外我们有自己的语音识别技术,通过多种技术的组合可以打造成完整的符合客户要求的解决方案。这是我们公司的竞争优势之一。”张伟彬博士总结到。

资料也显示,在2018年10月NIST(全球最权威声纹识别大赛),声扬科技是唯一一家跻身前十的独立企业队伍。足见声扬科技的声纹识别技术之强。

结合自身的技术优势,声扬科技也针对行业推出了“声网声纹大数据作战网络”、“FinVoice金融行业智能语音认证系统”、“V IoT 互联网及智能硬件解决方案”、“ConVoice智能语音会议系统”和“TeleVoice智能电话远程身份认证系统”等行业解决方案。

据张伟彬博士透露,全球第1个应用声纹识别技术的国家级社保项目(印尼)采用的就是声扬科技的技术,覆盖250万人群。另外在金融领域,声扬科技的声纹识别技术在银行POC测试当中排名第一,实际落地项目中测得准确率超高99.7%,已服务全球5000万人。而在国内的公安系统,声扬科技的声纹识别技术也有被应用,可满足公安部对此项技术的需求,目前声扬科技的产品已在全国十多个省市的公安部门落地应用。

作者:芯智讯-浪客剑

0

付费内容

查看我的付费内容