中科院乔宇博士:深度学习加速人脸识别爆发,但仍有局限性

很多的生物识别技术其实早已有之,但为何近几年特别是像人脸识别和语音识别等技术为什么得以快速的爆发?在9月20日由芯智讯主办的“2019生物识别技术与应用高峰论坛”上,中科院深圳先进技术研究院数字所所长乔宇博士表示,这主要得益于深度学习技术的推动,加速了相关技术在识别准确率上大幅提升,甚至超过了人类。

▲中科院先进技术研究院数字所所长乔宇博士

比如在计算机视觉领域,得益于ImageNet的推出,在2010-2015年间,图像识别准确率得到了非常大的提升。

从上图我们可以看到,2015年之时,ResNet(152层)网络所能达到的ImageNet的分类任务错误率已经降至了3.5%,超过了人类的水平(人的错误率是5.1%)。

具体到人脸识别方面,主要有两个任务:一是1:1人脸比对,比如高铁站,身份证和人脸,进行1:1的比对,确认是不是同一个人;二是1:N比对,这是动态人脸识别,比如在监控得到一张人脸照片,跟公安敏感数据库里的人进行比对,判断这是不是在逃的嫌疑犯。显然后者任务更难。

乔宇博士举例称,“以某地区的关口为例,每天大概有6万人通关。2014年时的技术,平均每三个小时系统可能就会有一次误判;到了2015年,平均两天会出现一次误判;2016年时,已经降低至平均一个月才会出现一次误判。而按照现在的技术,系统每半年可能才会有一个误判。这意味着你持假证件成功通关的概率,基本比购买彩票中头奖的概率还低。”

而在1:N人脸识别方面,也是同样如此。乔宇博士表示,“5、6年前人脸识别的应用更多是用于公司的打卡,那时候几百人、几千人才会有比较高的识别率。现在技术可以支持做城市级的人脸识别,可以应对深圳数千万人口的人脸识别,这背后是技术巨大的进步”。

能够达到如此之高的识别率,除了网络结构,Loss函数的设计也很关键。

“2016年我们实验室做了一个方法——中心损失Center Loss,被ECCV2016年接收。单模型可以做到99%识别率以上的模型,并且开源,被广泛应用。”乔宇博士非常自豪的表示。

另外,针对目前比较热的3D人脸识别,乔宇博士表示,目前中科院深圳先进技术研究院也在做“基于单幅图像恢复三维人脸结构”。现在的算法可以对人脸上的皱纹、胡须等细节纹理有比较好恢复效果,支持复杂的表情和复杂的姿态。

目前,深度学习伴随大数据的应用,性能在不断提升。但是,深度学习在很多方面也有其局限性。

乔宇博士表示,比如“小数据 异构多态”,很多数据是不规则、不完全,可能是异构多态,可以看到深度学习面临很大的瓶颈;另一方面,深度学习往往靠数据和算力进行提升,推理的能力很差,无法很好的运用常识和知识。有时候,深度神经网络会犯愚蠢的错误。另外,现在很多深度模型很多是黑箱的,其可靠性、可解决性比较差。在医学应用中,不仅要告诉诊断的结果,而且病人、医生往往希望知道深度网络依据什么理由做判断。最后是深度学习的鲁棒性和泛化能力有很大的缺陷。如上图中的小狗,比如把图片上的一些像素改变,机器可能就会把它判断为别的物体。再比如,本来是一只猴子的图片,如果在他前面放一辆摩托车,机器可能会误认为这是一个人,为什么?因为他看了大量摩托车上都是人的照片。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容