近日,澎思科技(Pensees)在基于视频的行人再识别数据集(PRID-2011,iLIDS-VID,MARS)中取得突破。
据了解,澎思科技算法在最大的视频数据集MARS上的首位命中率指标88.8%,在iLIDS-VID和PRID-2011等数据集上首位命中率分别为88.0%和95.5%。
具体来说,主要包括三个方面:
1、受遮挡、姿态变化、视角变化等因素的影响,视频序列中行人的特征是不连续的。用全局特征来度量每一帧图片的权重往往会损失掉许多重要的信息。采用分割重组策略将特定局部特征重组成多个视频序列进行学习,进而极大减少局部特征损失对最终特征的影响。
2、提出双向图注意力机制模块。将图卷积神经网络和SENet结合,在整个序列上进行通道域的模式选择学习。同时通过双向网络进行空间域的注意力区域学习。由于图卷积网络的特性,每一帧图片的注意力特征都是与其他帧相互学习结合的结果,从而提高特征的代表性。
3、利用帧间相似度进行序列融合。通过数学计算的方式就可以达到融合的目的。这样,数据的类内相似度得到了提高。在结合三元损失函数进行训练后,类间相似度得到了降低,进而提高重识别效果。
澎思科技角介绍,基于视频的行人再识别(ReID)技术更贴近智慧城市建设的诸多应用场景,能有效解决行人信息有限、特征不足及其他干扰因素等问题,相比单帧图片的行人再识别具备更长远的落地应用空间。(定西)
来源:网易智能
0