AI练就火眼金睛：看步态就能识别情绪，准确率高达80.07％

导语：最近，有研究人员研发了一种新的机器学习算法，能够根据人们“步态”来识别个体的感知情绪。

7月2日消息，近日，查珀尔希尔大学（University of Chapel Hill）和马里兰大学（University of Maryland）的研究人员们研发了一种机器学习方法，利用人们步行时的身体语言，解读他们的情绪。

该算法是目前第一个利用最先进的3D人体姿态估计技术，来识别步行视频中目标情绪的方法，它能够从人的步态中识别他们的感知情绪（perceived emotion）、效价（valence）和唤醒（arousal），准确率达80.07%。

效价主要表现为人们的消极或积极等情绪，而唤醒则表现为人们情绪的平静或充满活力等状态。

这一研究成果已于美国时间2019年6月14日发表在arXiv平台上，论文名为《利用情感和深层特征识别行走中的情绪（Identifying Emotions from Walking using Affective and Deep Features）》。

一、四种长效情绪识别

研究人员认为，情绪在人们的生活中扮演着重要的角色，既贯穿了人们的经历，同时也塑造了人们看待世界和与他人互动的方式。

由于感知情绪在人们的日常生活中有着重要作用，因此自动情绪识别技术在游戏和娱乐、安全和执法、购物、人机交互等领域，已经成为了学术界一个重要的研究内容。

在这项技术中，研究人员针对人们的四种情绪进行了研究，分别为快乐、悲伤、愤怒和中性。这四种情绪都能较长时间地影响人们，并能“丰富”人们的步行方式。

研究人员从多个步行视频语料库中提取人们的步态，并使用3D姿态估计技术来识别提取的步态和步态表现的情绪特征。

这些3D姿态会被传输到能够学习长期相关性的长短期记忆模型（LSTM）网络中，研究人员将利用这一网络从姿态序列中获取特征，并使用多个步态数据集来训练这个LSTM网络。

同时，研究人员还将经过计算的情感特征与深层特征连接起来，并与随机森林分类器（Random Forest Classifier）相结合，输出多个独立决策树的平均预测，将提取的步态例子分到上述四种情绪类别中。

二、多种步态识别特征

研究人员获取的步态特征包括了人们的肩膀姿势、连续步伐之间的距离，以及手和脖子之间的区域。

在身体语言方面，人们的步行方式常常会受到情绪的影响，例如，当人感到压抑或沮丧时，会比满足时更耸拉着肩膀。

而机器算法在识别步态的过程中，头部倾斜的角度被用来区分人们快乐和悲伤的情绪，而更紧凑的姿势和“身体扩张”则分别能识别人们的积极和消极情绪。

值得一提的是，在该机器学习方法的识别功能中，效价在心理学上指行为目标对个体是否能实际满足自身需求的价值评估，即个体对行为结果的重视程度，它影响着人们行为动机的强度。

另外，唤醒在心理学上，指机体生理性激活的不同状态或不同程度的一种生理和心理活动的准备状态，它主要由感觉兴奋性水平、腺和激素水平，以及肌肉的准备性所决定。

而科学家们发现，唤醒往往与人们增加的运动相对应。因此，研发人员在利用长短期记忆模型时，还考虑了人们步行速度、加速度，以及手、脚和头部关节“运动抖动”的大小。

三、算法准确率高达80.07%

在人工智能系统处理方面，研究人员提供了一个叫“情绪行走”（Emotion Walk，简称EWalk）的样本。

EWalk是一组包含1384个步态的新数据集，这些步态是从24名受试者在大学校园（包括室内和室外）散步的视频中提取的。

同时，大约700名来自亚马逊土耳其机器人公司的参与者，还给该数据集的步态情绪进行标记，以便研究人员根据这些标记来确定受试者步态情绪的效价和兴奋程度。

研究报告显示，在测试中，该研究团队情绪检测方法的准确率高达80.07%，比Crenn et al.算法提高了13.85%，比不考虑情绪特征的“vanilla” LSTMs提高了24.6%。

但这些数据并不代表该机器学习方法的检测是万无一失的，因为它的准确率在很大程度上取决于3D人体姿态估计和步态提取的精确度。

尽管该方法的准确率还存在一定的限制，但研究团队依然相信，他们的机器学习方法能为涉及其他活动，以及其他情绪识别算法的研究提供了可靠的技术基础。

同时，研究人员还表示，他们研究的方法也是第一个利用最先进的3D人体姿态估计技术，为步行视频中的情绪识别提供实时管道的方法。

在未来，研究人员也将继续收集更多的数据集，进一步解决目前该机器学习方法所受到的限制。

结语：将为情绪识别研究提供技术支持

查珀尔希尔大学和马里兰大学的研究人员研发的这种机器学习方法，在情绪识别的准确率上得到了进一步地提高。同时，这也是目前学术界中，率先尝试利用最先进的3D人体姿态估计技术，来识别步行视频中的目标情绪的方法。

虽然这一方法的准确率还受到3D人体姿态估计和步态提取精确度的限制，但研究人员也将不断解决它的受限难题，进一步提高情绪识别的准确率。

在未来，这一技术的发展将为人们情绪识别等研究提供可靠的技术支持，也将为人们的娱乐、安全和人机交互等方面带来更多便利。

智东西编 | 韦世玮

论文链接：https://arxiv.org/abs/1906.11884

文章来源：VentureBeat

付费内容