Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

魔王、泽南、小舟报道

尴尬而不失礼貌的微笑,再也不能骗到AI了

看不出别人在假笑?计算机可以帮你。

当代生活中,「假笑」已成为很多人的日常操作。你能看出来对面的人是在对你假笑吗?不管你能不能,计算机能。

英国布拉德福德大学的一项研究使用计算机技术,通过对面部关键点的检测和跟踪来自动识别假笑。

研究人员表示,他们找到了自动识别是否假笑的方法。事实证明,当你试图「尴尬而不失礼貌的微笑」时,你的眼睛会背叛你

「在微笑时,我们主要使用两组肌肉:颧大肌(zygomaticus major),它会让嘴角向上弯起;而眼轮匝肌(orbicularis oculi)让眼角显出皱纹,」布拉德福德大学视觉计算教授 Hassan Ugail 说道,他曾著有书籍《Computational Techniques for Human Smile Analysis》。

Ugail 表示,「假笑时,通常只有嘴部肌肉在运动。人类往往不会关注『假笑者』的眼周运动。而计算机在处理这些任务时判断力显然要强得多。」

这看起来很有道理,不过此前并没有人在这一方向上作出成果。研究人员于是决定在识别面部肌肉上下功夫。

从某种意义来说,笑容分析类似于德州扑克牌桌上高手们对于他人面部微表情的分析——那些微小的面部抽动可以展现出玩家真正的手牌与情绪。

「微表情是更具自发性也更微小的面部动作,往往在不自觉的情况下发生。正因如此,这类动作可以揭示人类真正的内在情绪,」以色列理工学院计算机科学教授 Ron Kimmel 解释道。

Kimmel 表示:「自动识别面部表情并推断情绪状态这一能力具备广泛的应用前景,包括情绪和社交感知系统,优化游戏体验,检测疲倦驾驶,」以及检测疼痛和悲伤。

研究过程

那么,这项研究是如何实施的呢?

研究人员首先拍摄带有微笑表情的视频,然后识别面部关键点(眼周、脸颊和嘴巴)并进行研究比较,用这样的方法来分析笑容在时间尺度上是如何表达的。

关于面部关键点识别,研究人员使用一款名为 CHEHRA 的面部和眼睛关键点实时自动检测和跟踪软件完成该任务。

Chehra 的检测结果示例。(图源:https://sites.google.com/site/chehrahome/) 

识别面部关键点之后,研究人员用他们开发的一种自动算法来度量微笑时眼周、脸颊和嘴部的动态变化。该算法的输出能够让研究者精确地度量这几个面部关键点在时间尺度上的变化,并对比真实微笑和被迫假笑的差异。

该研究提出的计算框架。

对于基线微笑数据,研究人员设置了两个对照组,以方便将研究中收集到的微笑与假笑 / 真笑进行对比。

具体来说,在假笑数据方面,研究者使用公开数据集 Extended Cohn-Kanade Dataset (CK+),涉及 82 个假笑的对象,并且每个图像的元数据包含六种基本情绪中的一种:快乐、惊讶、愤怒、害怕、厌恶或伤心。

而对于真笑数据,研究者使用 MUG Facial Expression 数据集,涉及 52 个高加索人对象。

数据集中的样本图像序列。左:CK + 数据集;右:MUG 数据集。

Ugail 表示,获取研究对象的假笑是很容易的,但真笑只有在研究对象观看能够触发自然微笑的视频时才能获取到。

研究人员发现,真笑所需的眼部肌肉运动通常比假笑多 10%

「因此,关于哪部分人脸特征包含最多与真笑相关的信息,这项研究最终得出的结论是眼睛。」Ugail 表示。「我们的研究结果不仅确认了文献中已经存在的结论——发自真心的笑容会通过眼睛显现,还对笑容在面部的确切分布提供了更多见解。

应用前景与质疑

研究人员认为这项研究的发现很有前景。例如,经过更多研究后,可以基于此为社会学家和临床医学家开发一款科学工具,供他们研究个体和小组的情绪状态。

他们还指出,这项研究有望纳入生物识别身份认证软件,尤其是通过对比某个人的视频和他自己的真笑和假笑视频数据库,来判断他的身份。

不过他们也表示,在商业化之前仍需更多研究。Ugail 表示,需要通过 CHEHRA 执行使用更大规模真笑和假笑数据集的实验,后续的实验还需要收集不同种族人群的微笑。

然而,科罗拉多大学视觉与安全技术实验室负责人 Terrance E. Boult 对该研究持怀疑态度。Boult 表示,该研究论文的「实验设计存在一些基础问题:『真笑』与『假笑』来自不同的数据集,这意味着真笑和假笑之间的差异很可能来自于数据集的差异」。

参考链接:
https://cacm.acm.org/news/245349-you-cant-hide-your-smiling-eyes/fulltext
https://www.sciencedirect.com/science/article/abs/pii/S1474034619305403?via%3Dihub
入门目标检测表情识别AI
相关数据
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

推荐文章
暂无评论
暂无评论~