EmotiW2018视频情感识别大赛落幕,国内AI公司思图场景摘得桂冠

2018 年 6 月 30 日, 由国际计算机协会 ACM ICMI 2018 主办的第六届 EmotiW2018 视频情感识别大赛在美国科罗拉多州的 Boulder 落下帷幕。据机器之心了解,来自中国的思图场景团队 「AI 应用实验室」与团队「lin」(来源未知)摘得桂冠并列第一,其他参赛团队包括美国南卡罗来纳大学、中科院、清华大学等顶尖技术机构。

EmotiW2018


基于音视频短片的情感识别赛,正确率结果排名

EmotiW2018 视频情感识别世界大赛是世界范围内, 视频情感识别领域最高级别、最具权威性竞赛。此次比赛共吸引清华、北大、多伦多大学、中科院自动化研究所模式识别国家重点实验室、南卡罗来纳大学、EmoLab 、台湾清华大学等百余支世界顶尖研究机构与院校参与。参赛队伍需要通过设计人工智能模型和算法, 对视频中的人物表情动作和语音语调进行综合识别分析, 并从六种情绪维度(愤怒、厌恶、恐惧、快乐、悲伤和惊奇)对海量视频中的人物情感类型进行判定。思图场景的 AI 应用实验室组凭借基于场景应用实践的创新深度学习神经网络模型获得最高正确率,团队「lin」以同样的准确率并列第一,香港大学、北大团队分获第二、三名。

据了解,北京思图场景数据科技服务有限公司在今年 5 月正式成立 AI 应用实验室,开展基于商业应用场景的人工智能技术研究并与清华大学、北京航空航天大学建立学术合作, 逐步构建起基于人工智能视觉及场景深度学习能力的情感分析系统。此前,思图场景的视觉人工智能应用技术已稳定服务大型国有商业银行、车辆金融企业以及互联网金融企业,包括招行、建行、一汽财务、东风财务以及宜信等业内知名企业。

场景未来

随着人工智能技术开始从技术实现层面向应用实施层面转换, 情感识别能够通过画面和声音更好的判断人物情绪, 让机器能够在一定应用环境下「懂」用户的意图, 将促进视觉理解、人机交互技术在场景应用层面的发展,同时也将反向提升人工智能技术基础算法水平。情感识别领域已经吸引包括微软、谷歌、Facebook、Intel 等世界巨头及其他业内人士的高度关注, 并有公司开始基于应用场景进行研发。

在人工智能神经网络技术高速发展的情况下, 在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。现阶段人工智能技术将基于大量应用场景,实现在各个应用领域的进一步突破,而这其中的重点,即是人工智能场景应用技术。

产业竞赛ACM情感识别视频创业公司思图场景
1
相关数据
神经网络技术
Neural Network

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

人机交互技术
Human-computer interaction

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

机器人技术
Robotics

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。 近年来监督式深度学习方法(以反馈算法训练CNN、LSTM等)获得了空前的成功,而基于半监督或非监督式的方法(如DBM、DBN、stacked autoencoder)虽然在深度学习兴起阶段起到了重要的启蒙作用,但仍处在研究阶段并已获得不错的进展。在未来,非监督式学习将是深度学习的重要研究方向,因为人和动物的学习大多是非监督式的,我们通过观察来发现世界的构造,而不是被提前告知所有物体的名字。 至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

模式识别技术
Pattern Recognition

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

机器之心
机器之心

机器之心是国内领先的前沿科技媒体和产业服务平台,关注人工智能、机器人和神经认知科学,坚持为从业者提供高质量内容和多项产业服务。

推荐文章
快递新革命:硅谷机器人公司Nuro发布Level 4无人配送车快递新革命:硅谷机器人公司Nuro发布Level 4无人配送车
机器之心机器之心
用知识图谱+NLP,海知智能努力让机器人的开发像发微信一样简单 用知识图谱+NLP,海知智能努力让机器人的开发像发微信一样简单
微胖微胖
中国科学家屠呦呦等获得2015年诺贝尔生理学或医学奖中国科学家屠呦呦等获得2015年诺贝尔生理学或医学奖
机器之心机器之心
返回顶部