Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

EmotiW2018视频情感识别大赛落幕,国内AI公司思图场景摘得桂冠

2018 年 6 月 30 日, 由国际计算机协会 ACM ICMI 2018 主办的第六届 EmotiW2018 视频情感识别大赛在美国科罗拉多州的 Boulder 落下帷幕。据机器之心了解,来自中国的思图场景团队 「AI 应用实验室」与团队「lin」(来源未知)摘得桂冠并列第一,其他参赛团队包括美国南卡罗来纳大学、中科院、清华大学等顶尖技术机构。

EmotiW2018


基于音视频短片的情感识别赛,正确率结果排名

EmotiW2018 视频情感识别世界大赛是世界范围内, 视频情感识别领域最高级别、最具权威性竞赛。此次比赛共吸引清华、北大、多伦多大学、中科院自动化研究所模式识别国家重点实验室、南卡罗来纳大学、EmoLab 、台湾清华大学等百余支世界顶尖研究机构与院校参与。参赛队伍需要通过设计人工智能模型和算法, 对视频中的人物表情动作和语音语调进行综合识别分析, 并从六种情绪维度(愤怒、厌恶、恐惧、快乐、悲伤和惊奇)对海量视频中的人物情感类型进行判定。思图场景的 AI 应用实验室组凭借基于场景应用实践的创新深度学习神经网络模型获得最高正确率,团队「lin」以同样的准确率并列第一,香港大学、北大团队分获第二、三名。

据了解,北京思图场景数据科技服务有限公司在今年 5 月正式成立 AI 应用实验室,开展基于商业应用场景的人工智能技术研究并与清华大学、北京航空航天大学建立学术合作, 逐步构建起基于人工智能视觉及场景深度学习能力的情感分析系统。此前,思图场景的视觉人工智能应用技术已稳定服务大型国有商业银行、车辆金融企业以及互联网金融企业,包括招行、建行、一汽财务、东风财务以及宜信等业内知名企业。

场景未来

随着人工智能技术开始从技术实现层面向应用实施层面转换, 情感识别能够通过画面和声音更好的判断人物情绪, 让机器能够在一定应用环境下「懂」用户的意图, 将促进视觉理解、人机交互技术在场景应用层面的发展,同时也将反向提升人工智能技术基础算法水平。情感识别领域已经吸引包括微软、谷歌、Facebook、Intel 等世界巨头及其他业内人士的高度关注, 并有公司开始基于应用场景进行研发。

在人工智能神经网络技术高速发展的情况下, 在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。现阶段人工智能技术将基于大量应用场景,实现在各个应用领域的进一步突破,而这其中的重点,即是人工智能场景应用技术。

产业竞赛ACM情感识别视频创业公司思图场景
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~