『图像视频理解』硬核技术会议

图像视频的自动理解是人工智能的核心问题之一,在深度学习技术的有力推动下,近年来得到了快速发展,一方面传统任务的技术方法不断迭代,性能指标屡创新高;另一方面新思想和新任务也不断涌现,对如何解决此问题的认识也日益深入。当前,图像视频理解正在和知识表示、逻辑推理、语言处理等其他人工智能相关技术产生深层次的关联,呈现出多领域交叉的态势。图像视频理解的输出结果已不仅是有限的几个概念,而是更加知识化、结构化和语言化。从历史的角度来看,图像视频理解技术虽然蓬勃进步,但仍处在变革发展期,其科学问题、关键挑战、技术方案等还在不断演化,还有很大的研究空间。

第12期CSIG图像图形学科前沿讲习班(Advanced Lectures on Image and Graphics,简称IGAL)将于2019年7月30日-31日在清华大学举办,本期讲习班主题为“图像视频理解”,由中科院计算所陈熙霖研究员担任学术主任,邀请计算机视觉、多媒体与人工智能领域的一线青年专家作特邀报告,使学员在了解学科前沿、提高学术水平的同时,增强与国内外顶尖学者的学术交流。

时间地点

  • 2019年7月30日-7月31日
  • 清华大学罗姆楼三层报告厅

学术主任

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdiaFFxPe1NwE6qktfUbRicYKyDlv0d6diaktyfCkZw7pmgkQibloUYny3qw/640?wx_fmt=jpeg陈熙霖

中科院计算所研究员、博导

IEEE /IAPR Fellow

个人简介:陈熙霖,中科院计算技术研究所研究员,IEEE /IAPR Fellow、中国计算机学会会士。主要研究领域为计算机视觉模式识别、多媒体技术以及多模式人机接口。目前是IEEE Trans. on Multimedia的AE和Journal of Visual Communication and Image Representation的Senior AE、计算机学报副主编和模式识别人工智能副主编,任FG2013 / FG2018 General Chair、CVPR 2017/2019/2020, ICCV 2019等Area Chair。先后获得国家自然科学二等奖1项,国家科技进步二等奖4项。在国内外重要刊物和会议上发表论文200多篇。

特邀讲者

(按讲者姓氏拼音排序)

https://mmbiz.qpic.cn/mmbiz_png/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdiaLKNIpqcAxcptHYpfD7qLoRQtTL2icedCFDeHgFLNTYBA3gstPxqzqQ/640?wx_fmt=png

赫然

中科院自动化所研究员、博导,国家优青

报告题目:生成式图像分析与理解

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqd1ZFKNCDTYOJxBicPBmTQCJ1rKQDheZQCAVCKDSEH6vWCzbvd9r1DhyQ/640?wx_fmt=jpeg

何旭明

上海科技大学副教授

报告题目:Learning structured visual concepts with few-shot supervision

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdEicVRp02JTicdOgOyZOo0Tpw0M2DcsyBnJqkMHCNtezRiaRMnZh6Q9r3g/640?wx_fmt=jpeg

胡清华

天津大学教授、博导,国家优青

报告题目:多模态数据的高阶信息表示学习

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdcLJuAIQzWvmbuj08PTFU5u4mlTcxPsnGibaGfF9MQ545CBU3dSIT6gQ/640?wx_fmt=jpeg

刘静

中科院自动化所研究员

报告题目:图像语义分割研究回顾与前瞻

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdsDeaiccibpex2m2LLfanfCMPF8R4JYIYBKSlWX7SUeNPkRWjBeCrPib1A/640?wx_fmt=jpeg

鲁继文
清华大学副教授、博导国家优青

报告题目:深度强化学习与视觉内容理解

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdNEyngjO0BOH1CBTqOdz9WNOoezh1OSRGbOzfTXFMz5flmJdiaLvaCNQ/640?wx_fmt=jpeg

王井东

微软亚洲研究院研究员

IAPR Fellow

报告题目:Efficient and High-Resolution Representation Learning for Visual Recognition

https://mmbiz.qpic.cn/mmbiz_jpg/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdlbqS60qj6XaZvl7q4ELgycBk2T3M0dspKh9v7dUbzufNDiaAbuNCoEw/640?wx_fmt=jpeg

王瑞平

中科院计算所研究员、博导

报告题目:开放场景中的物体识别

https://mmbiz.qpic.cn/mmbiz_png/Nabxc8rdYrherj9gJOxEmXLQDib41uzqdyd5LVibsaL9fgbibNc0tXS0p8wNaIicXy5BqEbXicnqUAKpY2jbFM80aaw/640?wx_fmt=png

左旺孟

哈尔滨工业大学教授、博导

报告题目:卷积神经网络的灵活性初探

报名方式

登录活动系统:http://conf.csig.org.cn/fair/359。

联系方式

联系人:骆岩峰 / 黎新

联系电话:010-82544676 / 17812762235(微信同号)

邮箱:igal@csig.org.cn

产业其他智能领域模式识别语义分割计算机视觉深度学习
1
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面,智能多媒体,大数据与知识挖掘,人工智能,云和边缘计算,计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的研究,助力微软实现长远发展战略。通过与微软产品部门紧密合作,微软亚洲研究院将众多创新技术转移到了微软的核心产品中,如Office、Windows、Azure、Bing、Visual Studio、Xbox Kinect以及小冰、Cortana和Microsoft Translator等人工智能产品。

https://www.msra.cn/
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

推荐文章
暂无评论
暂无评论~