专家云集CSIG图像图形学科前沿讲习班,共同探索“深度学习+视觉大数据”

2017 年 6 月 2 日,由中国图象图形学学会主办的 CSIG 图像图形学科前沿讲习班(Advanced Lectures on Image and Graphics,简称 IGAL)第 1 期会议在北京中国科学院自动化所学术报告厅如期举行。本次讲习班的主题为时下最火热的「深度学习+视觉大数据」,十位学科领域内的顶级专家将结合自身研究背景,分享大数据时代下的前沿计算机视觉技术及最新进展,详解深度学习方法及其在各视觉场景中的落地应用。

6 月 2 日上午,继中国科学院院士谭铁牛和中国科学院自动化所研究员王亮发表致辞后,北京大学信息科学技术学院教授、计算机科学技术系主任黄铁军率先展开《大数据背景下的视觉信息处理》主题学术报告。黄铁军以视频大数据面临的三大挑战为切入点,分别针对海量数据的存储、传输以及计算过程进行详细的解读。

图片1.png

北京大学信息科学技术学院教授、计算机科学技术系主任黄铁军


百万路视频高质量的清晰存储成本较大,为了控制成本,在保证图像质量和成本可接受的条件下,研究高效视频压缩方法对解决这一问题至关重要。不过,即便视频编码效率按照目前的发展趋势可以在五年内翻倍,但是能够同步实时传输的只有百/千路,多数不能实时访问。那么,如何在宽带允许的情况下完成实时传输?对此,黄教授一语点出,视频是给机器看的,不需要重建视频,只需要传输分析识别需要的特征即可,因此,研究视觉特征高效编码方法成为打破视频大数据传输壁垒的良方。


图片2.png

另外,黄铁军还从进化大数据下的视觉信息处理角度,介绍了仿生物视觉的视觉信息表达、分析方面的最新研究进展,并肯定了生物视觉模拟仿真研究的巨大潜力。

接下来,山东大学计算机与技术学院、软件学院院长陈宝权带来了一场关于《城市场景三维感知与分析》的主题学术分享。数据的获取是建立智慧城市的基础,其中获取城市场景的三维描述和理解是一个新颖并充满挑战的课题。城市场景的三维获取是陈宝权重点研究的领域,他着重介绍了基于影像以及激光扫描两种方式下三维数据获取的发展历程、研究进展以及存在的难点。与此同时,陈宝权以街景—街拍融合、航拍—监控视频融合、三维场景—监控视频融合为例,解析了多源数据的交互融合以及此基础上对城市场景和事件开展可视分析的过程,并提出未来研究内容包括:城市场景的全息表达与渐进式构建、城市多模态数据的语义计算与融合、复杂事件的临场分析与推理。另外,他特别指出,增强现实的信息呈现构成了人与机器的融合,未来,时空精准耦合、虚拟—现实无缝融合、人脑智能高度融合将成为这一领域研究的重点。

图片3.png

山东大学计算机与技术学院、软件学院院长陈宝权


随后,浙江大学计算机学院副院长、浙江大学人工智能研究所所长吴飞针对《跨媒体计算:从浅层关联到深度建模》这一主题进行了详细的解析。互联网时代涌现了类型复杂多样、来源广泛的海量数据,这些不同类型的媒体数据(文本、图像和视频等)之间以跨媒体形式表达共同语义。跨媒体计算的本质是通过学习和推理,实现从一种媒体类型到另外一众媒体类型的跨域,但这个过程存在着异构鸿沟、语义鸿沟、深度推理等难点。


图片4.png

吴飞从模态互补、逐层抽象和结构约束等角度,详细介绍了包含典型相关性分析等跨媒体浅层关联方法,并从深度模型基本概念由浅入深,诠释了深度建模模型,如深度随机游走、跨媒体组合语义深度学习、跨媒体哈希索引等。

图片5.png

浙江大学计算机学院副院长、浙江大学人工智能研究所所长吴飞


今天的第四场学术报告是上海交通大学电子信息与电气工程学院副院长、图像通信研究所副所长杨小康带来的《过程深度学习》。生命在于过程,进入数字时代后,人类在生产和生活过程中积累了海量数据。过程大数据的分析和利用,使人类可以动态、持续地认知、适应、改变生产和生活环境,主要包括语音、视频等离散采样的同步序列和神经脉冲、交易、犯罪等随机触发的异步序列。过程的分析方法则包括模型驱动和数据驱动两类。在这里,杨小康详细介绍了模型驱动的过程建模方法,通过反复验证建立过程的抽象及简化表示。但这种方法的局限性在于框架相对固定、不易适应信息社会不断涌现的新现象。

图片6.png


人类生产生活中产生并积累的过程大数据,使得数据驱动的过程分析成为可能。将深度学习引入到过程分析,可以推动随机过程和机器学习的学科交叉,进一步加强机器学习技术在信息社会的渗透性,带来过程学习的新突破。杨小康结合计算机视觉和社交媒体分析等实例,介绍了他所研究领域内点过程深度学习、交互过程深度学习、多尺度过程深度学习、混合过程深度学习等方面的研究进展。

图片7.png

上海交通大学电子信息与电气工程学院副院长、图像通信研究所副所长杨小康


CSIG 图像图形学科前沿讲习班第 1 期会议第一天,四位教授所带来的学科领域前沿技术分享,不仅有助于参与者开拓视野、提高技术水平,还加强了领域内学者之间的交流和沟通。期待未来两天讲习班更多顶级学者的精彩分享。

产业图像识别产业计算机视觉视频