时间:2018年10月13日-14日
地点:北京大学理科二号楼2129报告厅
三维视觉是计算机视觉与计算机图形学高度交叉的一个重要研究方向。近年来,由于三维传感技术的飞速发展和三维几何数据的爆炸式增长,三维视觉研究突破传统的二维图像空间,实现三维空间的分析、理解和交互。三维视觉技术被越来越广泛应用于智能无人系统(无人车、无人机)、机器人、智能制造、文物保护和医疗健康等多个行业,为国家的重大需求提供关键技术支撑。
CSIG图像图形学科前沿讲习班(简称IGAL)于2018年10月13日-14日在北京举办第7期,本期讲习班主题为“三维视觉前沿进展与应用”,由北京大学的陈宝权教授担任学术主任,邀请三维视觉领域的知名专家作报告,使学员在了解学科热点、提高学术水平的同时,增加与三维视觉领域顶尖学者之间的学术交流。
学术主任
陈宝权
北京大学教授、博导
长江学者,国家杰青,973首席科学家
报告题目:基于深度感知与反演的三维视觉
摘要:三维视觉涉及到场景三维数据的获取、几何建模与理解,和基于三维场景的数据融合与智能分析,是实现机器人(包括无人机和任何移动智能体)与场景交互的要素,也是视觉再创造的基础。此报告将介绍近年来基于机器人的三维感知方面的进展,特别是引入主动式(proactive)感知方法,构建数据获取与数据处理的闭环。此报告还试图拓展传统三维视觉的研究内容,不仅对感知对象分类识别和几何表达,也对其功能以及事件演变的内在规律和过程重建,实现更高层次的视觉智能。视觉智能催生越来越多的移动智能体,如无人车、无人机、机器人等,也更有效地支撑数字化创意设计、影视制作以及数据可视化。
特邀嘉宾
吴毅红
中科院自动化所研究员、博导
报告题目:2017年以来的2D转3D计算机视觉进展
摘要:基于图像2D信息产生3D信息是三维计算机视觉的主要研究内容,在机器人、AR、VR领域有广泛应用。其中有三部分重要研究内容:图像匹配、相机定位、三维重建。从这三个方面介绍2017年以来进展,并进行未来趋势展望。
杨睿刚
百度研究院三维视觉首席科学家、RAL负责人
报告题目:Baidu RAL: from Autonomous Driving to Robotics
Abstract:Baidu is the leading internet search provider in China. In the last few years, it has invested heavily in AI-related R&D. Among these projects, autonomous driving is one of the most prominent. In this talk, I will introduce Baidu’s Apollo project that provides an open source and open capability platform for autonomous driving. In addition, I will introduce the newly founded Robotics and Autonomous Driving lab (RAL) in Baidu Research, which serves as the research arm for AD business and the exploration front for robotics research.
刘烨斌
清华大学长聘副教授、博导,国家优青
报告题目:人体动态三维重建技术前沿
摘要:人体对象是视觉场景信息中最重要的部分,其具有复杂的纹理外观特性、非刚性形变和高动态特性。人体对象的动态三维重建可应用于全息三维影像通信、3D人体试衣、增强现实、安防视频人体行为分析、各类智能机器三维视觉分析、影视娱乐游戏等。近年随着三维视觉技术和深度学习网络技术的发展,IphoneX等智能手机新增加实时深度成像模组,HoloLens/Magic Leap One等AR设备的出现,5G网络的蓄势待发,人体动态三维重建的应用变得越发迫切。本报告回顾近20年动态人体三维重建技术的发展,总结多条技术脉络,包括基于面向单帧重建的、骨架驱动的、体态驱动的、时域融合驱动的四大类重建方法进行介绍,同时围绕重建的目标需求:精准、实时、便捷、大范围、语义化等5大目标进行技术阐述,介绍经典以及最新的前沿方法。最后展望未来,介绍报告人对人体动态三维重建的未来发展的认识与理解。
徐凯
国防科技大学副教授,国家优青
报告题目:室内机器人探索式三维重建与视觉感知
摘要:视觉感知是机器人探索、感知和理解未知环境的最重要方式。近年来,随着三维传感设备的飞速发展和三维几何数据的迅速膨胀,三维图形学正与视觉技术深度交叉、融合,形成基于三维几何的计算机视觉研究方向,为机器人对未知环境的三维感知和立体交互提供了重要技术支撑。本次报告围绕机器人室内场景三维几何重建和语义理解,汇报我们研究组的若干最新成果。其中包括方向场引导的未知场景自动三维重建,基于主动交互的场景分割,基于三维注意机制的主动物体识别,以及物体感知引导下的自主三维重建。最后简要介绍我们最新工作,即多机器人室内场景协同三维重建。
章国锋
浙江大学教授、博导,国家优青
报告题目:运动恢复结构与视觉SLAM
摘要:运动恢复结构(Structure from Motion,简称SfM)和视觉同时定位与地图构建(Visual Simultaneous Localization and Mapping,简称VSLAM)是三维视觉和机器人领域的基本问题,可以在未知环境中定位自身的方位并构建环境的三维地图,有着广泛的应用。本课程首先介绍相机模型、双视图几何、多视图几何等基本的概念和原理,并介绍目前主流的SfM、视觉SLAM的框架和重要模块,包括特征点跟踪、相机姿态求解、集束调整和回环检测等。此外,还会专门介绍基于SfM和视觉SLAM 的一些典型应用,比如在手机AR上的应用。
李扬彦
阿里巴巴达摩院高级算法专家
报告题目:面向三维数据的深度神经网络进展与展望
摘要:近年来,基于图片的视觉任务取得了突破性进展,极大提高了计算机理解现实世界的能力。可以预见,结合三维数据,视觉系统能够更有效地理解现实世界,进而更准确地交互和操作。深度学习是近年来图片理解取得突破性进展的核心技术,也被认为有巨大的潜力适用于处理三维数据。然而,三维数据具有非常不同于图片数据的结构特征,将适用于处理图片数据的深度神经网络拓展并用于处理三维数据的尝试并不成功。本报告将回顾近年来三维深度学习方面的进展,并展望未来发展方向。
郭裕兰
国防科技大学讲师
报告题目:三维场景感知与理解
摘要:得益于三维数据传感器的快速发展,三维视觉在近年来得到了广泛的关注。相比于二维图像,三维点云包含了更加丰富的几何、形状和结构信息,从而为场景理解提供了更多可能。三维场景感知与理解在自动驾驶、机器人、虚拟现实/增强现实以及遥感等领域都有大量的应用。本报告将介绍研究组在深度估计、点云特征表示、三维建模以及三维目标识别等领域的进展。
报名方式
即日起至2018年10月12日,报名者可咨询学会秘书处详细事宜或点击链接https://b.eqxiu.com/s/WzyIZuPD直接报名。
联系方式
联 系 人:骆老师/黎新
联系电话:010-82544676 / 18518633293(手机微信同号)