奥比中光举办AI 3D感知论坛 学术专家共话三维计算机视觉前沿科技

2019年1月23日,由中国自动化学会模式识别与机器智能专委会、中国人工智能学会模式识别专委会主办,国内3D传感领军企业奥比中光承办的“AI之眼,智见未来”3D传感&人工智能前沿科技论坛在深圳南山举行,来自国内多所知名大学的七位顶尖专家就基于深度学习的三维场景重建、动态场景三维重建、基于三维信息的行为理解、视觉SLAM、三维人脸和表情识别、三维人脸建模、三维场景智能感知与理解等三维计算机视觉领域的前沿科技进行阐述。深圳南山科创局南山区科创局(区科协)常务副主席张汉国、奥比中光联合创始人兼CTO肖振中出席论坛活动并致辞。

奥比中光联合创始人兼CTO肖振中出席论坛活动并致辞

深圳市南山区科创局(区科协)常务副主席张汉国在讲话中表示,推动新一代人工智能与产业的深度融合已上升为国家战略,此次论坛对于推进我国人工智能“产学研”的深度融合,推动AI 3D传感技术的创新与发展具有重要意义。

深圳市南山区科创局(区科协)常务副主席张汉国讲话

7位顶尖学术专家分享3D传感&人工智能最新科研成果纪荣嵘:基于深度学习的场景信息重构

厦门大学“闽江学者”特聘教授,博士生导师纪荣嵘表示,在实际应用中,重构场景语义信息和几何信息非常重要,目前深度学习技术虽然在目标检测、视频跟踪等领域取得了重大突破,但在应用中依然存在图像遮挡等问题。对此,纪荣嵘教授介绍了其课题组在视觉里程计、图像语义分割和图像深度估计的研究进展,并举例介绍了这些技术在移动端的应用。

刘烨斌:实时便携动态场景三维重建

清华大学自动化系副教授、博士生导师刘烨斌认为,真实世界视觉信息的采集、数字化记录与重建是当前视觉媒体技术发展的核心关键,随着IPhone X等智能手机新增加实时深度探测模块,动态场景的三维重建变得更加便捷。目前,动态场景的三维重建主要面临精准性、便捷性和实时性三方面的挑战。对此,刘烨斌教授围绕便捷性和实时性,回顾了动态场景三维重建的发展历程,介绍了最新的关于便捷采集及实时生成的成果,主要是基于深度相机实时动态人体三维重建。此外,刘烨斌教授还围绕视觉信息采集的计算摄像技术,介绍了在视角维度的光场摄像、光谱维度的高光谱视频成像、空间维度的十亿像素视频生成、时间维度的TOF瞬态成像方面的最新进展。

章国锋:视觉SLAM技术及应用

浙江大学CAD&CG国家重点实验室教授,博士生导师章国锋重点介绍了基于视觉的同时定位与地图构建(Visual SLAM)技术,在满足实际应用需求中需要解决的关键性问题,包括:一是如何实现在移动设备上实时稳定跟踪,处理快速运动和强旋转问题;二是如何重建三维几何表面进行在线调整和误差累积消除;三是如何实现高效的全局优化等。

卢策吾:基于三维信息的行为理解

上海交通大学研究员,博士生导师卢策吾介绍了在行为理解和三维视觉的最新进展。行为理解研究主要涵盖Deep RNN、Alphapose and beyond COCO、Interactiveness;三维视觉则包括PointSIFT、Pointwise Rotation-Invariant Network、DBNet。

黄迪:基于三维人脸数据的身份识别与表情分类

北京航空航天大学计算机学院长聘副教授,博士生导师黄迪首先介绍了三维人脸分析技术的发展,他表示,得益以奥比中光为代表的三维数据采集设备制造商的发展,相比过去,以较低成本快速编辑获取高精度的三维数据成为现实,这促进了三维人脸分析技术的进一步发展和应用。由于三维人脸能够直接反映人脸形状信息且能与纹理信息良好互补,目前已成为各机构研究热点。对此,黄迪教授介绍了在三维人脸分析在数据库构建、处理方法、实验评价等方面的研究进展,并对其中涉及的人脸标志点定位,人脸曲面配准、曲面几何表示、和二维三维信息融合等研究内容、以及三维人脸识别和三维人脸表情分类的应用做了详细介绍。

赵启军:三维人脸建模:由图到形的人脸识别

针对目前大热的人脸识别,四川大学计算机学院副教授、博士赵启军在演讲中表示,人脸能够反映我们的很多信息,比如身份、种族、性别、年龄、情绪、注意力和健康状况等等。但是,相比二维人脸图像,获取三维人脸数据仍然要更加昂贵和不便,导致其实际应用依然存在诸多限制。对此,赵启军教授介绍了在由二维人脸图像重建三维人脸形状方面的工作,他表示,他们提出的方法能够利用二维图像生成三维人脸模型,且能够大幅提升人脸识别准确率。赵启军教授认为,随着三维人脸获取和建模技术的快速发展,三维人脸将在越来越多的应用中发挥更加重要的作用。特别是奥比中光的3D传感技术目前已经应用到诸多场景中,对于3D感知领域发展有非常大的促进作用。

郭裕兰:三维场景智能感知与理解。

国防科技大学电子科学学院讲师郭裕兰表示,得益于以奥比中光为代表的3D传感企业的快速发展,三维视觉在近年来得到了广泛关注,相比2D图像,三维点云包含了更加丰富的几何、形状和结构信息,从而为场景理解提供了更多可能。对此,郭裕兰详细介绍了其研究组在双目深度估计、三维目标识别以及三维场景标注等方向的研究进展。他认为,未来,3D智能感知与理解在自动驾驶、机器人、VR/AR以及遥感等领域都有大量的应用。

以自身为“桥梁”,打造AI 3D传感“产学研”

论坛现场,来自各高校的研究人员和人工智能企业的研发人员齐聚一堂,与七位学术专家共同探讨三维计算机视觉领域的前沿技术。如今,我国正在稳步推进人工智能产业化进程,在此期间,“产学研”无疑是推动AI理论成果向产业研发应用转化的关键一环。肖振中在论坛致辞中表示,奥比中光十分重视与高校、科研机构的“产学研”合作,承办此次论坛不仅是自身进步的需要,也是推动学科和行业发展的社会责任。

此次论坛的举办为研发人员搭建了AI 3D传感技术交流平台,凸显了奥比中光在AI 3D传感领域的科研地位和学术影响力,今后,奥比中光将进一步加强与产学研各界的合作,并以自身为“桥梁”拉近AI 3D传感产业与学术界的关联,以全自主知识产权技术助力产业升级,以产业需求推动学术进步,助推AI 3D传感科研成果更好地向产品、市场转化。

产业奥比中光人脸识别模式识别计算机视觉3D 传感器
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

图像重建技术

通过物体外部测量的数据,经数字处理获得三维物体的形状信息的技术。图像重建技术开始是在放射医疗设备中应用,显示人体各部分的图像,即计算机断层摄影技术,简称CT技术,后逐渐在许多领域获得应用。主要有投影重建、明暗恢复形状、立体视觉重建和激光测距重建。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

遥感技术

遥感(remote sensing)是指非接触的、远距离的探测技术。一般指运用传感器/遥感器探测物体的电磁波辐射、反射特性。遥感通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标物体条件下探测目标。

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

奥比中光机构

奥比中光2013年在深圳创立,是一家以3D传感技术为核心的人工智能3D视觉领军企业。公司先后获得蚂蚁金服、松禾资本、赛富投资、金石投资、广发信德、联发科技等战略投资。2015年,奥比中光自主研发出中国第一颗3D感知芯片,并成为亚洲第一家量产全自主知识产权消费级3D传感摄像头的企业。目前,奥比中光全球客户近2000家,包括惠普、蚂蚁金服、OPPO、平安集团、百度等国内外知名企业,产品已广泛应用于手机、新零售、智慧家庭、智能安防、机器人、物流等十几个行业。奥比中光致力于为所有的智能终端提供一双“3D智慧之眼”。

www.orbbec.com.cn
推荐文章
暂无评论
暂无评论~