自动驾驶视觉「三大挑战」来袭,ECCV 2018 ApolloScape 挑战赛开放报名

数据是自动驾驶不可或缺的「养料」,对于高速发展的自动驾驶行业来说,亟需一个提供真实、海量数据的平台。9 月 8 日至 14 日,计算机视觉欧洲大会 ECCV 2018(European Conference on Computer Vision)将在德国慕尼黑召开,该会议与 CVPR、ICCV 共称为计算机视觉领域三大顶级学术会议。本次 ECCV 2018 挑战赛要求参赛者基于 3D 视觉系统来完成自动驾驶相关的一些相关任务,百度大规模自动驾驶数据集 ApolloScape 将为本次大会的计算机视觉社区提供一个大规模和高质量的真实场景数据集。据悉,ApolloScape 还为优胜者准备了丰厚的奖金作为鼓励,目前报名通道已正式开启。

ECCV 2018 挑战赛 | ApolloScape:基于视觉的自动驾驶导航 官方报名通道已开启

目前,自动驾驶公司主要依赖于激光雷达来检测和识别物体,但相比激光雷达,基于视觉信息(如图像或视频)的 3D 感知或将大大降低成本。此次 ECCV 2018 以解决潜在的计算机视觉为挑战,赛事主要包括基于视觉的细粒度车道标记分割、实时自定位及 3D 汽车实例了解等 3 大内容。所有参赛者都将基于 ApolloScape 提供的数据集进行挑战,每一项挑战的前三名将分别获得 3000 美金、2000 美金和 1000 美金的奖励。目前赛事正处于挑战阶段,9 月 5 日挑战正式截止,9 月 9 日将进行颁奖 & workshop。

目前的自动驾驶开发测试中,鲜少有团队有能力开发并维持一个适用的自动驾驶平台,长期的、系统的收集和标注新数据,因此行业亟需一个数据量充沛、标注详实的自动驾驶专用数据平台。2018 年 3 月,百度大规模自动驾驶数据集 ApolloScape 应需开放,致力于为全世界自动驾驶技术研究者提供更为实用的数据资源及评估标准。ApolloScape 是百度在 2017 年创立的 Apollo 开放平台的一部分,目前采集图像来自于中国的不同城市,比如北京、上海和深圳等。为了刻画高细粒度的静态 3D 世界,ApolloScape 使用移动激光雷达扫描仪器从 Reigl 收集点云。这种方法产生的三维点云要比 Velodyne 产生点云更精确、更稠密。在采集车车顶上安装有标定好的高分辨率相机以每一米一帧的速率同步记录采集车周围的场景。而且,整个系统配有高精度 GPS 和 IMU,相机的实时位姿都可以被同步记录。据介绍,ApolloScape 是目前行业内环境最复杂、标注最精准、数据量最大的三维自动驾驶公开数据集。ApolloScape 的标注精细度上超过同类型的 KITTI,Cityscapes 数据集,也超过 UC Berkley 最新发布的 BDD100K。

     自动驾驶公开数据集比较    

目前,ApolloScape 已经开放了 14.7 万帧的像素级语义标注图像,包括感知分类和路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据,以及与其对应的逐像素语义标注,覆盖了来自三个城市的三个站点周围 10KM 的地域。而且,每个区域都在不同的天气和光照条件下进行了重复扫描。未来,ApolloSacpe 将会发展成为一个不断更新进化的数据集,涵盖更复杂的环境、天气和交通状况,添加更多的传感器来扩充数据的多样性,致力于打造真实世界还原度最高、场景最丰富的仿真平台。未来,来自新的城市的数据标注也会陆续的加入其中。ApolloSacpe 计划产出至少 20 万张图片用于举行不同的挑战赛,其中将会覆盖来自三个城市的 5 个站点的 20KM 的道路。

ApolloScape ECCV 挑战赛将于 2018 年 9 月 9 日正式开赛,目前该赛事正处于报名阶段,目前处于挑战阶段,全球开发者可以前往官网通道(http://apolloscape.auto/ECCV/index.html)进行报名。

工程百度ECCV 2018挑战赛自动驾驶
4
相关数据
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

推荐文章
暂无评论
暂无评论~