李亚洲 路参与

神秘的Waymo一反常态,CVPR现场发布大型自动驾驶数据集

在正在火热进行的 CVPR 2019 现场,一直对技术都较为保密的 Waymo 宣布开源全新的自动驾驶数据集。该数据集包含 3000 段驾驶记录、60 万帧、大约 2500 万 3D 边界框、2200 万 2D 边界框,以及多样化的自动驾驶场景。

目前,自动驾驶领域已经出现很多数据集,例如 KITTI、Oxford、Cityscape、nuScenes、BDD100K 等。

但在自动驾驶创业公司代表 Waymo 看来,到了 2019 年,KITTI 这样的数据集已经太小了,在使用过程中需要大量的时间做数据增强、防止过拟合,算法结果也不能很好地泛化到更大数据集上。

因此,在 CVPR 2019 现场,Waymo 首席科学家 Drago Anguelov 发布了包含完整传感器信息的全新标注数据集 Waymo Open Dataset,它与 KITTI、NuScenes 等数据集的对比数据如下,在传感器配置、数据集大小上都有很大的提升。

如上图所示,Waymo 数据集的传感器包含 5 个激光雷达、5 个摄像头,激光雷达和摄像头的同步效果也更好。

更重要的是,Waymo 数据集包含 3000 段驾驶记录,时长共 16.7 小时,平均每段长度约为 20 秒。整个数据集一共包含 60 万帧,共有大约 2500 万 3D 边界框、2200 万 2D 边界框。

此外,在数据集多样性上,Waymo Open Dataset 也有很大的提升,该数据集涵盖不同的天气条件,白天、夜晚不同的时间段,市中心、郊区不同地点,行人、自行车等不同道路对象,等等。

Drago Anguelov 介绍说,Waymo 将在 7 月份发布 1K 数据集,且将在近期公布数据集基准并组织竞赛。

除了发布数据集,此次演讲也透露了 Waymo 的传感器配置,如下图所示,包括视觉系统、激光雷达系统和雷达系统。

目前,Waymo Open Dataset 尚未公开,但官网已经开始注册,感兴趣的读者可从以下链接注册邮箱。只要数据开放,注册用户就能收到通知。

https://waymo.com/open/

产业CVPR 2019Waymo自动驾驶数据集
相关数据
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

过拟合技术

过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是分类器设计中的一个核心任务。通常采用增大数据量和测试样本集的方法对分类器性能进行评价。

推荐文章
暂无评论
暂无评论~