Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Argoverse:推动无人驾驶研究的数据集和高精地图

在当今世界对于计算机视觉机器学习的研究上,能否获取高质量的海量数据显得至关重要。这是因为训练、验证、测试、优化感知算法和机器学习方法需要大量的数据才能让无人车理解周围的世界。

所以,Argo AI很兴奋地宣布,我们发布了一个高质量的数据集以及相应的高精度地图。我们的数据集 (Argoverse™) 是第一个公开发布的包含高精地图的无人驾驶研究数据集。通过Argoverse,研究人员可以探索高精地图对于关键感知和预测任务的影响,例如对于路上物体的识别和跟踪,以及预测这些物体在接下来的几秒内会移动到哪里。

地图对于各种自驱型智能机器人,例如无人车,智能扫地机器人,甚至无人地雷探测器等等的感知任务都是至关重要的。地图使得这些智能机器人准确定位自己。而具体到无人车领域,地图则是能让专家们开发出更优的目标跟踪和预测方法的关键,这反过来又让无人车系统更好地了解周围的世界。

尽管地图对于无人驾驶技术的研发如此重要,当下却很少有公开的数据集提供高精地图。这使得没有公司支持的高校学生,教授和相关专家们难以获得足够相关的数据。众所周知,在公共道路上测试无人驾驶的费用十分高昂:做出一个无人驾驶的测试原型车动辄耗费几十万美元,更不要说创建高精地图本身的成本。因此,两年前当我们开始讨论Argoverse这个项目的时候,我们认为有必要让它包含几何和语义元信息,例如地面高度,车道几何和道路语义分割信息。Argoverse是第一个发布包含高精地图的无人驾驶数据集。

对于Argo团队来说,发布Argoverse就是要让学术界能够方便地获取他们需要的信息。我们不仅支持计算机视觉机器学习领域的尖端研究,同时也希望帮助下一代工程师和机器人科学家投身于包括Argo AI在内的无人驾驶科技公司。前不久,我们刚刚宣布了投资1500万美元,在卡内基梅隆大学成立了CMU-Argo AI无人驾驶研究中心。通过我们跟高校的合作项目,以及一些教育性项目和科技推广活动以激发年轻一代从事STEM(科学, 技术,工程, 数学教育)的激情。Argoverse是这一目标的自然延续和持续推进。

Argo AI的研发工程师,和来自乔治亚理工大学,卡内基梅隆大学的实习生。他们是这篇CVPR 2019论文的部分共同作者。

Argo AI和学术研究

Argo AI在美国的五个城市里运行着自己的无人驾驶车队,包括迈阿密和匹兹堡。这其中的一部分数据构成了Argoverse。这让研究社区可以基于相同方式共享协议免费获取这些富含有用信息的数据。

目前机器学习的研究是数据驱动的,研究人员用公开数据集的训练和测试数据去衡量模型的进步。从2012年开始,KITTI数据集催化了无人驾驶感知任务的研究。数以千计的论文用KITTI衡量3D物体检测等任务的算法,Argo和其他公司通常会基于这些文献中的算法去研发自己的算法。

Argoverse使得研究社区能够训练和评估新的基于地图的算法去提升无人驾驶车的功能。这些也使得包括Argo AI在内的无人驾驶科技公司所面临的挑战得以解决。

Argoverse的技术细节

Argoverse是三种不同类型研究数据的集合。第一种数据是包含无人驾驶车队采集的113个场景的传感器数据,以及所有物体的3D目标标注的追踪信息。第二种数据是一个包含有30多万个场景的所有物体的运动轨迹。第三种数据是几个匹兹堡和迈阿密及周边地区的高精地图,对以上两种数据提供了丰富的环境信息。

这三种数据的具体信息如下:

  • Argoverse 3D目标跟踪数据集:无人车面临的一个关键挑战是理解周围的物体怎么运动。我们把这个任务称为3D目标跟踪。我们的3D目标跟踪数据集包括了以下几类传感器数据:每秒30帧的视频数据,这些视频来自于七个摄像头,全方位360度覆盖,外加两个前向立体摄像头。还有长距离激光雷达所采集的点云数据,和6DOF(degree of freedom)的姿态数据。我们收集了113个场景下的传感器数据,每个场景由15到30秒的序列组成。我们对每一帧的每一个物体人工标注了3D长方体的标签,总计有超过10,000个有目标跟踪标签。
  • Argoverse运动预测数据集。对无人车而言,跟踪物体已经运动的轨迹(3D目标跟踪)固然很重要,但预测物体将会怎么运动也很重要。同人类驾驶员一样,无人车需要去评估:“这辆车会不会并入我的车道”,“我前面的这个司机会左转吗”等等问题。为此,我们挖掘出了超过1000小时的有价值的驾驶记录。这里,有价值表示车辆处于十字路口,或者因为前方有车要并入而减速,或者在转弯之后加速,或者因为路上有行人而停下来,以及其他类似的情况。我们筛选除了超过30万个这样的场景,每个场景包括五秒10赫兹的序列,和每一帧的每个被跟踪物体的2D鸟瞰视图的中心。每个序列有一个有价值的运动轨迹作为我们运动预测的衡量标准。研究人员可以根据前两秒观测到的轨迹去预测接下来三秒某辆车的运动轨迹。
  • Argoverse高精地图:Argoverse最引人注目的应该就是我们包括了290公里的高精地图了。这个地图不仅包含车道线的位置,也包含了这些车道线是如何连接车流的。所以当一条车道进入十字路口时,高精地图可以提供给你司机将可能从哪三个后续车道驶出。同时,地图也包含另外两个重要组成部分:地面高度,和平米分辨度的可行驶区域分割信息。因此地图可以使很多感知任务变得更容易,比如我们可以根据地面高度和可行驶区域信息去除不重要的点云。再比如,如果我们事先根据地图推测出司机所行驶的车道,那么预测这辆车之后的行驶轨迹将会变得简单很多。我们也可以根据车道信息(例如车道方向)去提升车辆的朝向和速度估计。毫无疑问,有很多其他方式在无人车感知任务重融入地图信息,但是目前的科研圈并没有提供高精地图的数据集研究人员使用。希望Argoverse的出现能够填补这一空白。

Argoverse的打开方式

您可以在 www.argoverse.org 下载并了解更多关于数据库的信息。我们还创建了一个可以与数据和地图交互的API。如果您想详细了解,请参阅CVPR 2019的论文。我们将会继续维护Argoverse,并举办挑战赛。欢迎各位同仁保持关注。

产业计算机视觉机器学习语义分割Argo AI激光雷达感知智能运载工具智慧出行数据科学
1
相关数据
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

Argo AI机构

Argo AI是一家美国自动驾驶汽车公司,总部位于匹兹堡,2016年底由前Google与Uber自动驾驶部门员工成立。Argo AI 正在研发一套自动驾驶系统,这套系统最终将面向其它公司出售。 2017年2月,福特称将在未来五年向Argo AI投资10亿美元,帮助其致力于为自动驾驶车辆提供智能驾驶平台,也就是通俗意义上的大脑系统,并且会在未来将这个平台授权给其它汽车厂商使用。当时,Argo AI拥有不到12名员工。但2018年,通过从苹果、Uber和其他科技公司挖来软件工程师和机器人研究人员,该公司的员工数量增加近26倍,达到约330人。

https://www.argo.ai/
奇虎360机构

360公司成立于2005年8月,创始人周鸿祎 2011年3月30日在纽交所成功上市 2018年2月28日,回归A股上市,上证交易所(601360) 是中国第一大互联网安全公司,用户6.5亿,市场渗透率94.7% 中国第一大移动互联网安全公司,用户数超过8.5亿 中国领先的AIoT公司,将人工智能技术应用于智能生活、家庭安防、出行安全、儿童安全等多个领域

http://smart.360.cn/cleanrobot/
推荐文章
暂无评论
暂无评论~