谷歌大脑&Waymo提出ChauffeurNet: 通过模仿最好和合成最差来学习驾驶
谷歌大脑和Waymo团队近日发表了论文:ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst,以下是论文摘要:我们的目标是通过模仿学习来培养自动驾驶的策略,该策略足以驾驶真实车辆。我们发现标准行为克隆不足以处理复杂的驾驶场景,即使我们利用感知系统预处理输入和控制器来执行汽车上的输出:3000万个数据仍然不够。我们建议以对专家驾驶的扰动的形式向学习者展示合成数据,这会产生有趣的情况,例如碰撞和/或离开道路。我们不是纯粹模仿所有数据,而是通过额外的损失增加模仿损失,惩罚不良事件并鼓励进展 - 然后扰动为这些损失提供了重要信号,并导致学习模型的鲁棒性。实验表明,ChauffeurNet模型可以处理模拟中的复杂情况,并提供消融实验,强调我们提出的每个变化的重要性,并表明模型正在响应适当的因果因素。最后,我们展示了在现实世界中驾驶汽车的模型。