谷歌 AI 通过自动化强化学习(AuotRL)进行远程机器人导航
机器之心获悉,谷歌 AI 于今日发布最新博客,表示其在最近发布的三篇论文中,研究人员通过将深度强化学习与远程规划相结合来研究易于适应的机器人自治。研究员培训 Local Planner 执行基本的导航行为,安全地穿越短距离而不会与移动的障碍物发生碰撞。Local Planner 采用噪声传感器观测,例如提供距障碍物距离的一维激光雷达,以及输出机器人控制的线性和角速度。该团队使用自动化强化学习(Automated Reinforcement Learning)训练 Local Planner 并进行模拟。
自动化强化学习是一种自动搜索强化学习奖励和神经网络架构的方法。尽管它们的范围有限,只有10到15米,但是 Local Planner 可以很好地转移到真正的机器人和新的、以前看不见的环境。这使研究员们能够将它们用作大空间导航的构建块。
该三篇论文分别为“Learning Navigation Behaviors End-to-End with AutoRL”、 “PRM-RL: Long-Range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning” 以及 “Long-Range Indoor Navigation with PRM-RL”。