英伟达推出新型强化学习研究,并将于 ICRA 2019 进行展示
机器之心消息,英伟达西雅图机器人研究实验室的研究人员们推出了一种新的强化学习方法来提高仿真训练机器人在现实世界中的表现,并将在加拿大蒙特利尔举国际机器人与自动化会议(ICRA)上进行成果展出。该研究依赖于模拟培训,允许机器人在部署到现实世界之前进行无限次的虚拟训练。强化学习机器人社区面临的挑战之一是现实世界和模拟器之间的差异。研究人员通过学习针对更好的政策转移而优化的模拟方案分布的政策来缩小现实差距。研究人员们使用了 64 个 NVIDIA Tesla V100 GPU 的集群,以及 cuDNN 加速的 TensorFlow 深度学习框架,帮助机器人在 1.5-2 小时内进行超过 9600 次的模拟学习,使其能够将钉子摆入孔中并准确地打开抽屉。研究人员表示,使用真实世界数据调整模拟随机化有助于学习模拟参数分布,这些分布特别适合成功的策略转移,而无需精确复制现实世界环境。