谷歌大脑联合UIUC新论文 Model-Based Reinforcement Learning for Atari
近日谷歌大脑联合UIUC的研究员发表了一篇论文:Model-Based Reinforcement Learning for Atari,以下是论文摘要:无模型强化学习(RL)可用于学习复杂任务的有效策略,例如Atari游戏,甚至可以从图像观察中学习。然而,这通常需要非常大量的交互 - 事实上,实际上比人类学习相同游戏需要更多。人们如何快速学习?部分答案可能是人们可以了解游戏的运作方式,并预测哪些行动将产生理想的结果。在本文中,我们将探讨视频预测模型如何能够类似地使智能体能够解决比无模型方法更少数量级的Atari游戏。我们描述了模拟策略学习(SimPLe),这是一种基于视频预测模型的完整的基于模型的深度RL算法,并提供了几种模型体系结构的比较,包括在我们的设置中产生最佳结果的新颖体系结构。我们的实验在一系列Atari游戏中评估SimPLe,并且在智能体和环境之间仅有100K交互(400K帧),从而获得有竞争力的结果,这相当于大约两小时的实时游戏。