谷歌大脑,DeepMind 以及多伦多大学联合推出增强型学习智能体 Dreamer
来自谷歌大脑,DeepMind 以及多伦多大学的研究人员们近日发表了一篇名为「梦想控制:通过潜意识的学习行为」的新研究,以下是该研究的完整摘要分享:经验丰富的世界模型总结了智能体的经验,以促进学习复杂行为。尽管通过深度学习从高维感官输入中学习世界模型变得可行,但是有许多潜在的方法可以从中推导行为。研究人员介绍了一种增强型学习智能体 Dreamer,它可以完全通过潜在的想象力解决图像中的长时间任务。研究人员通过在学习的世界模型的紧凑状态空间中想象的轨迹传播学习状态值的解析梯度来有效地学习行为。在 20 项具有挑战性的视觉控制任务上,Dreamer 在数据效率,计算时间和最终性能方面都超过了现有方法。论文传送门:bit.ly/2PeT4Pi。点击下方链接查看详细项目信息。