行业内参

AI Daily

AI Daily 快讯 · 2019/06/28

DeepMind 新论文：规范化机器人成分转移的层次策略

数据效率是在物理系统上应用强化学习的主要挑战之一，DeepMind 的研究团队使用分层模型来加强转移，同时减轻负面干扰来为物理机器人节省数周的训练时间。研究人员以结构化政策的形式开发和研究简单的层次归纳偏差，作为强化学习（RL）中任务之间知识转移的机制，并设计了一种能够实现稳定快速学习的 RL 算法来利用这些结构化策略的强大功能。研究人员在模拟机器人环境（使用运动和操纵域）以及真实的机器人实验中验证了该方法。

AM 10:26twitter.com

登录后评论

暂无评论~

登录

文章库