行业内参
AI Daily
AI Daily 快讯 · 2019/06/28
DeepMind 新论文:规范化机器人成分转移的层次策略
数据效率是在物理系统上应用强化学习的主要挑战之一,DeepMind 的研究团队使用分层模型来加强转移,同时减轻负面干扰来为物理机器人节省数周的训练时间。研究人员以结构化政策的形式开发和研究简单的层次归纳偏差,作为强化学习(RL)中任务之间知识转移的机制,并设计了一种能够实现稳定快速学习的 RL 算法来利用这些结构化策略的强大功能。研究人员在模拟机器人环境(使用运动和操纵域)以及真实的机器人实验中验证了该方法。
登录
后评论
暂无评论~
登录
去登录
文章库
PRO会员通讯
SOTA!模型
AI 好好用
文章库
PRO通讯会员
SOTA!模型
AI 好好用
登录