文章库
PRO通讯会员
SOTA!模型
AI 好好用
登录
行业内参
AI Daily
AI Daily 快讯 · 2019/06/18
DeepMind 推出用于顺序决策的元学习代理模型
DeepMind 的研究人员引入了一个统一的概率框架来解决从贝叶斯优化到contextual bandits框架以及强化学习的顺序决策问题。该框架基于概率模型的方法,并能够在解释观察到的数据的同时,在决策过程中捕获预测不确定性。这种概率模型被选择为元学习系统,它允许从相关问题的分布中学习,允许数据有效地适应目标任务。研究人员将该框架应用于如控制问题,推荐系统和对 RL 代理的对抗性攻击等广泛的问题领域,展示了一种高效且通用的黑盒学习方法。
登录
后评论
暂无评论~
登录
去登录
文章库
PRO会员通讯
SOTA!模型
AI 好好用
文章库
PRO通讯会员
SOTA!模型
AI 好好用
登录