行业内参

AI Daily

AI Daily 快讯 · 2019/06/18

DeepMind 推出用于顺序决策的元学习代理模型

DeepMind 的研究人员引入了一个统一的概率框架来解决从贝叶斯优化到contextual bandits框架以及强化学习的顺序决策问题。该框架基于概率模型的方法，并能够在解释观察到的数据的同时，在决策过程中捕获预测不确定性。这种概率模型被选择为元学习系统，它允许从相关问题的分布中学习，允许数据有效地适应目标任务。研究人员将该框架应用于如控制问题，推荐系统和对 RL 代理的对抗性攻击等广泛的问题领域，展示了一种高效且通用的黑盒学习方法。

AM 6:02twitter.com

登录后评论

暂无评论~

登录

文章库