行业内参

AI Daily

AI Daily 快讯 · 2019/02/11

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

因果推理能力可能是自然智能的重要组成部分，如何让机器具备这样的能力也一直是个重要的研究方向。不久之前，DeepMind、伦敦大学学院和哈佛大学的研究者探索了通过元强化学习实现因果推理的方法。研究者使用无模型强化学习训练了一个循环网络来求解一系列包含因果结构的问题。研究发现，训练后的智能体能够在全新的场景中执行因果推理，从而获得奖励。智能体可以选择信息干预、根据观察数据得出因果推论以及做出反事实的预测。

PM 1:44arxiv.org

登录后评论

暂无评论~

登录

文章库