DeepMind发表深度强化学习又一力作
近日DeepMind研究员发表论文Randomized Prior Functions for Deep Reinforcement Learning, 以下是摘要:处理不确定性对于有效的强化学习至关重要。 关于固定数据集深度学习的不确定性估计的文献越来越多,但许多最流行的方法都不适合顺序决策问题。 其他方法,例如自举采样,没有来自观察数据的不确定性机制。 我们强调为什么这可能是一个关键的缺点,并通过为每个集合成员添加一个随机的无法先验网络来提出一个简单的补救措施。 我们证明了这种方法对线性表示是有效的,通过非线性表示提供了其效率的简单说明,并表明这种方法比以前的尝试更好地扩展到大规模问题。(Google)