佐治亚理工学院人工智能新研究,用行动建议改善 Minecraft 中的深层强化学习
近日,佐治亚理工学院人工智能实验室一篇研究论文再社群中引发热议,在 3D 虚拟环境中训练深度强化学习代理复杂行为需要大量的计算资源。在高度混叠环境中尤其如此,许多状态共享几乎相同的视觉特征。Minecraft 是这种环境的典范。我们假设交互式机器学习(IML),其中人类教师在训练中起直接作用通过演示,批评或行动建议,可以减轻智能体对别名的敏感性。但是,互动机器学习仅在人类交互的数量有限时才实用,需要在人类教师努力和代理人表现之间取得平衡。我们用两种强化学习算法进行实验。