数据驱动的深度强化学习
加州伯克利大学人工智能实验室近日发表新技术文章,文章介绍道:机器学习方法在开放世界环境下(例如图像识别和自然语言处理)成功背后的主要因素之一,是高容量的深度神经网络功能逼近器能够从大量数据中学习通用模型的能力。但是,深度强化学习方法需要主动的在线数据收集,其中模型会与其环境进行主动交互。这使得此类方法难以扩展到复杂的现实世界问题,在这些问题中,主动数据收集意味着必须为每个实验收集大量的经验数据集 - 这可能是昂贵的,并且对于自动驾驶汽车或机器人等系统而言可能并不安全。在许多实际感兴趣的领域例如自动驾驶,机器人技术和游戏中,存在大量以前收集的交互数据,这些数据由信息行为构成,这些信息行为是丰富的先验信息。可以利用这些先有数据集的 Deep RL 算法不仅可以扩展到实际问题,而且可以带来总体上更好的解决方案。强化学习的数据驱动范例将使我们能够预先训练和部署能够在现实世界中进行高效样本学习的智能体。