伯克利人工智能实验室,无奖励的端到端深层强化学习
伯克利人工智能实验室的研究人员们开发了一种端到端的方法,帮助机器人在没有手动奖励的情况下从一定数量的描述成功完成任务的图像中学习。机器人将利用大约 80 个图像开始学习,并偶尔向用户查询其他标签。在查询过程中,机器人将向用户显示图像并要求用户标签以确定该图像是否表示任务的成功完成。研究人员们设定了大约 25 到 75 个此类查询,通过使用这些查询,机器人能够在 1-4 小时的交互时间内直接在现实世界中学习。据了解,该方法为目前现实世界中最高效的基于图像的机器人机器学习方法之一,研究团队已开源这一实验。