Facebook 的 AI 通过观看视频了解如何绕过办公室
人类每天都在进行高层次的规划,但机器人并不容易。幸运的是,越来越多的工作表明,层级抽象(即视觉运动子程序)可以提高强化学习中的样本效率,这是一种人工智能训练技术,它利用奖励来推动智能体实现目标。传统上,这些层次结构必须通过端到端训练进行手动编码或获取,这需要时间、注意力和耐心。但是在 Arxiv.org 上新发布的论文(「通过观看视频学习导航子程序」)中,Facebook AI Research、加州大学伯克利分校和伊利诺伊大学厄巴纳 - 香槟分校的科学家描述了一个通过以下方式学习层次结构的系统使用逆机器学习模型摄取视频「伪标记」。
这让人想起去年 Facebook 开源的一对模型,可以使用 360 度图像、自然语言以及银行和餐馆等当地标志性地图来指导纽约市的街道。(Venturebeat)