DeepMind 开源3D人工智能训练平台(附论文和视频)

DeepMind 的科学任务就是推进人工智能边界,研发无师自通、解决任何复杂问题的系统。为此,我们从这样一个前提出发:人工智能应该是通用的。智能体应该可以用于广泛任务当中并能自动适应变化中的环境。也就是说,它们不应该是预编程的,毋宁能从初始输入以及环境奖励信号中自动学习。这一研究有两部分:(1)设计更加智能的智能体,具有越来越成熟的认知技能,以及(2)打造日趋复杂的环境,可在其中训练和评估智能体。

视频 Laser Tag Space Bounce Level

创新智能体的研发,与谨慎设计以及理性挑选、灵活以及维护良好的环境实现密不可分。为此,我们花费大量精力打造丰富模拟环境,作为人工智能研究实验室。现在,我们正在开源我们的旗舰平台——DeepMind Lab,因此,更为广大的社区就能用到它。

视频 Nav Maze

DeepMind Lab 是一个类全3D游戏平台,为基于智能体的人工智能研究量身打造。通过模拟智能体的眼睛,从第一人称视角进行观察。我们使用丰富的科幻式视觉效果进行诠释。智能体可以在3D环境中环顾四周并进行移动。智能体的身体是一个悬浮圆形物,并配有一个摄像头,它能围绕主球面移动,充当追踪旋转观察动作的球窝关节。样本游戏包括收集水果、在迷宫中移动、横穿危险通道同时避免掉下悬崖、使用发射台跃于两个平台之间、玩激光标签以及迅速学习并记忆随机生成的环境。智能体如何感知并与世界互动的图解如下:

DMLab-Blog-Figure1-161202-r01%20%281%29%20%281%29%20%281%29%20%281%29.width-1500.png

智能体将世界视为一张图像,以像素的方式,从自己第一人称视角进行诠释。他们也会收到奖励或惩罚信号。智能体能够激活其推进器进而在3D环境中移动,也能沿着水平、垂直轴线转动视角。

DeepMind 的人工通用智能研究强调导航、记忆、第一任人称的3D视角、行动控制、计划、策略、时间以及全自动化智能体,必须能通过探索自己周边环境自学任务内容。所有这些因素让学习变得困难。每个内容都有资格被视为更加前沿的研究问题。像我们这样将它们放在一个平台上,是对这一领域的新的重要挑战。

视频Stairway to Melon

DeepMind Lab 高度可自定义、可延展。使用现成的编辑工具就能达到新级别(level)。此外,DeepMind Lab 包含一个进行 programmatic level-creation 的接口。使用 gameplay logic、item pickups、custom observations、level restarts、reward schemes、in-game messages 等更多工具可自定义出更高的级别。该接口可被用于创造这样的级别:在智能体训练时生成全新地图布局。这些特征在测试智能体是否适应不熟悉环境时非常有用。用户可以通过 Github 为该平台增加自定义级别。该资源以及所有的代码、地图和 level scripts 都被托管在了 Github 上。我们希望社区能帮助我们更进一步塑造以及开发该平台。


DeepMind Lab 已在 DeepMind 内部被使用了一段时间了(案例:突破 | DeepMind为强化学习引入无监督辅助任务,人工智能的Atari游戏水平达到人类的9倍)。我们相信它对我们从多个方面思考智能有着极大的影响。然而,目前我们的努力只触摸到 DeepMind Lab 的表面。通过 DeepMind Lab,在大量仍未触及的研究领域中,也有机会作出有极大意义的贡献,比如导航(navigation )、记忆(memory)和探索(exploration)。


和促进智能体(facilitating agent)评估一样,也有强有力的理由让人相信在 3D 世界中以第一视角开发智能更为简单,例如 DeepMind Lab。毕竟,在自然世界我们所知的通用智能的唯一案例就来自于进化、发育和学习的结合,以动物的身体和感官器官为基础。人类与动物智能的一大部分有可能是环境引发的直接结果,没有环境不太可能产生这种智能。替代思考一下:如果你或我生长在 Space Invaders (游戏名) 或 Pac-Man 这样的环境中,可能我们就无法获得很多的通用智能! 


入门Deepmind游戏工程文体娱乐DeepMind Lab
暂无评论
暂无评论~