杜伟机器之心报道

毛毛虫「忍者」:AI在《我的世界》中建城堡、公寓楼,还玩起了影分身

教 AI 玩游戏一直是非常有趣的研究课题,《我的世界》也成为了广大研究者的「实验田」。近日,哥本哈根信息技术大学等机构的研究者创建了一个神经网络系统,不仅可以在《我的世界》里建城堡、公寓楼、大树等复杂实体,还玩起了影分身。


作为一款风靡全球的沙盒游戏,《我的世界》(Minecraft)受到越来越多玩家的青睐。近年来,玩家也开创了越来越新颖的玩法。他们可以在游戏里举办毕业典礼、组建虚拟机玩 Doom 游戏,更有硬核学者在游戏里搭建神经网络,真是花样百出。

与此同时,人类已经不满足于自己玩游戏了,他们还想要人工智能(AI)在《我的世界》大展身手。2019 年,Facebook 研发了一款《我的世界》AI 助手 craftassist bot,这是一个智能协作式的助理机器人,可以执行人类玩家指定的各种任务,如驯服马匹、建造城市、与村民会面及交易等。

最近,哥本哈根信息技术大学、纽约大学和上海大学的研究者受到《生命游戏》中元胞自动机理论的启发,创建了一个使用 3D 神经元胞自动机(Neural Cellular Automata, NCA)的系统,并将该系统部署在了《我的世界》游戏里,发现 NCA 可以建造毛毛虫、城堡、公寓楼、树等复杂的实体,其中一些实体由 3000 多个块(block)构成。

蠕动的毛毛虫。图源:Science Magazine

城堡。图源:Science Magazine

公寓楼。

树。图源:Science Magazine

据介绍,在《我的世界》游戏中,研究者教会神经网络从单一立方块(single cube)发展成为城堡、公寓楼和大树等包含数千个块的复杂实体,以及毛毛虫等功能性机器(functional machine)。此外,当研究者将这些实体一切为二时,它们还会「重生」。

「一分为二」毛毛虫的重生过程。

目前,这项研究的相关论文已经发表。未来,研究者将进一步训练这种神经网络系统,希望不仅仅生成预定义的实体,还能够出现执行特定任务的新设计,如飞行等。


 论文地址:https://arxiv.org/pdf/2103.08737.pdf

论文解读

神经元胞自动机(NCA)已被证明能有效地模拟形态发展过程,即从极少数起始 cell 连续构建复杂结构。最近关于 NCA 的研究都在 2D 领域,即从单个像素或无限增长的二维纹理重建目标图像。

为了提高 NCA 在真实世界应用的泛化能力,研究者在 Mordvintsev 等人(2020)研究的基础上进行了扩展,以促进三维复杂结构的生成。

具体来说,该研究开发了一个 3D NCA 来生成 3D 《我的世界》结构和功能机器人,如下图 1 所示:

该研究训练 NCA 通过一系列的《我的世界》设计重建任务来生成多达 3584 块和 50 种独特的块类型的复杂结构。《我的世界》对该研究提出的方法具有较好的测试能力,因为它允许创建静态和动态结构。结果表明,在大多数情况下,NCA 可有效的扩展到 3D,能够从单个 cell 中生成复杂的实体。NCA 也拥有与 2D 版本相同的「再生」特性。

 对于不同数量的独特块类型(unique block types),NCA 重建结构的能力具有鲁棒性,如下图 2 所示:

尽管有简单和局部的单独更新,该研究提出的 NCA 能够生成复杂的结构,几乎与目标相同。对于增加单独的块类型数量,NCA 也能很好的扩展,如下图 3 所示:

NCA 在复制功能机器方面也很成功,如下图 5 所示:

不过,也有失败的时候:

 更多实现细节,请参考论文原文。

参考链接:
https://hot.cnbeta.com/articles/game/883945.htm
https://www.youtube.com/watch?v=V8Npzx67Kqw
https://www.sciencemag.org/news/2021/03/watch-artificial-intelligence-grow-walking-caterpillar-minecraft

理论神经网络系统AI《我的世界》
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

神经元技术

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

推荐文章
暂无评论
暂无评论~