Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

魔王机器之心报道

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

在游戏里训练「神经网络小怪兽」,学习强化学习!

想了解神经网络,但不知道如何入手?教程太枯燥,论文不好懂?

别怕,这里有款多人在线战术竞技游戏(MOBA),让你在西部牛仔的世界中训练自己的神经网络。在这里,所有「智能体」都是类似怪兽的生物,还有武器!

故事的背景是:Derk 博士想要创建一个具备「神经网络」大脑的生物。

这款名为「Dr. Derk's Mutant Battlegrounds」的游戏是一个基于 AI 的实验性游戏。玩家的任务是武装自己的小怪兽(Derkling)并训练,与其他玩家进行 battle。

而这些小怪兽其实是货真价实的 AI:循环神经网络(RNN)。它具备 30 个输入、12 个输出、32 个记忆插槽(memory slot)、1 个隐藏层和 3000 多个参数,能够「看到」30 多项事物,还能自主决策。

 哇,神经网络这么 cute 吗!是不是很想赋予它超能力?

闯关和 battle 胜利,你就可以升级小怪兽的能力和装备!而这对玩家的挑战在于:选择最好的装备和训练策略。

在这个游戏环境中,有大量策略可供探索,玩家可以教小怪兽进行大量尝试。比如教它们如何治疗上单,穿过敌人的队伍直达敌军老巢(雕像),或者戏耍对手…… 玩家可以在这里尽情尝试和探索不同的策略。

经过多次迭代,小怪兽终于直达敌军老巢,干掉了敌方的雕像。

小怪兽升级装备了,有枪!

这次不再是与游戏内置的 boss 对战,而是玩家团战。看起来战况很激烈!

Derk 博士使用了哪些技术,帮助小怪兽成长

就整体技术而言,这款游戏使用的技术类似于 OpenAI Five。OpenAI Five 两年前打败了 Dota 2 人类玩家,不过这款游戏中的小怪兽的脑袋远不如「OpenAI Five」那么强悍。

此外,这款游戏的技术细节还包括:
  • 小怪兽通过 GA 在并行运行的 128 个「竞技场」(arenas)上进行训练;

  • 所有的模拟和神经网络均在 GPU 上运行,方便快速获取结果(在一台性能不错的计算机上 1 分钟内即可训练 200 代);

  • 智能体可以和游戏内置机器人 PK,也可以互相 battle(自对弈),或者将这两者结合起来;

  • 对于想要深度挖掘小怪兽的「大脑」,充分理解其行为的人而言,这款游戏提供了不错的可视化效果。

目前,这款游戏已发布到 Steam。

参考链接:

https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/
https://www.youtube.com/watch?time_continue=27&v=-Lqb8cce5tk&feature=emb_logo
https://derkgame.com

入门神经网络训练游戏
相关数据
神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

推荐文章
暂无评论
暂无评论~