深度学习算法玩魔方的速度超过人类
DeepCubeA 是由 UCI 计算机科学家和数学家编写的深度强化学习算法,没有任何特定的领域知识或来自人类的游戏内辅导,它可以在几分之一秒内找到解决方案。考虑到立方体的完成路径编号为数十亿但只有一个目标状态 - 六个边中的每一个都显示纯色 - 这显然无法通过随机移动找到。对于今天发表在 Nature Machine Intelligence 上的一项研究,研究人员证明,DeepCubeA 解决了 100%的所有测试配置,在 60%的时间内找到了通往目标状态的最短路径。该算法还适用于其他组合游戏,如滑动拼图游戏,Lights Out 和 Sokoban。Rubik's Cube 的解决方案涉及更多的象征性,数学和抽象思维,因此破解这样一个难题的深度学习机器将越来越接近成为一个可以思考,推理,计划和制定决策的系统。」