DeepMind AI 可学习游戏玩家的策略以及分析策略弱点
在 Arxiv 上发表的一篇论文中,Alphabet 的 DeepMind 的科学家们提出了一个新的框架,该框架可以学习在多种游戏中对玩家的近似最佳反应。DeepMind 首席执行官 Demis Hassabis 经常断言,游戏是开发算法的便捷试验场,这些算法可以转化为现实世界,以解决难题。这样,像这种新框架的创新可以为人工智能(AGI)奠定基础。DeepMind 研究人员提出的框架,他们称可在信息状态基础上达到近似精确的最佳响应。框架内的参与者遵循一种算法来玩游戏,而学习者则从各种游戏结果中获取信息以训练策略。研究人员报告说,在涉及 200 名参与者(在装有 4 个处理器和 8GB RAM 的 PC 上训练)和一个学习者(10 个处理器和 20GB RAM)的实验中,ABR IS-MCTS 在 Hex 或 Go 以外的游戏中每场比赛的胜率均超过 50%。(VentureBeat)