今天,Facebook 人工智能研究院(FAIR)开源了围棋 AI ELF OpenGo,它基于现有的强化学习研究平台 ELF,击败了世界围棋冠军。Facebook 今日开源了其训练模型及代码。
受 DeepMind 的启发,Facebook 在今年早些时候开始了一项工作,使用其强化学习研究平台 ELF 复现 DeepMind 最新的 AlphaGoZero 成果。
Facebook 的目标是创建一个开源的系统实现,该系统将自学如何以人类专业选手或更高的水平下围棋。通过发布代码和模型,Facebook 希望能启发其他人思考该技术的新应用和研究方向。
ELF OpenGo 成功打败其他开源机器人和人类围棋选手。Facebook 和现在著名的 LeelaZero 进行了对比,采用了 LeelaZero 除 ponder 外的缺省配置,及 4 月 25 日的公开权重 (192x15, 158603eb),结果 Facebook 的 AI 以 200 比 0 获胜。Facebook 的 AI 还在与 4 名世界排名前 30 的人类围棋选手对弈时创下了 14 胜 0 负的记录。这些游戏都使用单个 GPU 运行,每一步大约耗时 50 秒,中国规则 7.5 komi,人类选手每一步思考时间不限。Facebook 很感谢 LeelaZero 团队的高质量工作,希望此次开源可以像 LeelaZero 那样有益于社区。感谢四名来自韩国棋院的围棋选手 Kim Jiseok、Shin Jinseo、Park Yeonghun 和 Choi Cheolhan 的积极参与。
Facebook 还对 ELF 框架进行了一些改进,更新后的框架效率更高、API 更友好,且支持数千台机器上的分布式计算。作为 PyTorch 的一部分,ELF 框架使得研究者用快捷灵活的实验尝试强化学习的不同想法更加简单。
ELF OpenGo 代码和模型地址:https://facebook.ai/elf。