PCGRL:通过强化学习生成程序内容
纽约大学和 modl.ai 的研究人员近日发表了一篇新论文,介绍了通过强化学习生成过程性内容(PCGRL),这是过程性内容生成的新范例。他们研究了如何使用强化学习来训练游戏中的关卡设计智能体。这代表了一种在游戏中生成程序性内容的新方法,其中关卡设计被设计为游戏,并且内容生成器本身则被作为学习对象。通过将设计问题视为顺序任务,他们可以使用强化学习来学习如何采取下一步行动,以使预期的最终关卡质量最大化。他们研究了将二维关卡设计问题转换为 Markov 决策过程的三种不同方式,并将其应用于三种游戏环境。