AI 的宝可梦之旅。
项目地址:https://github.com/PWhiddy/PokemonRedExperiments 视频地址:https://www.youtube.com/watch?v=DcYLT37ImBY
作者将 AI 行为与人类类比
将问题简化,以避免工具、资源的限制。 接下来,在合理的时间和成本内迭代实验的设置非常重要。 然后需要仔细考虑 AI 如何与环境交互以及奖励函数如何设计。在视频中,作者对他所用到的奖励函数已经有所介绍,但是受制于篇幅,并没有介绍全部。它使用到了至关重要的七个函数,实际上还有更多的并没有测试或是最终使用。 通过可视化的方法了解 AI 的行为。