Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

理查德S.萨顿

相关技术:策略迭代

简介

Richard S. Sutton 教授博士毕业于马萨诸塞大学安姆斯特分校,现任阿尔伯塔大学计算机科学教授。Sutton 教授被认为是现代计算的强化学习创立者之一。他为该领域做出了许多重大贡献,包括:时间差分学习(temporal difference learning)、策略梯度方法(policy gradient methods)、Dyna 架构

合作机构
    简介
    合作机构
    相关人物