行业内参

AI Daily

AI Daily 快讯 · 2019/03/14

SkewFit:状态覆盖自监督强化学习

在论文《Skew-Fit: State-Covering Self-Supervised Reinforcement Learning》中，研究人员提出一种用以学习此类最大熵目标分配的Skew-Fit算法，并且显示在某些正则条件下，该方法能够收敛至包含可能状态组合的均匀分布，即使我们事先不清楚该组合也没关系。Skew-Fit使得自监督智能体能够自动选择和实践不同目标。实验表明，该算法可以学习各种各样的图像操作任务，包括真实机器人开门，这些完全都是从零开始，并且不存在任何人工设计的回报函数。

PM 5:44arxiv.org

登录后评论

暂无评论~

登录

文章库

文章库 PRO通讯会员 SOTA！模型 AI Shortlist

AI 好好用

登录