伦敦帝国学院新研究论文,「具有质量多样性和无监督描述符的自主技能发现」
机器之心获悉,一篇名为「具有质量多样性和无监督描述符的自主技能发现」的论文正在机器学习社群中获得关注,以下为论文概述:质量 - 多样性优化是一个新的优化算法系列,它不是搜索解决任务的单一最佳解决方案,而是搜索大量解决方案,这些解决方案都以不同的方式解决任务。这种方法特别适用于学习机器人中的行为,因为这种多样的行为能使机器人更具通用性和也更灵活机动。然而,这些算法要求用户手动定义行为描述,从而确定两个解决方案是否不同或类似。选择行为描述至关重要,因为它完全改变算法派生的解决方案类型。在本文中,我们介绍了一种通过将质量 - 分集算法与无监督降维算法相结合来自动定义该描述符的新方法。该方法使机器人能够在与环境互动时自主发现其能力范围。两个实验场景的结果表明,机器人可以自主发现大范围的可能行为,而无需事先了解其形态和环境。此外,这些行为被认为类似于使用领域知识的手工制作的解决方案,并且比使用现有的无监督方法时更加多样化。