谷歌推出 RecSim—推荐系统的可配置仿真平台
机器学习、语音识别和语言技术方面的重大进步正在迅速改变推荐系统与用户互动的方式。其结果是,使协作交互式推荐器(CIR)能达到与用户进行有意义的交互序列,以最好地满足该用户的需求,已经成为在线服务的切实目标。尽管如此,CIR 的部署受到开发算法和模型的挑战的限制,这些算法和模型反映了顺序用户交互的定性特征。强化学习是解决顺序决策问题的事实上的标准机器学习方法,因此是在推荐系统中建模和优化顺序交互的自然范例。但是针对 CIR,无论是在研究还是在实践中,它都未得到充分研究和利用。一个主要障碍是缺乏用于顺序推荐器设置的通用仿真平台,而仿真已成为在诸如机器人技术的现实应用中开发和评估强化学习算法的主要手段之一。为了解决这个问题,谷歌宣布其开发了 RᴇᴄSɪᴍ,一个可配置的平台—用于编写仿真环境,以促进推荐系统(尤其是 CIR)中的强化学习算法研究。RᴇᴄSɪᴍ允许研究人员和从业人员在综合推荐环境中测试现有方法的限制。RecSim 的目标是支持真实推荐系统中用户行为特定方面的模拟,并作为受控环境来开发、评估和比较推荐器模型和算法。(Google AI Blog)