概率矩阵分解

许多现有的协同滤波算法既不能处理非常大的数据集,也不能轻松处理那些有很少数据的用户。通过使用概率矩阵分解(PMF)模型,可以在大型、稀疏且不平衡的数据集上有很好的表现。以用户-项目评分矩阵为例,矩阵分解就是预测出评分矩阵中的缺失值,然后根据预测值以某种方式向用户推荐。

简介

描述

矩阵分解是一种基本的数学算法,可用于推荐算法中,根据用户的喜好来进行相关推荐。2008年,Andriy Mnih等人提出了概率矩阵分解,并将其应用于大型、稀疏且不平衡的数据集上,获得了很好的效果。在2008年,基于PMF提出了几个改进算法,如贝叶斯概率矩阵分解和核概率矩阵分解等,都在推荐系统中获得了很好的结果。2009年,Yehuda Koren等人对现有的矩阵分解算法进行了对比和总结。

主要事件

2008

Andriy Mnih等人提出了概率矩阵分解

Mnih A, Salakhutdinov R R. Probabilistic matrix factorization[C]//Advances in neural information processing systems. 2008: 1257-1264.

2008

提出了贝叶斯NMF,通过使用MCMC(Markov chain Monte Carlo)进行模型中的近似推理,证明了在面对大数据集的情况下,MCMC也可以获得很快的速度。并且贝叶斯NMF获得了很好的效果。

Salakhutdinov R, Mnih A. Bayesian probabilistic matrix factorization using Markov chain Monte Carlo[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 880-887.

2009

Yehuda Koren等人对现有的矩阵分解算法进行了对比和总结

Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8).

2012

提出了kernel NMF

Zhou T, Shan H, Banerjee A, et al. Kernelized probabilistic matrix factorization: Exploiting graphs and side information[C]//Proceedings of the 2012 SIAM International Conference on Data Mining. Society for Industrial and Applied Mathematics, 2012: 403-414.

发展分析

瓶颈

概率矩阵分解算法中的正则化参数对应的是点估计,在参数选择的不合适时容易发生过拟合。

未来发展方向

概率矩阵分解算法在提高推荐质量的同时可以在大数据环境下保证计算的时间和计算资源的瓶颈问题。针对算法面对的未来发展需要,在保证推荐质量的前提下,与其他并行算法相结合,提高算法在工程应用中的速率。

Contributor: Yilin Pan

相关人物
Chris Volinsky
Chris Volinsky
Michael R. Lyu
Michael R. Lyu
拉斯 · 萨拉克赫迪诺弗
拉斯 · 萨拉克赫迪诺弗
CMU 机器学习教授,苹果人工智能研究负责人。Ruslan Salakhutdinov 于 2009 年从多伦多大学获得机器学习(计算机科学)博士学位,之后在 MIT 人工智能实验室渡过了两年博士后生涯,后来加入了多伦多大学计算机科学与统计部做助理教授。2016 年 1 月,CMU 宣布邀请 Russ Salakhutdinov 作为机器学习部门的副教授。他的主要研究兴趣包括人工智能、机器学习、深度学习、大规模优化。
Irwin King
Irwin King
简介
相关人物