Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

非负矩阵分解

简介

非负矩阵分解是矩阵分解领域的重要分支,应用于现实生活中的数据降维,例如文本数据、时间序列数据、图像数据、基因检测数据以及语音识别等。对于给定的非负矩阵$V=[v_1,v_2,...,v_n]$,表示有N个数据点,假设每个样本数据点对应的维度为M,非负矩阵V可以分为两个非负矩阵,即V≈WH,其中基矩阵W=[w_1,w_2,...,w_d],w_i是M维向量,系数矩阵H=[h_1,h_2,...,h_N],h_i是d维的特征。分解之后的W可以看作是V的一个低维空间的系数表示,V可以看作W中的基向量的加权和。表示为图像分解的形式如下图所示:

[描述来源:Lee, D. D., & Seung, H. S. (1999). Learning the parts of objects by non-negative matrix factorization. Nature, 401(6755), 788.]

发展历史

NMF提出于1999年。为了近似原高维矩阵,研究人员提出了很多方法,如2001年提出的加入正交化的非负矩阵分解和2003年提出的基于拉格朗日的非负矩阵分解的方法。2006年,提出了基于NMF的半监督多标签分类方法。2012年,Kim提出了基于组系数的非负矩阵。2014年,为提高矩阵分解的速度,提出了快速的非负矩阵分解。

主要事件

年份事件相关论文/Reference
1999首次提出NMF算法,并提出了经典的NMF迭代规则,广泛的应用于NMF算法优化规则Lee, D. D., & Seung, H. S. (1999). Learning the parts of objects by non-negative matrix factorization. Nature, 401(6755), 788.
2001加入了正交化的非负矩阵分解Li, S. Z., Hou, X. W., Zhang, H. J., & Cheng, Q. S. (2001). Learning spatially localized, parts-based representation. In Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on (Vol. 1, pp. I-I). IEEE.
2003基于拉格朗日的非负矩阵分解Liu, W., Zheng, N., & Lu, X. (2003, April). Non-negative matrix factorization for visual coding. In Acoustics, Speech, and Signal Processing, 2003. Proceedings.(ICASSP'03). 2003 IEEE International Conference on (Vol. 3, pp. III-293). IEEE.
2003基于标准的NMF和加权NMF的分类算法Guillamet, D., Vitria, J., & Schiele, B. (2003). Introducing a weighted non-negative matrix factorization for image classification. Pattern Recognition Letters, 24(14), 2447-2454.
2006基于NMF的半监督多标签分类算法Liu, Y., Jin, R., & Yang, L. (2006, July). Semi-supervised multi-label learning by constrained non-negative matrix factorization. In AAAi (Vol. 6, pp. 421-426).
2012Kim等人提出了组系数非负矩阵分解Kim, J., Monteiro, R. D., & Park, H. (2012, April). Group sparsity in nonnegative matrix factorization. In Proceedings of the 2012 SIAM International Conference on Data Mining (pp. 851-862). Society for Industrial and Applied Mathematics.
2014基于加权NMF的KNN算法,用于数据分类Kalayeh, M. M., Idrees, H., & Shah, M. (2014). NMF-KNN: Image annotation using weighted multi-view non-negative matrix factorization. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 184-191).
2014-2015快速的非负矩阵分解快速发展(1)Gillis, N., & Vavasis, S. A. (2014). Fast and robust recursive algorithmsfor separable nonnegative matrix factorization. IEEE transactions on pattern analysis and machine intelligence, 36(4), 698-714. (2)Chin, W. S., Zhuang, Y., Juan, Y. C., & Lin, C. J. (2015). A fast parallel stochastic gradient method for matrix factorization in shared memory systems. ACM Transactions on Intelligent Systems and Technology (TIST), 6(1), 2.
2015对称的NMF和加权对称的NMFCabral, R., De la Torre, F., Costeira, J. P., & Bernardino, A. (2015). Matrix completion for weakly-supervised multi-label image classification. IEEE transactions on pattern analysis and machine intelligence, 37(1), 121-135.

发展分析

瓶颈

非负矩阵分解现阶段存在的问题主要是以下三个部分:

  1. 参数的初始化设置
  2. 迭代算法的改进
  3. 子空间维数的确定

未来发展方向

非负矩阵分解的未来发展方向可以总结如下:

  1. 如何构造高效的NMF算法:现阶段需要多次迭代才可以收敛,并且面对大数据集时算法效率不高
  2. NMF的算法以及评价准则:一套完善的算法评价标准和准则是这个领域发展的重要组成部分
  3. 如何确定保留基的个数:现阶段多是通过经验确定,并在后期需要进行调整。

Contributor:Yilin Pan

简介