使用 GPU 加速无监督降维算法 TSNE:从几小时到几秒
TSNE(T 分布随机邻域嵌入)是一种流行的无监督降维算法,其用途非常广泛,包括神经病学,图像相似性和可视化神经网络。但它的最大缺点是在大多数可用的实现中处理时间很长。RAPIDS 现在基于 CannyLab 开发的基于 GPU 的 Barnes-Hut 方法,提供了 GPU 加速的快速 TSNE。RAPIDS 的 cuML 机器学习库中的 TSNE 的运行速度比相应的 CPU 实施快 2,000 倍,并且比当前 GPU 版本使用的 GPU 内存少 30%。一名名为 Daniel Han-Chen 的机器学习爱好者在其博客介绍了一些相关用例示例,然后将 cuML 的 GPU TSNE 实现与 scikit-learn 进行比较的基准测试。最后,他详细解释了 TSNE 的工作方式以及如何在 cuML 中对其进行优化以在 GPU 上运行。