Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

陈萍编辑

告别「高斯过程」黑箱,这个项目可交互,效果惊艳

高斯过程可以让我们结合先验知识,对数据做出预测,最直观的应用领域是回归问题。如何用可视化生动地讲解高斯过程的相关知识,以直观地了解高斯过程的工作原理,或许,你应该了解一下这个高斯可视化项目。
机器学习领域, 大家可能都知道贝叶斯概率,但少有人了解高斯过程(Gaussian Processes)。高斯过程是概率论和数理统计中随机过程的一种,是多元高斯分布的扩展,被应用于机器学习信号处理等领域。它让我们得以结合先验知识,对数据做出预测。它最直观的应用领域是回归问题,比如在机器人学里应用广泛。同时,我们也可以将其拓展到分类和聚类任务里。

对于大多数研究者来说,算法的实现过程充满了「黑箱操作」。但是,如果有可视化加持,就会起到事半功倍的效果。

下面我们介绍一个可视化项目,该项目为交互式高斯过程可视化,由 Svelte,D3.js 和 ml-matrix 构建而成,旨在帮助研究者直观地理解先验和后验核函数

项目地址:https://github.com/st--/interactive-gp-visualization/
可视化地址:http://www.infinitecuriosity.org/vizgp/

交互式高斯过程可视化

首先,我们先来看下可视化效果,具体实现细节请参考项目。

使用者还可以进行各种设置,比如在可视化设置中,可以设置采样数目,选择重采样或是暂停。

整体演示效果如下:

如何开始?首先需要安装各种依赖项,代码如下:

# cd into this directory
npm install

然后运行如下代码:

npm run dev

导航到 localhost:5000(http://localhost:5000/)。可以看到应用程序在运行,在 src 中编辑一个组件文件保存,重新加载页面以查看更改。

默认情况下,服务器只响应来自本地主机的请求。要允许从其他计算机连接,需要编辑包 package.json 中的 sirv 命令以包含选项——host 0.0.0.0。

如果你使用的是 Visual Studio Code,建议你安装 VS Code 官方扩展 Svelte 。如果你正在使用其他编辑器,你可能需要安装一个插件来获得语法高亮和智能提示。

项目作者

项目作者 Ti 拥有物理学博士学位和超过 20 年的编程经验。Ti 在 Secondmind 公司的概率建模团队中担任高级机器学习研究员已经四年,研究领域包括高斯过程以及其他概率模型的研究。

工程可视化高斯过程
2
相关数据
重采样技术

重采样是指根据一类象元的信息内插出另一类象元信息的过程。在遥感中,重采样是从高分辨率遥感影像中提取出低分辨率影像的过程。常用的重采样方法有最邻近内插法(nearest neighbor interpolation)、双线性内插法(bilinear interpolation)和三次卷积法内插(cubic convolution interpolation)。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

高斯分布技术

正态分布是一个非常常见的连续概率分布。由于中心极限定理(Central Limit Theorem)的广泛应用,正态分布在统计学上非常重要。中心极限定理表明,由一组独立同分布,并且具有有限的数学期望和方差的随机变量X1,X2,X3,...Xn构成的平均随机变量Y近似的服从正态分布当n趋近于无穷。另外众多物理计量是由许多独立随机过程的和构成,因而往往也具有正态分布。

核函数技术

核函数包括线性核函数、多项式核函数、高斯核函数等,其中高斯核函数最常用,可以将数据映射到无穷维,也叫做径向基函数(Radial Basis Function 简称 RBF),是某种沿径向对称的标量函数。最常应用于SVM支持向量机中

随机过程技术

在概率论概念中,随机过程是随机变量的集合。若一随机系统的样本点是随机函数,则称此函数为样本函数,这一随机系统全部样本函数的集合是一个随机过程。实际应用中,样本函数的一般定义在时间域或者空间域。随机过程的实例如股票和汇率的波动、语音信号、视频信号、体温的变化,反对法随机运动如布朗运动、随机徘徊等等。

高斯过程技术

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

推荐文章
暂无评论
暂无评论~