小舟报道

贝叶斯数据分析2021课程开课了,同名书籍作者主讲

3 月,宜学习。

机器学习领域,贝叶斯理论的强大体现在多个方面,包括贝叶斯推断超参数贝叶斯、非参贝叶斯等。此前,Nature 子刊刊登了一篇关于贝叶斯统计与建模的综述文章,引发广泛关注。近期,一门适合初学者的课程——阿尔托大学 2021 年贝叶斯数据分析课程正式开课了。

  • 课程主页:https://avehtari.github.io/BDA_course_Aalto/gsu2021.html

  • 课程资料:https://github.com/avehtari/BDA_course_Aalto

该课程使用的教材是由 Andrew Gelman、John Carlin、Hal Stern、David Dunson、Aki Vehtari 和 Donald Rubin 合著的《Bayesian Data Analysis,3rd ed》。课程讲师也是作者之一 Aki Vehtari。

书籍电子版链接:https://users.aalto.fi/~ave/BDA3.pdf

预备知识

该课程重点强调贝叶斯数据分析的计算层面,以及如何使用最新的计算工具。在学习这门课程之前,学生需要掌握以下知识:

概率论的基本术语,包括:
  • 概率、概率密度、概率分布

  • 求和、乘法法则、贝叶斯定理;

  • 期望、均值、方差、中位数;

相关知识的英文表述,参考资料:https://ocw.mit.edu/courses/mathematics/18-05-introduction-to-probability-and-statistics-spring-2014/readings/
  • 代数与微积分的部分知识;

  • 基本的可视化方法(使用 R 或 Python):

  • 直方图、密度图、散点图

该课程还给出了使用 R 或 Python 语言实现的 demo:https://avehtari.github.io/BDA_course_Aalto/demos.html

课程安排

本次课程于 3 月开课、5 月结束。

以下是部分课程安排:

除了课程安排,课程主页还提供了每节课的内容简介:

第 5 节课程的内容简介。

讲师介绍

本次课程的讲师是《Bayesian Data Analysis,3rd ed》的作者之一 Aki Vehtari,阿尔托大学计算机科学系副教授。他的研究兴趣是贝叶斯概率论和方法论、贝叶斯工作流、概率编程、推理方法(如 Laplace、EP、VB、MC)与模型诊断、模型评估与选择、高斯过程以及层次模型。

入门Aki Vehtari贝叶斯数据分析课程
2
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

概率分布技术

概率分布(probability distribution)或简称分布,是概率论的一个概念。广义地,它指称随机变量的概率性质--当我们说概率空间中的两个随机变量具有同样的分布(或同分布)时,我们是无法用概率来区别它们的。

贝叶斯推断技术

贝叶斯推断(英语:Bayesian inference)是推论统计的一种方法。这种方法使用贝叶斯定理,在有更多证据及信息时,更新特定假设的概率。贝叶斯推断是统计学(特别是数理统计学)中很重要的技巧之一。贝叶斯更新(Bayesian updating)在序列分析中格外的重要。贝叶斯推断应用在许多的领域中,包括科学、工程学、哲学、医学、体育运动、法律等。在决策论的哲学中,贝叶斯推断和主观概率有密切关系,常常称为贝叶斯概率。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

贝叶斯理论技术

贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。

高斯过程技术

微积分技术

微积分(Calculus)是高等数学中研究函数的微分(Differentiation)、积分(Integration)以及有关概念和应用的数学分支。它是数学的一个基础学科。内容主要包括极限、微分学、积分学及其应用。微分学包括求导数的运算,是一套关于变化率的理论。它使得函数、速度、加速度和曲线的斜率等均可用一套通用的符号进行讨论。积分学,包括求积分的运算,为定义和计算面积、体积等提供一套通用的方法 。

推荐文章
暂无评论
暂无评论~