蛋酱编辑

谷歌研究科学家Kevin P. Murphy概率机器学习经典教材再版,PDF免费下载

谷歌研究科学家 Kevin P. Murphy 的概率机器学习书籍即将发行第二版了。经历了近十年的发展之后,这本人工智能领域经典书籍的内容丰富了不少(从页数上也能看出来)。

机器学习领域,不管是学生、研究人员还是业界人士,都应该读过一本名为《机器学习:基于概率论的观点》的书籍。


这是谷歌研究科学家 Kevin P. Murphy 撰写的经典机器学习图书,共 1100 页左右,自 2012 年由 MIT 出版社发行以来,广受好评。并获得了 2013 年 DeGroot 统计科学领域最佳书籍奖。

有人说,这是自己心目中 ML 领域三大经典教材之一。


还有人说,这本书适合「没时间看 Paper 的自学民工」。


但也有很多读者发现,这本书中出现的印刷错误较多。Anyway,它仍然不失为一本优秀的机器学习书籍。

近日,作者 Kevin P. Murphy 正式宣布,该书籍将在 2021 年再版,内容更新、更全。



在加入谷歌之前,Kevin P. Murphy 是不列颠哥伦比亚大学(UBC)的终身副教授。他在加州大学伯克利分校获得博士学位。

Kevin P. Murphy 提到:「在 2020 年春天,第二版的草稿已经差不多 1600 页了。不过 MIT 出版社告诉我,他们无法出版一本 1600 页的书籍,因此我将其拆分成了两卷,并寻求了几位同事的帮助,来完成最后 15% 的部分。」

现在的结果是,将会在有两本新的书籍出版。一本是《概率机器学习:简介(Probabilistic Machine Learning: An Introduction)》,PDF 版本和 Python 代码目前已经发布;一本是《概率机器学习:进阶(Probabilistic Machine Learning: Advanced Topics)》,为第一本的续,内容正在准备中,预计 2022 年出版。

每本书都加入了很多新的材料,包括深度学习领域的一些主题以及其他进展,比如生成模型、变分推理、强化学习等。为了让这一版内容自成一体,作者还增添了一些例如优化和线性代数方面的背景内容。

书籍第一卷整体目录如下:

在短目录之后,书内也提供了详细的长目录。

书籍 PDF 地址:https://github.com/probml/pml-book/releases/download/2020-12-28/pml1-2020-12-28.pdf


另外一个重要变化是,这版所有的软件都是使用 Python 而不是 Matlab。新的代码使用的是标准 Python 库,如 Numpy、Scipy、Scikit-Learn 等。一些示例特使基于各种深度学习库,如 TensorFlow、PyTorch 和 JAX。几乎每一章都有 Jupyter 笔记本,讨论了书中正文没有空间讨论的实际问题。


阿姆斯特丹大学教授、高通技术副总裁 Max Welling 推荐说:「这是当前机器学习最全面和最易理解的书,还涵盖了深度学习和因果发现的最新进展。这次更新之后,它仍然是我们这个领域的参考书籍,研究者应该将它摆在办公桌上。」

牛津大学计算机系副教授、艾伦图灵研究所研究员 Yarin Gal 表示:「现在有很多关于机器学习的书,但没有一本像这本一样全面。对于这本书所做的大量工作,我感到惊讶,很多人肯定会用它来培养下一代机器学习专家。」

第二卷内容也正在准备中,目录如下:



只是希望这次,不要再在收藏夹里吃灰了……


「20分钟翻完50页,然后永远不再见?」

Powered by Froala Editor

入门概率机器学习Kevin P. Murphy
1
相关数据
艾伦图灵人物

英国数学家、逻辑学家,被称为计算机之父,人工智能之父。图灵对于人工智能的发展有诸多贡献,提出了一种用于判定机器是否具有智能的试验方法,即图灵试验。1931年图灵进入剑桥大学国王学院,毕业后到美国普林斯顿大学攻读博士学位。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

线性代数技术

线性代数是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

Jupyter技术

Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等 。

推荐文章
暂无评论
暂无评论~