参与魔王

我问了十多位机器学习专家,得到了这份书单

这些书籍涉及基础知识、编程技能、实践、理论等多个方面。经典的《深度学习》花书也在书单之中。

学机器学习难不难?小编以亲身经历告诉大家,难!读了好几遍「西瓜书」仍然一看公式就头大;三年前开始看吴恩达的课程,至今没看完…… 看来不好好学习是不行的。

国内学习机器学习的资源包括周志华老师的《机器学习》(西瓜书)、李航老师的《统计学习方法》、李宏毅老师的「宝可梦课程」等等,这些想必大家都比较熟悉了。

那么,机器学习专家和行业人士最喜欢读哪些机器学习书籍呢?最近,有人咨询了十多位机器学习研究者,包括斯坦福毕业生、谷歌大脑前员工 Denny Britz,维基媒体基金会机器学习负责人、《Machine Learning with Python Cookbook》作者 Chris Albon,老照片修复神器 DeOldify 的创造者 Jason Antic 等等。

这些专家列出了他们最喜欢的机器学习书籍,涵盖五个模块:基础、编程、实践、进阶领域,以及理论与历史。

读这些书,了解 ML 基础知识

要想理解机器学习概念,首先你需要了解基础知识。只知道概念还不够,你还需要理解概念的推导过程及运行原理。

机器学习专家推荐了以下书籍,帮助你掌握机器学习基础知识:

1. 《An Introduction to Statistical Learning》

书籍地址:https://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf

推荐人:维基媒体基金会机器学习负责人 Chris Albon

推荐语:这本书比较基础,清晰简洁地解释了机器学习概念,在本科生和研究生中广受欢迎。而且这本书对数学的要求不高。

2. 《The Elements of Statistical Learning》

书籍地址:https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf

推荐人:MentorCruise 数据科学讲师

推荐语:对于想要深入了解理论的同学,我推荐这本书。这本书的作者和《An Introduction to Statistical Learning》相同,但这本书更加深入,可以说是该领域的「圣经」了,而且可以免费获取。

3. 《Pattern Recognition and Machine Learning》

书籍地址:https://www.springer.com/gp/book/9780387310732?ref=mentorcruise

推荐人:斯坦福毕业生、谷歌大脑前员工 Denny Britz

推荐语:Bishop 撰写的这本关于模式识别的书籍很经典。这本书适合研究生学习,也适合机器学习研究人员和从业者阅读。它不是简单的课程笔记,而是一本真正的基础教材。

4. 《Mathematics for Machine Learning》

书籍地址:https://mml-book.github.io/

推荐人:自然语言处理和数据工程师 Stephen Gabriel

推荐语:这本书旨在鼓励人们学习数学概念,不涉及高阶的机器学习技术。这本书能够提供阅读其他进阶书籍所必需的数学知识。

5. 《Deep Learning》

书籍地址:https://www.deeplearningbook.org/?ref=mentorcruise

推荐人:Uizard 联合创始人、CEO Tony Beltramelli

推荐语:Goodfellow 等人撰写的这本《深度学习》被誉为深度学习领域的「圣经」。它由该领域先驱学者撰写,介绍了基础知识、高阶原则和方法。

6. 《Deep Learning from Scratch》

书籍地址:https://www.oreilly.com/library/view/deep-learning-from/9781492041405/?ref=mentorcruise

推荐语:对于初入该领域的编程人员来说,机器学习和深度学习令人望而生畏。这本书用实操的方式介绍了基础方法和实践。

软件和编程书籍

今天,编程是构建算法和复杂的机器学习系统的敲门砖。如果你想更快地成为机器学习专业人士,学习编程技巧是必要的。以下书籍可以帮助你开始学习编程的旅途:

1. 《The Pragmatic Programmer》

书籍地址:https://pragprog.com/titles/tpp20/?ref=mentorcruise

推荐人:DeOldify 创造者 Jason Antic

推荐语:我认为,软件编程和机器学习存在很多重叠,学习软件编程对于机器学习有很大益处。

2. 《Refactoring》

书籍地址:https://martinfowler.com/books/refactoring.html?ref=mentorcruise

推荐人:DeOldify 创造者 Jason Antic

推荐语:Martin Fowler 撰写的这本《Refactoring》是如何安全快速地转换代码的指南。

3. 《R for Data Science》

书籍地址:https://r4ds.had.co.nz/?ref=mentorcruise

推荐人:Kaggle 产品经理 Meg Risdal

推荐语:Python 不是唯一的选择!这本书旨在帮助你学习 R 语言中对于做数据科学最重要的工具。

机器学习实践

如果 idea 只存在脑海里,那机器学习就没意思了。以下书籍可以帮你设计现实机器学习算法,拓宽边界,解决你遇到的问题,构建机器学习系统。

1. 《Hands-on Machine Learning with Scikit-Learn, Keras and Tensorflow》

书籍地址:https://www.oreilly.com/library/view/hands-on-machine-learning/9781492032632/?ref=mentorcruise


推荐语:这本书由 Aurélien Géron 撰写,既介绍了机器学习基础知识,又涵盖如何将基础知识应用到现实场景。

2. 《Deep Learning for Coders with fastai and PyTorch》

书籍地址:https://www.oreilly.com/library/view/deep-learning-for/9781492045519/?ref=mentorcruise

推荐人:DeOldify 创造者 Jason Antic

推荐语:fastai 这本新书真的很棒,这就是上过 fastai 课程后你所期待的东西!

3. 《Grokking Deep Learning》

书籍地址:https://www.manning.com/books/grokking-deep-learning?ref=mentorcruise

推荐语:这本书讲述了如何从头开始构建深度学习神经网络!深度学习专家 Andrew Trask 以有趣的风格展示了底层科学,你可以从中领悟神经网络训练过程中的每一个细节。

4. 《Natural Language Processing in Action》

书籍地址:https://www.manning.com/books/natural-language-processing-in-action?ref=mentorcruise

推荐人:自然语言处理和数据工程师 Stephen Gabriel

推荐语:这本书可以指引你,利用 Python 及其用于 NLP 和 AI 的包创建能够理解人类语言的机器。

5. 《Deep Learning with JavaScript》

书籍地址:https://www.manning.com/books/deep-learning-with-javascript?ref=mentorcruise

推荐人:日本国立情报学研究所人文开放数据中心研究员 Tarin Clanuwat

推荐语:深度学习改变了计算机视觉、图像处理和自然语言处理领域。在 TensorFlow.js 的帮助下,现在 JavaScript 开发者可以在不依赖 Python 或 R 的情况下构建深度学习 app。

6. 《TinyML》

书籍地址:https://www.oreilly.com/library/view/tinyml/9781492052036/?ref=mentorcruise

推荐语:机器学习以多种形态和大小存在。这本书聚焦最小的形式:嵌入式设备和微控制器。从这本书中,你可以学到如何构建能在低功率 Arduino 微处理器上运行的小型机器学习模型,而且它们的大小通常只有几 kb。

进阶

你现在已经了解回归、分类这些基础知识了,是时候学习一些高阶和专门的概念了。机器学习每天都在进化,这能否帮助 AI 系统更安全或大规模部署,以下书籍可以帮你找到答案:

1. 《Strengthening Deep Neural Networks》

书籍地址:https://www.oreilly.com/library/view/strengthening-deep-neural/9781492044949/?ref=mentorcruise

推荐人:MentorCruise 创始人 Dominic Monn

推荐语:随着深度神经网络越来越多地应用在现实场景中,使用无法骗过人类的数据故意「愚弄」它们成为一种新的攻击方式。这本书考察了日常使用 DNN 来处理图像、音频和视频数据的现实场景。

2. 《Reinforcement Learning: An Introduction》

书籍地址:https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf?ref=mentorcruise

推荐人:斯坦福毕业生、谷歌大脑前员工 Denny Britz

推荐语:Richard Sutton 写的这本书被认为是这个主题中最基础也最重要的资源。强化学习快速发展成为 AI 创新的主要部分,这本书适合工程师和科学家阅读。

3. 《Deep RL in Action》

书籍地址:https://www.manning.com/books/deep-reinforcement-learning-in-action?ref=mentorcruise

推荐语:人类从反馈中学习,而这一强化过程可以被应用到计算机程序中,使它们解决经典编程无法解决的更复杂问题。这本书介绍了深度强化学习领域中的基础概念和术语。

4. 《Generative Deep Learning》

书籍地址:https://www.oreilly.com/library/view/generative-deep-learning/9781492041931/?ref=mentorcruise

推荐语:现在,教会机器比人类更好地绘画、写作、谱曲是有可能的。阅读这本书后,机器学习工程师和数据科学家将发现,如何重新创建生成式深度学习模型最令人印象深刻的示例。

5. 《Federated Learning》

书籍地址:https://www.amazon.de/Federated-Learning-Synthesis-Artificial-Intelligence/dp/1681736977?ref=mentorcruise

推荐语:如何让多个数据所有者共同训练和使用共享预测模型,同时保证所有本地训练数据私有呢?这本书介绍了联邦机器学习利用结合了分布式机器学习、密码学和安全的新型解决方案破解该问题。

理论和历史

知过去,方能见未来。了解 AI 的历史、发展过程和早期错误非常重要。以下书籍可以帮你读懂 AI 的过去。

1. 《Alan Turing: The Enigma》

书籍地址:https://www.goodreads.com/book/show/150731.Alan_Turing?ref=mentorcruise

推荐人:CompoundVC 投资人 Nicole Williams

推荐语:这本书讲述了阿兰 · 图灵的故事。图灵被认为是人工智能和理论计算机科学领域最有影响力的科学家之一。

2. 《The Second Self: Computers & the Human Spirit》

书籍地址:https://mitpress.mit.edu/books/second-self-twentieth-anniversary-edition?ref=mentorcruise

推荐人:CompoundVC 投资人 Nicole Williams

推荐语:这本书中,作者 Sherry Turkle 没有把计算机看作工具,而是看作我们社交和心理生活的一部分。她探讨了如何通过计算机游戏和电子表格探索计算机对我们自我认知、彼此认知以及关系的影响。

3. 《Gödel, Escher, Bach》

书籍地址:https://www.goodreads.com/book/show/24113.G_del_Escher_Bach

推荐人:MentorCruise 创始人 Dominic Monn

推荐语:通过探索逻辑学家 Kurt Gödel、艺术家 M. C. Escher 和作曲家巴赫的生命和作品,这本书阐述了数学、对称性和智能的基础概念。它还探讨了这对于沟通的意义、如何表示和存储知识、符号表征方法及其局限性,甚至「意义」(meaning)的基本概念。

4. 《Prediction Machines》

书籍地址:https://www.amazon.com/Prediction-Machines-Economics-Artificial-Intelligence/dp/1633695670?ref=mentorcruise


推荐语:人工智能让看似不可能的事成为可能,奇迹般地将机器赋予生命——让它们驾驶汽车、交易股票,甚至教育儿童。但如何面对 AI 带来的巨变呢?企业应该如何制定策略,政府应该如何设计政策,人们应该如何规划生活,来面对与我们现在所知大相径庭的世界呢?

原文链接:https://mentorcruise.com/books/ml/
入门机器学习书籍深度学习
5
相关数据
周志华人物

周志华分别于1996年6月、1998年6月和2000年12月于 南京大学计算机科学与技术系获学士、硕士和博士学位。主要从事人工智能、机器学习、数据挖掘 等领域的研究工作。主持多项科研课题,出版《机器学习》(2016)与《Ensemble Methods: Foundations and Algorithms》(2012),在一流国际期刊和顶级国际会议发表论文百余篇,被引用三万余次。

深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

暂无评论
暂无评论~