谢文睿、秦州、Datawhale南瓜书团队参与Datawhale来源

周志华「西瓜书」啃不动?「南瓜书」PDF上线了!详细公式推导,GitHub标星过万

机器之心转载

来源:Datawhale

参与:谢文睿、秦州、Datawhale南瓜书团队

一年前,Datawhale开源项目南瓜书发布,受到全网转发,一年后,南瓜书完整版正式撒花完结。从基础公式解析到难点探讨,无论你数学功底如何,都可以在南瓜书里找到你想要的。

关于本书

《南瓜书 Pumpkin-Book》由开源组织 Datawhale 发起,团队成员谢文睿、秦州牵头,针对国内机器学习经典教材--周志华老师的《机器学习》,将教材中难以理解的公式做了解析,对跳跃性较大的公式做了推导,帮助大家解决机器学习中的数学难题。
开源地址:https://github.com/datawhalechina/pumpkin-book

2019 年 4 月 3 日,南瓜书正式发布,受到了广大学习者的一致好评,学习者纷纷表示:老师再也不用担心我的公式推导了,解决了困扰良久的数学难题。
因此,南瓜书发布之初便登上了 Github Trending 第 2。截至今日,star 数已经突破1.1万。
南瓜书不但得到了学习者的认可,还受到业内专家的好评,并且有幸得到西瓜书作者--周志华教授本人的分享。

本书细节

时隔一年,南瓜书在原有的基础上进行了充分的迭代优化:对发布时已有章节进行了完善,未完成章节进行了补充;同时,还补充了大量重难点数学知识(见附录);最后,项目作者还给出了写作南瓜书过程中的参考材料,方便大家深入学习。
如果你数学功底不扎实,南瓜书可以帮你解决公式理解问题。如果你是数学大佬,也可以在南瓜书里有知音的感觉。下面,用几个例子来直观感受下南瓜书的强大。
案例1:玻尔兹曼机的能量方程怎么理解?

案例2:在推导过程中给出新的解题思路,例如:向量化的应用。


案例3:对西瓜书中存在的错误进行勘误。

案例4:数学知识扩展,例如贝叶斯学派的扩展。
使用说明

现在我们对南瓜书已经有了直观的了解,下面来具体看下南瓜书的使用说明吧。

  • 南瓜书的最佳使用方法是以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书;
  • 对于初学机器学习的小白,西瓜书第1章和第2章的公式强烈不建议深究;
  • 超纲的数学知识以附录和参考文献的形式给出;
  • 若南瓜书里没有你想要查阅的公式,或者你发现南瓜书哪个地方有错误,可在南瓜书GitHub的Issues进行反馈。
    完整版南瓜书公式目录
······
本书电子版可通过在机器之心公众号后台回复「南瓜书」获取。

入门数学公式周志华
3
相关数据
周志华人物

周志华分别于1996年6月、1998年6月和2000年12月于 南京大学计算机科学与技术系获学士、硕士和博士学位。主要从事人工智能、机器学习、数据挖掘 等领域的研究工作。主持多项科研课题,出版《机器学习》(2016)与《Ensemble Methods: Foundations and Algorithms》(2012),在一流国际期刊和顶级国际会议发表论文百余篇,被引用三万余次。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

玻尔兹曼机技术

玻尔兹曼机(Boltzmann machine)是随机神经网络和递归神经网络的一种,由杰弗里·辛顿(Geoffrey Hinton)和特里·谢泽诺斯基(Terry Sejnowski)在1985年发明。玻尔兹曼机可被视作随机过程的,可生成的相应的Hopfield神经网络。它是最早能够学习内部表达,并能表达和(给定充足的时间)解决复杂的组合优化问题的神经网络。但是,没有特定限制连接方式的玻尔兹曼机目前为止并未被证明对机器学习的实际问题有什么用。所以它目前只在理论上显得有趣。然而,由于局部性和训练算法的赫布性质(Hebbian nature),以及它们和简单物理过程相似的并行性,如果连接方式是受约束的(即受限玻尔兹曼机),学习方式在解决实际问题上将会足够高效。它由玻尔兹曼分布得名。该分布用于玻尔兹曼机的抽样函数。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~