最强学习资料:国内多所重点大学课程攻略

或许每个经历过大学生涯的人都会有这样的感受:曾经努力收集各种课程资料,但在修完一门课程之后却会发现遗漏了很多重点内容。每一代前辈总结出的经验也常常因为无处传承而逐渐遗漏消失。

为了减少重复劳动,让我们不再孤军奋战,来自浙江大学、北京大学等国内高校的贡献者们发起了课程资料民间整理项目。目前各家大学的课程资料整理已搭建了自己的网站,在 GitHub 上积累了大量 Star。

这些内容不仅是教材的电子版,也有历年试卷、复习资料、习题答案甚至选课攻略。作者表示,希望能够将这些隐晦的、不确定的、口口相传的资料和经验,变为公开的、易于获取的和大家能够共同完善、积累的共享资料。

目前这些项目已经包含了大多数计算机科学方面的课程。

其实说到课程攻略共享计划,大家可能都会想到浙大开源的项目,它从数学、物理、计算机、化学和其他通识课出发介绍大量课程攻略与资料。浙大的共享项目目前包括 50+的主题,如下展示了其中一些:

浙大共享项目地址:https://github.com/QSCTech/zju-icicles

机器学习资料哪家强

作为最早搭建起来的课程攻略共享计划之一,浙大的开源项目主要是「全」。但是对于机器学习学习者而言,这些资料很少深入到 ML 核心课程,它们还是比较广泛的计算机学科资料。因此,我们这里主要介绍上海交通大学的课程攻略,它包含 ML 领域的大量主题。

上海交大的资源非常适合了解机器学习相关的学习内容与主题,每一个课程文件下都有 PPT、参考课本、作业和笔记等。

项目地址:https://github.com/CoolPhilChen/SJTU-Courses

  • 计算机

  • CS125 程序设计

  • CS221 数据结构

  • CS222 算法分析与设计

  • CS258 信息论

  • CS385 机器学习

  • EI331 信号与系统

  • EI332 计算机组成

  • EI338 计算机系统工程

  • EI339 人工智能

  • SE305 数据库技术

  • 高级算法

  • 数学

  • MA357 数理统计

  • X071571 最优化方法

  • MA26035 测度与概率论

如上很多主题都是学机器学习该了解的,不论是程序设计打造编程功底、最优化方法打造机器「学习过程」,还是人工智能机器学习等直接相关的主题,我们都应该有所了解。

例如在 CS385 机器学习中,作者介绍了讲师和课程主页等标配内容,同时也提供了课本、PPT 和作业下载。课本也就是大名鼎鼎的《模式识别机器学习》(Bishop, PRML)和《机器学习》(周志华),课程 PPT 则从最简单的线性模型到 EM 算法涉及主要的 9 个主题。

CS385 还提供了 5 次家庭作业,每一次家庭作业都包含多个问题,不过我们暂时没发现有解题方案。上海交大家庭作业的风格如下:

对了,机器学习这门课是大三下学习期开的,感兴趣的读者可详细看看这些资料。

当然,这个项目其它主题也非常详细,例如最优化方法,除了前面提到的几种资源,它还额外提供了课堂手写笔记。如下展示了最优化方法中的手写「课堂笔记」,梯度下降收敛性分析。

此外,整个项目对在校生有更大的帮助,通过前面那些资源可以了解课程大致内容与方向,复习的时候也有更多的资料。例如在信息论这个主题中,该项目还提供了期中考试的复习材料,这些材料总结了信息论的核心概念。如下是一些信息熵的概念,机器学习中也经常用得上:

其他国内课程

除了前面介绍的课程资源,小编还发现了其他几所高校的课程资源,如北大、中科大和清华。

北大课程资源收录了专业课、公选课、英语课等多类不同课程。以专业课为例,作者进行了详细的分类,如人工智能人工智能概论、抽象代数和概率论等。部分内容最近一次更新是两天前。

北大课程资源部分截图

北大课程资源项目地址:https://github.com/lib-pku/libpku

目前,该 Github 项目已经有 1.2 万左右的星标,3800 左右的 Fork。

该资源中收录了很多北京大学的期中、期末考卷。这张 17-18 年信息科学技术学院的高数 b 期末考题你可以做出几道?

中科大的这一课程资源项目收录了中国科学技术大学众多课程资源的笔记,总结,经验等学生自己原创的内容。

中科大项目地址:https://github.com/USTC-Resource/USTC-Course

此外,从大一上到大四上,清华大学计算机系课程攻略项目按照学期整理了该校计算机系的课程资源。中山大学同样整理了期末考试的往年试卷、复习资料等辅助内容。课程资源再多,学到才是自己的,建议读者们根据自己的需求有针对的进行学习。

最后,知识的传承是一个长期任务,欢迎大家继续作出贡献!

入门中科大上海交通大学浙江大学北京大学课程
51
相关数据
周志华人物

周志华分别于1996年6月、1998年6月和2000年12月于 南京大学计算机科学与技术系获学士、硕士和博士学位。主要从事人工智能、机器学习、数据挖掘 等领域的研究工作。主持多项科研课题,出版《机器学习》(2016)与《Ensemble Methods: Foundations and Algorithms》(2012),在一流国际期刊和顶级国际会议发表论文百余篇,被引用三万余次。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

信息熵技术

在信息论中,熵是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量。这里,“消息”代表来自分布或数据流中的事件、样本或特征。熵的单位通常为比特,但也用Sh、nat、Hart计量,取决于定义用到对数的底。

梯度下降技术

梯度下降是用于查找函数最小值的一阶迭代优化算法。 要使用梯度下降找到函数的局部最小值,可以采用与当前点的函数梯度(或近似梯度)的负值成比例的步骤。 如果采取的步骤与梯度的正值成比例,则接近该函数的局部最大值,被称为梯度上升。

信息论技术

信息论是在信息可以量度的基础上,研究有效地和可靠地传递信息的科学,它涉及信息量度、信息特性、信息传输速率、信道容量、干扰对信息传输的影响等方面的知识。通常把上述范围的信息论称为狭义的信息论,又因为它的创始人是香农,故又称为香农信息论。

推荐文章
有机会好好看看
1