一鸣、Jamin参与

官方「补习班」:MIT新年开课,帮你补习学校没教的计算机工具技巧

有些计算机从业人员非常熟悉一套理论,但是可能还要花时间自学一些常用的工具。近日 MIT 推出了一系列相关课程,节省了大家自行摸索的时间。


学校的计算机科学专业会教什么?从数学基础到操作系统,再到机器学习。一般来讲,计算机科学课程会关注该领域最为核心的知识。

与此同时,还有一些工具相关的主题需要我们自己在实际应用中摸索和总结,比如如何用好命令行、如何玩转 Git 等。最近,MIT CSAIL 实验室推出了一系列视频教程,补充了缺失的这部分内容。

课程地址:https://missing.csail.mit.edu/

课程概况

据介绍,设立该项课程的目的是为了帮助学生了解成为数据科学家和开发者的所有重要主题,但是具体内容是学生平时在课堂中学不到的。本课程非常实用,重点在于其中的实践。课程包括了各种工具的上手介绍——这些工具在开发过程中出现的频率很高,如命令行、git 等。

开课时间是今年的一月份,面向的主要是 MIT 的学生,但是课程资料会通过视频的方式开源给大众。大家可以通过上面的课程地址找到相应的视频和文字资料。

为什么要开设这样的课程?课程页面中提到,学生们在校期间使用这些工具的时间可能长达数百个小时(工作之后可能要用数千个小时),所以教会学生们流畅、无障碍地使用这些工具非常有必要。通过学习,学生们不仅可以节省掌握工具使用方法所需的时间,还可以在后续的职业生涯中受益。

目录和内容

第一节课从 1 月 13 日便开始了,一直到 30 日结束,共有 11 节课。从内容来看,主要涉及命令行相关工具和环境、编辑器(Vim)、版本控制(Git)、元编程、计算机安全等方面,每个程序员或多或少都会接触到。

课程的主要目录如下:

除了目录外,课程还提供了相关内容的介绍:

命令行工具

命令行是计算机从业者最常使用的工具了。在这项课程中,学生们可以了解到如何使用别名、脚本及构建的系统去自动化运行常见或重复性的任务,同时避免在文档中不停地复制粘贴某个命令,或者「忘记运行某个程序」、「忘记传递某个参数」等。

例如,快速搜索历史记录可以节省大量时间。以下示例会展示一些使用 convert 命令为 shell 历史记录做索引的相关技巧。


版本控制

版本控制是编程中非常重要的问题。在复杂的编程项目中协调各个参与者、使代码能够得到及时更新,这些都依赖于 Git。在课程中,学生们将会学到相关的技巧,不再使用 rm -rf; git clone,也不会有更多的合并冲突问题。

课程同时也会教你如何使用这些工具,向一些开源项目贡献代码(使用 pull request 等),以及帮助学习者避免删除工作代码等。

下面这个例子展示了如何使用 git bisect 来查找破坏单元测试的提交,进而用 git revert 去修复。

文本编辑器

文本编辑器可以帮助你使用命令行编辑文件(包括本次修改和远程修改),同时还可以利用一些高级特性完成更多操作。这可以减少很多来回复制文档的操作。同时,课程也会介绍 Vim 的宏特性。

下面这个例子展示了如何使用嵌套的 vim 将 html 表转换为 csv 格式。

操作远程主机

通过 SSH 的方式可以连接很多远程的主机并进行工作,但是同时打开多个终端窗口的效率很低。这次的课程也会介绍相关的技巧——比如不需要每次连接的时候都输入密码等。

下面这个例子展示了如何用 tmux 使得远程服务器保持活跃,用 mosh 去支持网络漫游及断开连接。

查找文件

课程中会介绍快速查找文件的方法,不需要点击项目中的文件来搜索。相关内容包括使用 fd、rg 等。同时也会有 cd、vim 等方法。

下面的例子展示了如何快速查找带 fd 的文件及带 rg 的代码段。

数据整理

这项内容主要是通过命令行来对数据和文件进行快速和便捷的浏览、修改、分析和可视化,这样可以减少从 log 文件复制粘贴的问题。手动计算和统计之类的操作会减少很多。

虚拟机

虚拟机也是编程中使用的重要工具,特别是需要使用新的操作系统、隔离无关项目,以及保持主系统环境干净整洁的情况下。当进行安全测试的时候,使用虚拟机也可以避免系统崩溃。使用虚拟机可以保证对应的版本中有相应的包和库。

安全

互联网安全也是计算机中的一个重要话题。在课程中,学习者可以接触到很多相关知识,如保护 WIFI 网络、使用加密通信等。

课程官网提到,通过这 12 节课程和对应的练习,学生可以自己掌握相关工具的用法。另外,还有一些相关课程在 Hacker Tools 网站上,感兴趣的朋友可以看看。

Hacker Tools 地址:https://hacker-tools.github.io/lectures/
入门在线课程命令行GitMIT
3
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

推荐文章
暂无评论
暂无评论~