参与李泽南 蛋酱 魔王

谷歌大脑高级研究科学家:在康奈尔读博6年,我收获了什么

读一个机器学习领域的博士是什么体验?如果有一个刚毕业的青年科学家能够帮我们总结一下就好了。

近日,谷歌大脑高级研究科学家 Maithra Raghu 发布了自己的博士生涯总结,包括期望值管理、读博的常见挑战,以及论文那些事儿,等等。
读博期望值管理

在这里,我将读博称为一段「旅程」,这是一个经常被低估的方面。读完机器学习博士学位大概需要 5 到 6 年的时间。在此期间,你不仅要学习关于该领域的研究技能和知识,而且还将培养自己对特定问题的个人偏好、对不同子领域的认知,甚至对跨学术界、业界、政策、非盈利组织等的工作类型有自己的见解。

这些不断变化的个人偏好,将影响你决定从事的研究类型,甚至影响你所选择的博士后职业道路。但在博士生涯的初始阶段,我们往往很难预测个人偏好会如何演变。就我而言,我是完全假设自己会投身业界,过程中我也认真思考了搞学术这件事,不过最后我做出了一个非常艰难的决定:放弃学界的 Offer,继续留在业界。

所以,在开始博士学位课程后,循序渐进地进行学习,并充分利用已有经验通常会很有帮助,但不必设定非常具体的预期结果(正所谓计划赶不上变化,且这会增加不必要的压力)。

读博旅程中的常见挑战

攻读博士学位可能会带来巨大的收获,特别是在机器学习领域,它提供了理解基础科学和技术部署的机会。我很感激自己在博士生涯中有很多机会来体验这两个方面。

但博士学位的攻读时长和自由的特性,也是一种挑战。我的博士生涯起起伏伏,有些时候我感到孤独,陷入困境以致于不知所措。现在再回想过去,加上与同行讨论之后,我理解了这些低谷是很常见的。不过,根据很多人分享过的经验,我知道也有一些策略可以帮助解决问题。

陷入困境

一个非常常见的挑战是:卡住,有时候是卡在某个特定项目中,有时候整个研究都卡住了。

如果是某个项目卡住了,而且你一直努力推进却未奏效,那么你可以参考以下策略:

  • 整理成文字形式:收集部分实验结果、数学见解,总结出有条理的笔记,花时间梳理这篇内容会让你理解事情到了哪一步,重要差距出现在哪里。

  • 核心点:如果项目的某个特定部分无法正常工作,可以考虑是否需要重构该问题,使其更容易处理。

  • 建立联系:当前项目关注的领域和其他研究领域是否存在联系?在该项目中能否探索这种联系?这既有利于进步,也可以使项目与更广泛的社区建立联系。

  • 获取反馈:从研究社区的同行、合作者和朋友那里获得反馈也可能有所帮助,你还能收获一些新观点和改进建议。

  • 提交 Workshop:参与一些 Workshop 也能收集到一些有用的反馈。

  • 完结,然后继续:有时候一个项目在起初看起来很有希望,但很难推进,并且重构、与其他领域建立联系也具备挑战性。在这种情况下,快速结束项目是是非常有必要的。如果获得了一部分结果,那你有必要生成最终文章并共享出来,从合作者那里获得确认和最终反馈,并将其保存为 arXiv 预印本或 workshop 论文。

如果这种卡住的感觉来源于研究过程,我意识到的很重要的一点是,研究的完备程度通常很难衡量,尤其是在评估自己的时候。在读博士的过程中,我一开始做了一些医疗应用方面的研究,但学习这一领域知识、撰写论文的速度较慢。缓慢的进展让我感到沮丧,但在努力一段时间之后,我重新阅读了一些我在博士早期看过的论文,感觉大有不同,现在我可以更深刻地理解它们了。

研究成熟度的关键方面——了解结果的更广泛意义,与不同领域构建联系,迅速缩小与子领域新关键贡献的距离——你不需要迅速将其转化为有形的产出(更多论文)。但它们对于成为具有丰富研究视野的独立研究人员至关重要,可以说是博士的主要研究目标。而且如果你通过阅读论文了解一个领域,自行工作开始某个方向的探索(甚至开始教课),就意味着你在这些重要方面都有了进步!

跟上机器学习的进度

机器学习是一个日新月异的热门研究领域,与之相对的是很多东西都会淹没在海量论文、预印版论文、博客文章、应用、框架等之下。一个有趣的统计结果是:去年的 NeurIPS 会议有超过 1 万篇论文投稿,最终有 2000 多篇论文被收录——看不完吧,感到不知所措了吧!
对此我的策略是:

  1. 准备一个相关论文的链接列表。对我来说,这需要结合 arXiv 的机器学习子目录、arXiv-sanity、推特、reddit 的 MachineLearning 板块(有时)、paperwithcode、Semantic Scholar 和 Google Scholar。

  2. 记录并更新论文阅读列表。如果看到了有趣的论文但没时间读,先记录下来之后再来看。

  3. 寻找一种阅读论文的节奏。如果论文和自己的研究方向强相关就仔细看,否则就快速看摘要和论文中的重要图片。

  4. 偶尔阅读不同领域的研究。有些时候(也许一年一次),我会尝试看一些不是自己研究领域里的论文,以便对前沿研究进展有大致了解。


这里请记住:每个人对于论文的发表速度都感到有压力,同时很多论文可能源自相同的思路,经常了解一下业界进展就足以跟上主流了。

孤独无助


博士期间的另一个挑战在于和孤独感作斗争。在读博的头几年,一些项目要求我把目光放在非常狭窄特定的问题上,这些问题也非常费时费力,永无止境。在这段时间里,你很难不感受到自己被其他研究者和更大的研究圈子抛弃,我非常感谢在此期间帮助我渡过难关的人们。

从更广泛的意义来讲,这种情况很常见,特别是在博士早期:你可能在学习如何将一个项目从头到尾过一遍,而与此同时与研究领域和社区本身的联系并不多。保持与研究领域和社区的联系对于减少孤独感非常有好处。有时你可以:1)与高年级学生或博士后建立合作;2)从导师、实验室负责人、研究合作者那里获取有关自己工作进展的反馈;3)积极参与更广泛的社区,无论是简单地参会,还是组织和指导 workshop。

你需要具备的三大能力

在讨论了攻读博士学位期间会遇到的一些共同挑战及解决方法之后,本文的其余部分将概述有利于研究推进的一些有用能力。

首先我们要对于读博最有用的三项能力说起:主动、专注和毅力。当然这是根据我的个人经验得出的结论,每个人对于有用品质可能会有不同看法。但对我而言,自本科毕业开始到进入博士培养计划最主要的区别就在于要主动——这包括但不限于阅读重要的相关论文、对不同方法的可行性进行快速的初步研究、与进行相关研究的同行不断交流、参加学术会议并成为大会的积极参与者。

由于博士生活大部分是由非结构化的时间构成的,因此提高生产力很大程度上取决于你学习和做研究的主动性。


另外非常有用的品质是专注和毅力。在开始新的研究方向时,仔细阅读相关工作,提取关键点,快速从初始探索中学习并确定主要项目方向是很重要的。另一方面,坚持对于把一项研究顺利做完非常有用:你总是需要做大量编辑、添加工作才能让论文最终呈现可提交的状态,而在提交之后,你还要回应同行评审的观点,做进一步的编辑工作,甚至面对拒稿。有时你很难打起精神应付这些工作,特别是你一边为重新提交论文做准备,另一边还要研究新课题时。但同行评审过程带来的机会通常意味着坚持是值得的。

关注论文和新思想

在博士的第一年和第三年,我分别开了两份文档,并一直在更新:第一个记录我阅读过的论文,每当我看完一篇新论文,就会在文档中添加一笔,附带自己的简短总结。这个文档现在已经有 50 页了(我可能得转投 Mendeley 或 Paperpile 了),在我需要快速寻找论文研究和要点时它非常有用。

另一个文档持续关注研究方向,每当我找到一个有趣的想法就会在其中记录下来。随着时间流逝,这份努力在我选择研究方向和突出主题时提供了不少帮助。

社区的重要性

我花了挺长时间才意识到机器学习研究的一个重要特点:从根本上说机器学习研究是社区行为。我们需要解决的问题非常困难,进展取决于所有同行接受新观点的速度。这是你探索研究方向时要牢记的关键因素。让社区感到兴奋的是什么,为什么?有缺点或空白吗?有明显的下一步吗?花时间与社区中的同僚讨论这些问题,对于寻找恰当的研究方向至关重要。

而且如果你对一个新研究方向感到兴奋,围绕它来建立讨论社区是很有意义的——这可以通过发起协作、散布关键的开放性问题并组织研讨会来实现。从博士生涯早期开始,我就对了解现代深度学习系统所展示出的重要实验现象非常感兴趣。但这一领域很有挑战性,它的发展很快,任何分析的重点都在不断变化,这就使得围绕它建立社区变得困难起来。因此我在发表第一篇深度学习分析论文时经历了很大挑战,但这也绝对是一种坚持的体现。自此以来,能够见证并为这个令人兴奋的研究领域的发展做出贡献真是太好了!
发展研究的视角

前面提到过,当开始博士生涯时最好走一步看一步,专注于积累经验,而非追寻特定的目标,但从研究成熟度的角度来说,PhD 是有特定的任务的:成为一名独立的研究者,拥有丰富且清晰的研究视野。

在最近的机器学习研究中,随着大量论文的出现,人们自然想到需要发更多文章。但尽管论文写作是一项重要技能,但我认为研究成熟度的关键标准是能够对自己的领域有深度观点,这些观点有助于通过与主题相关的总体观点(研究视野)来决定关键的研究问题。

拥有完善的研究视野会极大地激发人们的积极性。打个比方,这就有点像完成一个「按照数字填色」的任务:你不仅在给每个空格填上颜色,在图画完成时还会突然看到整张图片的效果。

所以问题来了,如何建立起研究视野呢?

首先从我的 PhD 经历来看,要想在没有几年研究经验的情况下建立起完整的研究视野是很难的。在博士的头几年里,我记得自己一直在阅读论文,观看资深研究者的演讲,并为无法识别、阐述有趣的研究问题而感到苦恼。在随后的几年里,所有我读过的论文、参与的项目和研讨会都对自己的能力提升有很大帮助。当然还是有改进的空间!「向前看」这种能力会随着阅历和对自身方向的深入理解不断发展。

现在,我们来更具体地说明如何更好地发展研究视野:它始于探索,我初期参与的一些项目给我提供了一些不同的机会,让我开始理解自己真正感兴趣的主题。从这个基础开始,自然就会有一些相关的研究需要跟进,最终把你引向相关的应用、部署问题。所有这些都是在机器学习设计和人机交互这一大主题的基础上开始的,而且随着研究视野的拓展,已有的工作激发出了新的问题。在这里,我要非常感谢导师的见解、指导和鼓励!

最后需要强调的是,多年的经验确实产生了质变的效应。当我在从事研究项目时,分辨论文中的重要观点已变得更加轻松,这让你可以更好地提出自己的看法、下一个问题和对未来的展望,在新的项目中可以更快地吸收知识、提出看法,随后回归本源——帮助自己找到有趣的研究方向,并形成更广阔的的视野。
总结

总而言之,读 PhD 是一件很有意义的事。不过它就像是一段旅程,有起有落,伴随着新的发现和人生观的改变。我对自己在读博生涯中获得的丰富经验时常心存感恩,希望这篇文章能够对身在旅途中的你产生帮助。

原文链接:https://maithraraghu.com/blog/2020/Reflections_on_my_Machine_Learning_PhD_Journey/
入门机器学习谷歌博士
相关数据
人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~