机器之心编辑部报道

「冒名顶替综合征,还是我真的不行?」硕士学位、4年CS工作经验,但我感觉自己什么都不会

一位来自机器学习从业者的内心剖白:工作 4 年,不知该如何前进。

「拥有硕士学位,从业经验 4 年,却怀疑自己是个「impostor」(冒名顶替者),因为感觉自己什么都不会,可以被任何人取代。」最近,一篇 reddit 热帖引发了社区的大量关注。

图片



发帖人「egobamyasi」拥有 IT 学士学位(重点研究 CS、算法、数据结构、C++ 和 Java)、生物信息学硕士学位(重点研究机器学习、统计学、概率),具备 4 年工作经验(在学术机构中担任分析师),熟练使用 R、Python、SQL 语言。

看起来履历还不错,然而 ta 却在帖子中表示:感觉自己在工作中像个「冒名顶替者」,什么都不知道,所做的工作只是停留在类似「点击按钮」的状态。看起来是在做机器学习的相关工作,实则这个工作可以被任何人取代。

从这位 reddit 用户的学历和经历来看,情况应该不至于这么糟糕吧。有学历,又有工作资历,为什么会怀疑自己什么都不会呢?

困惑来自自己,也来自别人

发帖人称,其工作内容包括写脚本(75% 的时间使用 R 语言,然而这门语言自己并不喜欢)、清洗数据(没太大难度),做一些数据可视化、聚类和一些基础 ML 工作。在平时的工作中不需要做单元测试,写的代码也没人检查,也不需要处理 Hive、Spark、Kafka、CI/CD、Hadoop、Docker 等。工作内容只停留在编写脚本,使用的还是别人设计好的方法。

高度的自我怀疑,让发帖人感觉自己不是一个拥有 STEM 专业学士和硕士学位的人。ta 认为自己的工作内容,其他人可以在两三个月的时间里轻松学会并照着做。ta 表示自己在工作中非常积极,会为大家做很多事,也得到了其他人的赞扬,被认为是一名很棒的员工。但在这位发帖人看来,ta 只是做了一些很基本的事情。

在提及导师时,ta 是这样描述的:「导师拥有博士学位,但她什么都不知道。每当我向她寻求指导时,她总是大脑一片空白。我得自己想办法,没人告诉我这条路对不对。有一天她问我为什么要用 GitHub 来编写所有代码。还有一次她问我为什么写函数,为什么需要函数式编程。她认为写函数是无用的,会使代码变得复杂。」

发帖人认为自己每天都在做重复性的工作,没有尝试新事物的空间,更别提做项目提升自己了。甚至没有人在意自己。ta 表示,在学术机构中科研经费总是有的,同事总能找到一本杂志来发表论文,但自己的名字并没有出现在论文上,因为「论文已经有太多的作者了」。

面试不顺,4 年工作 + 硕士学位,被评价「太初级」

对此,发帖人进行了深刻的剖析:「这条职业道路值得吗?每个人都是 ML 领域的天才。而我只是在 Jupyter Lab 里输入一些东西,然后点击 run。像我这样的人怎么能在别处找到工作呢?我充其量只是个初级数据分析师,在其他地方甚至找不到基础数据分析师的工作。我有野心和干劲,但是我很迷茫。我已经失去了本科期间学到的所有知识,我不记得 C++ 和 java 的任何知识,想不起来堆排序是做什么的。所有的知识都消失了,因为我在这样一个岗位上待了 4 年。」

ta 在面试中备受打击:

「在面试中,当他们问我的团队是否使用 Git 或单元测试时,或者当他们问谁检查我的代码或者我如何交付 pipeline 时,我感受到了危险,因为这些我都没做过。不是因为我不想,而是和我一起工作的人都活在自己的世界里。他们不喜欢进步,我却一直表现得很主动,但他们就是不买账。我不再认为我是一个程序员、数据科学家、生物信息学家,我没有市场价值。怪不得我在别的地方找不到工作。我有 4 年的工作经验,但现在的状况比刚毕业时还糟糕。」

发帖人表示申请过其他职位,但面试机会很少,而且面试时经常被问一些基础问题,例如 KNN 的工作原理。ta 虽然在硕士期间学过,但目前的工作只停留在对各种软件包的调用,因此 ta 对 KNN 的底层实现基本不了解。

ta 的情况可能和许多人一样,调用别人封装好的模块,但对各个模块的实现细节不去深究。这样工作可能比较轻松,但在面试中就不占优势了,多数面试官注重算法的底层实现。

有网友指出:「真正的价值在于知道如何将机器学习解决方案应用于现实问题。你每天做的大部分事情对你来说都很简单,但那只是因为你每天都在做。根据我的经验,大多数数据科学家都在做你所说的事情。」


图片


发帖人还表示后悔从 IT/CS 转到生物信息学,后悔接受学术职位。ta 认为,现在自己的能力不足以进入业界。就在发帖的几天前,ta 又收到了一家优秀公司的拒绝信,认为 ta 资历太浅,不适合该职位。4 年的工作经验和一个硕士学位却被评价为「太初级」。

单看这篇帖子,发帖人是很上进的,能够意识到自己的处境,并且想在事业上有所进步。但 ta 不知道该如何前进,目前处在迷茫期。

网友支招

工作简单重复,四年没学到多少东西,面试还被人嫌弃…… 在发帖者的笔下,自己是如此地不堪。然而,事实真的是这样吗?到底是哪里出了问题?怎么冲破这一牢笼?不少评论者分享了自己的观点。

将 ML 应用于现实问题怎么能说没有价值?

首先,「你的工作并非没有价值」,大部分评论者给出了这样的结论。

有网友表示:「当你能做的事情,是别人正在学着努力做的,那么你的工作就是有价值的。拥有一个知道如何快速将机器学习应用于各种问题的人对于工作团队来说非常重要。机器学习行业目前正处于落地阶段,行业知识、沟通技巧和基本的 ML / 统计分析能力在这个阶段都是非常重要的,如果你能同时掌握这三项技能,那么你就是一个非常有价值的人才。」

图片


一位软件开发工程师也认可上述说法:「我一点也不嫉妒那些创建编程语言或开发 / 维护工具包的人。我是一个软件消费者,我用其他人发明的东西为企业创造价值…… 很多『天才』工程师可能也很崩溃,因为他们不知道如何为现实世界创造有用的东西。」

有人发明工具,有人使用工具,使用工具的人为什么要为发明不出工具而贬低自己呢?如果按照这种思路去想的话,提问者的问题很可能在于没有找准自己的定位,因此比较的对象出了偏差,也就产生了自己「一无是处」的想法。

图片



抽出时间读论文、学技能

很多人可能都有这样的体验:当你开始学习并学到了一些东西的时候,你好像就没有那么焦虑了。因此,不少网友建议提问者:把现在的工作稍微放一放,给自己留点时间去学习一些新东西。

学习的方式有很多种,比如读 arXiv 论文,做一些个人的研究项目。更重要的是,在读论文的过程中你会发现,「有一半的论文假设都过于理想化,根本无法解决行业中实际存在的问题。」因此,这么一看,别人也没有那么厉害嘛。

反过来说,写脚本也没有看起来那么简单,「能够编写脚本,清晰地思考架构,并在短时间内找出解决方案,这就是一项很好的个人技能」。

图片



关于学习,也有网友给出了更加具体的建议:

  • 移出 25% 的时间用于调整自己和学习新技能;

  • 尽可能获得更多认证。如果可能的话,写论文是最好的方式,研究论文能够让从业者具有竞争优势;

  • 寻求一份新的工作。


图片


如果你能打破原来的工作节奏,稍微放松一点,或许也能挤出一些空闲时间。有网友建议作者放下 sklearn,花一些时间从头开始构建机器学习模型。这能够帮助作者避免担忧被顶替,并在面试中获得优势。为了调整心态,该网友建议作者「只和自己比,每次迈出一步,做更好的自己」。

图片



学习面试技巧,像备考一样准备面试

除了自我定位不准、过度贬低自己,也有网友在面试环节发现了问题。

面试就像一场考试,是讲究技巧的。如果你能像在学校准备考试一样去准备一场面试,学习其中的技巧,找工作可能就没那么难了。具体的学习路径包括:

  • 多读一些「面经」,看看别人都被问到了什么问题,然后有针对性地做准备;

  • 复习一下在学校学的东西,找回一些基本功;

  • ……


图片


当然,在此之前,有人建议发帖者先缓解一下「冒名顶替综合征」的问题,具体建议和以上网友提到的类似,如不要把别人想的太好,也不要把自己想的太糟;保持学习者心态;多多交流与分享等。

如果你还有其他建议,欢迎在评论区分享一下。

参考链接:
https://www.reddit.com/r/MachineLearning/comments/m1kss2/d_i_feel_like_an_impostor_who_just_pushes_buttons/

产业机器学习Reddit
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

推荐文章
暂无评论
暂无评论~