语音识别大牛莫名被JHU开除后,怒拒Facebook,转向中国公司与高校

「我的计划是准备为一家中国公司工作,说不定也会在一家中国大学兼职当教授,」语音识别著名学者,前约翰霍普金斯大学教授 Daniel Povey 在拒绝了 Facebook 之后更新了自己的去向。「几乎可以肯定是一家中国公司」,而且就在西雅图。

作为语音识别领域的大牛,Daniel Povey 教授此前一直在负责霍普金斯语言语音处理中心的工作。他曾主导开发了语音识别工具库 Kaldi,该工具库支持多种语音识别的模型的训练和预测,很多国内外语音技术公司的研发测试都是从 Kaldi 起步的。

在 5 月约翰霍普金斯大学的学生抗议事件发生后,Povey 教授因反对学生抗议而被认为是「种族歧视」,后遭学校开除——当时他试图强行进入被抗议者占领的大楼,拯救过热的服务器。而在 Povey 无奈准备进入业界,加入 Facebook 时,他又遇到了麻烦:

「我不再会为 Facebook 工作了,我原本将在 8 月 19 日成为这家公司的全职员工,然而他们在 15 日告诉我,这事无法成行了。严格来说,他们没有撤销 offer,我可以成为 Facebook 的一名外包员工,在六周的时间内等待他们完成调查。」Dan Povey 在自己的个人主页上撰文写道。「我最终的 offer 将取决于调查结果,在这期间我将被排除在 facebook 序列之外。因此我决定拒绝这一职位邀请,整个事件似曾相识(déjà vu)。」

Povey 表示,写下这些话几乎肯定会让他投入 Facebook 的大门关闭,尽管他身边的每个人都在试图劝说他不要发表这样的言论,「但我说,我怎么能告诉别人做人,然后自己做个懦夫?」

前约翰霍普金斯大学教授 Dan Povey。

现在,问题似乎已经变成:「哪家中国公司会抢到这位著名学者」了。

Daniel Povey 辞职始末

事情的开端还要从 Daniel Povey 和约翰霍普金斯大学发生的矛盾开始说起。今年四月份,约翰霍普金斯大学校内出现了学生抗议事件。而在事件中,Povey 和这些学生发生了冲突。

JHU 学生的抗议旨在抵制学校设立警察局,学生们占领了校园内的建筑 Garland Hall。不幸的是,CLSP(语音语言处理中心)的机房就处在被占领的楼中。因为缺乏维护,机器和数据都面临被损坏危险。Povey 教授为了保护机器和数据,试图从学生手中夺回机房,因此被学生们控告为种族主义者。

事件之后,大学校方首先给了 Povey 行政休假的命令,之后干脆将其辞退了。

对于校方的处理方式,Povey 在公开信中表达了强烈的不满,以下为他的公开信,在信中他表示自己将会从学校辞职。

「我将于 8 月 19 日起在西雅图 Facebook 入职工作。我将继续与自己的学生和合作者展开远程合作。我将于本月 31 日正式离职霍普金斯大学。我已经有了备选工作计划,因而会早点离开霍普金斯大学。」

在公开信中,Povey 表达了对校方的不满,认为校方在处理这件事情上不公平,甚至偏袒了参与抗议的学生团体。

「...... 从本质上来说,我是因为可能发生的事情被解雇的,而那些学生们却可以不因为他们的所作所为受到惩罚。」Povey 愤愤不平地表示。

最终,Povey 选择辞去教职,这就回到了开头 Facebook 的事情的开端。

在接受 CNBC 采访时,Povey 展示了 Facebook 发给他的一封电子邮件,其中写道:「这对我们来说是一种困难的情况。通常我们不会聘请在上一份工作中因为安全问题而被解雇的人,但你作为顾问为我们工作的一年期间并没有引发任何问题,所以我们相信自己可以做出独立判断,以决定你在约翰霍普金斯大学期间的行为是否会影响我们雇佣你的决定。」

这样一种态度很可能激怒了 Povey。他需要因为所谓的安全问题接受六周的独立调查,然后才有可能成为被聘用。一不做二不休的 Povey 干脆地拒绝了 offer。

「因此我决定拒绝这一职位邀请,整个事件似曾相识(déjà vu)。」Povey 似乎是感觉到 Facebook 的态度和 JHU 如出一辙。

在拒绝了 Facebook 的 offer 后,Povey 声称自己可能考虑去中国公司或高校任职。

「...... 如果任何人想知道后续的话,我的计划是去一家中国公司任职,并可能在中国高校找一份兼职工作。」

据 BaltimoreSun 最近的报道,Daniel Povey 正计划与一家未具名的中国公司或大学合作,继续研究语音识别和机器学习。但具体合同条款尚未确定,「但几乎可以肯定将是一家中国公司」。

「在西雅图地区,有很多这种类型的机构,所以我甚至无需考虑搬家,」Povey 表示,「我觉得和中国人相处起来更加轻松,因为他们那里没有美国式的『政治正确』。」

目前在西雅图开设实验室、研究语音识别相关技术的中国公司有:腾讯、百度、快手等,答案很快就会揭晓。

这件事在知乎上引起了很大的讨论,包括 Povey 曾经的博士生,以及和 Povey 有过合作的研究者开发者都提到了和 Povey 共事的点点滴滴,具体可参考:

  • https://www.zhihu.com/question/339481009/answer/781219312

据称是 Povey 在抗议现场的照片。(图源:知乎)

Daniel Povey 其人和相关成就

Daniel Povey 是约翰霍普金斯大学语言和语音处理中心的助理研究教授。从 1999 年起开始发表关于语音识别和处理方面的研究成果。在 Google Scholar 上,Povey 的被引用次数超过了 20000 次。

同时他也是著名的语音识别软件 Kaldi 的主要开发者,是该论文的第一作者,可以被称为是 Kaldi 之父。这篇关于 Kaldi 的论文引用次数就已经达到了 3000 多次。

Kaldi 是一个著名的开源语音识别工具库,于 2011 年问世,目前已经超过6600+的Star量,Povey 是其主要开发和维护者。Kaldi 集成了多种语音识别的模型,包括隐马尔可夫和最新的深度学习神经网络,在语音识别方面有着不可撼动的地位。

以下为他近一年 GitHub 上在代码方面的贡献。可以看出,其工作强度很高。

参考内容:

  • https://www.zhihu.com/question/339481009/answer/781219312

  • https://www.cnbc.com/2019/08/16/daniel-povey-fired-johns-hopkins-prof-declines-facebook-work-offer.html

  • https://www.baltimoresun.com/education/bs-md-johns-hopkins-professor-facebook-20190818-hb5ytjlmf5h7xa452jd7bkihce-story.html

产业语音识别
21
相关数据
语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

语音处理技术

语音处理(Speech processing),又称语音信号处理、人声处理,其目的是希望做出想要的信号,进一步做语音辨识,应用到手机界面甚至一般生活中,使人与电脑能进行沟通。

all the best