参与郑丽慧 张倩

将加入小米,语音识别大牛、Kaldi之父Daniel Povey宣布年底前来中国工作

昨天,国际语音识别大牛、前约翰霍普金斯大学(Jonhs Hopkins University)教授、 语音识别开源工具 Kaldi 之父 Daniel Povey 在 Twitter 上表示,他将很快与小米签订一项工作协议,工作地点位于北京。此外,他还表示自己将于 2019 年底之前前往北京工作,且会招聘一个小团队打造新一代的「PyTorch-y」Kaldi。


今年 5 月份,约翰霍普金斯大学的学生抗议事件发生后,Povey 教授因反对学生抗议遭学校停职,后来他又拒绝了 Facebook,计划加入中国公司。机器之心获知,Povey 教授曾于 9 月中旬来到中国,与多家公司进行交流,后来他宣布以兼职顾问的身份加入北京初创公司爱数智慧。从今日的信息来看,Povey 教授最终的去向也将敲定。


Twitter 信息发布后不久,就有人表示想进入小米和这位大牛共事,并问道,「小米收实习生吗?」「和您共事需要哪些技能?」对此,Povey 回答称:「我们可能会考虑先雇佣全职员工。一起工作需要的技能不只是 Kaldi,还要有深厚的 C++、Python 功底,而且 Python 方面的知识可能更加重要一些。」



此外,帖子底下还有一些列队欢迎的中国网友。


这位如此受欢迎的语音识别大牛究竟是何许人?有何过人之处?我们先来看一下他的经历。


Kaldi 之父——Daniel Povey


Danial Povey 是语音识别领域的专家,他曾主导开发了语音识别工具库 Kaldi,该工具库支持多种语音识别的模型的训练和预测,很多国内外语音技术公司的研发测试都是从 Kaldi 起步的。Kaldi 目前已经拥有 6600+的 Star 量,被认为是业界语音识别框架的基石。它集成了多种语音识别的模型,包括隐马尔可夫和最新的深度学习神经网络,在语音识别方面有着不可撼动的地位。


Danial Povey 本科和博士都就读于英国剑桥大学,2003 年在剑桥大学拿到博士学位。



毕业之后,他曾先后加入 IBM、微软等科技巨头,并于 2012 年进入约翰霍普金斯大学担任助理教授。


他从 1999 年起就开始发表关于语音识别和处理方面的研究成果。在 Google Scholar 上,Povey 的被引用次数超过了 20000 次。



他不仅是语音识别软件 Kaldi 的主要开发者,还是该论文的第一作者,可以说是 Kaldi 之父。这篇关于 Kaldi 的论文引用次数就已经达到了 3000 多次。



从以上履历可以看出,由于在语音识别领域举足轻重的地位,Povey 一直是各大科技公司和高校的青睐的人才,他的职业生涯似乎也一直是顺风顺水,直到今年年初卷入约翰霍普金斯大学的学生抗议事件。


因卷入学生抗议事件从约翰霍普金斯大学离职


离开约翰霍普金斯大学以前,Daniel Povey 一直负责学校(CLSP)语言语音处理中心的工作。


他突然离职的原因也是非常与众不同:


今年 4 月,约翰霍普金斯大学校内出现了学生抗议事件。学生们抗议的目的是要求 JHU 取消最近批准的建立一支私立警察部队计划,终止与美国移民和海关执法部门的合同,目的是「为了保护大学里的黑人、黄种人、同性恋者以及所有被边缘化的人。」


学生们举行了静坐示威和占领行政大楼的抗议,开展了长达一个月的静坐示威,并封锁了 Garland Hall——用铁链锁住门,遮住窗户,导致大学不得不暂停或重新安排财务援助、残疾人帮助、学术咨询和学生签证等服务。


关键是,CLSP 的机房就处在被占领的楼中。因为缺乏维护,机器和数据都面临被损坏危险。为了保护数据,Povey 选择闯入机房,在此过程中与学生产生矛盾。


事件之后,校方给予 Povey 行政休假的命令,之后又宣布辞退 Povey。


对于校方的处理方式,Povey 在公开信中表达了强烈的不满,以下为他的公开信内容:


「我将于 8 月 19 日起在西雅图 Facebook 入职工作。我将继续与自己的学生和合作者展开远程合作。我将于本月 31 日正式离职霍普金斯大学。我已经有了备选工作计划,因而会早点离开霍普金斯大学。」


鉴于这次非比寻常的离职原因,Povey 也在公开信中表达了对校方的不满,认为校方在处理这件事情上不公平,甚至偏袒了参与抗议的学生团体。


「...... 从本质上来说,我是因为可能发生的事情被解雇的,而那些学生们却可以不因为他们的所作所为受到惩罚。」


说不清孰是孰非,总之这件事过后,Povey 正式离开了工作 7 年的霍普金斯大学,转投业界。


跳槽 Facebook?并没有


但是 Povey 的跳槽之路略显坎坷:计划于 8 月 19 日入职的 Facebook 给他发了一封邮件说到,「通常我们不会聘请在上一份工作中因为安全问题而被解雇的人,但你作为顾问为我们工作的一年期间并没有引发任何问题,所以我们相信自己可以做出独立判断,以决定你在约翰霍普金斯大学期间的行为是否会影响我们雇佣你的决定。」


安全问题?尽管这份邮件中并未收回对 Povey 的聘用,只是说要接受为期六周的独立调查,但这种态度激怒了 Povey。


可能是因为对这种「莫须有」的怀疑太过反感,在 Povey 眼里 Facebook 的态度和 JHU 没有什么区别,干脆拒绝了 offer:


「因此我决定拒绝这一职位邀请,整个事件似曾相识(déjà vu)。」


兜兜转转以后,Povey 说自己考虑去中国公司或高校任职,并在 9 月中旬来到中国和多家公司进行了交流。


他选择了中国


九月底,Daniel Povey 在社交网络上确认自己已经加入中国创业公司爱数智慧,但并不是全职。


「已有很多报道说我加入爱数智慧,这是事实,但它不是全职工作,只是兼职顾问!我仍然没有决定我的主要工作。」


于是 Daniel Povey 究竟会选择哪一家中国公司成为全职雇员,成了圈内热议的话题。


对于 Povey 入职小米的信息,机器之心也向小米公司做了确认,小米方回复称「目前还不确定」,但同时也表示,Povey 教授中国行期间确实与小米进行过交流。
产业小米
相关数据
语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

语音处理技术

语音处理(Speech processing),又称语音信号处理、人声处理,其目的是希望做出想要的信号,进一步做语音辨识,应用到手机界面甚至一般生活中,使人与电脑能进行沟通。

小米机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
暂无评论
暂无评论~