Panda 李泽南参与Tony Peng采访

图灵奖得主Yoshua Bengio谈5G、中美争端以及「错误的」ICML最佳论文

6月15日,三位人工智能先驱Yoshua Bengio、Geoffrey Hinton与Yann LeCun在美国加州接受了2018年图灵奖的颁奖。这是有「计算机界诺贝尔奖」之称的图灵奖十年内第三次颁发给机器学习领域的研究者。

颁奖委员会表示,三位学者因为在深度神经网络概念和工程上的突破,使得 DNN 成为计算的一个重要构成,从而成为了 2018 年图灵奖得主。毋庸置疑,他们的研究成果已成为今天AI热潮的主要推动力量。虽然要让电脑像人类一样思考,我们还有很多路要走,但是人工智能今天的发展已对人类经济和我们的生活方式产生了深远影响。

在本次颁奖之前,机器之心在 MILA 与滴滴出行的合作发布会上对其中一位获奖者,蒙特利尔大学教授、人工智能研究机构MILA主管 Yoshua Bengio,和滴滴出行科技合作总监吴国斌博士进行了专访,我们与他们聊到了一些近期热点话题:5G 和自动驾驶、中美贸易争端,以及刚刚出炉的 ICML 2019 最佳论文。Bengio 认为,那篇有关无监督学习的论文,思路是错误的。

Yoshua Bengio 在专访中还提到:「我认为美国和中国之间,以及许多西方国家和中国目前正在发生的事情是非常『不幸』的……我认为,在人类历史上,我们比以往任何时候都更需要强大和协作的国际协调。」

让我们看看这位深度学习的奠基者是怎么说的。

人工智能大发展的时代

恭喜您与 Hinton 博士和 LeCun 博士共获图灵奖!这很了不起,对 AI 社区来说也是一个振奋人心的新闻。我想知道当您听闻自己是图灵奖获得者之后,您做的第一件事是什么?

Yoshua Bengio:这个问题很有趣,因为他们在电话上告诉我的第一件事情是我不能告诉任何人。当然啦,我的第一反应就是告诉很多人。所以他们说我可以跟我的家人说一点点。一开始,我跟很少几个人说了这件事,但我很难控制自己不去谈这个,这样一直过了三个星期,然后才公开宣布。

另外还有一个,我在知道这个新闻后感觉非常神奇,对吧?我的意思是我觉得我可以做得很好,但某种程度上这又是一种短暂易逝的感觉。就好像是你中了彩票大奖,但一天之后,你还是和原来一样。对吧?

接下来我想到的是,从情感上来说,这个奖真的不应该只是表彰三个研究者。很多人的努力才让这成为了可能,比如我们的合作者和我们的学生,还有围绕深度学习进行科学研究的整个研究社区。我认为这个奖是对这个社区的表彰。这是非常重要的,因为过去的很多图灵奖获得者都对计算机科学做出了非常理论的贡献,但深度学习却大不相同。这是真正正在改变世界的东西。当然其中也有理论,但很多东西都非常涉及直觉,非常具体。

多年以来,机器学习这个研究分支都被认为不如理论计算机科学那样有价值。所以我们获得这个奖事实上传递了一个信号:机器学习 AI(尤其是深度学习)现在已经确实为科学做出了重要贡献,这些贡献不只是来自公司企业,也来自学术界。

在 2019 年,您看到的最激动人心或最具创新的机器学习趋势有哪些?

Yoshua Bengio:我看到了在主动机器学习方面的一个进展,其中学习器获得一个大型数据集,然后主动练习其与环境的交互。所以这不是强化学习,而是主动学习。在对话系统这样的系统中,交互过程能让学习器不断改善或获取信息。

这与传统的方法非常不同。这与博弈论有关,也与我们不熟悉的新问题有关,比如多智能体。这也与因果问题有关,涉及很多方向。我认为整个研究领域没有止步在一个极小范围内,而是为研究者和公司们打开了许多有趣的新研究方向。

在最近举行的ICML 2019大会上,最佳论文《Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations》挑战了无监督学习方法,您如何看待最近这些研究?以及之后无监督学习的发展方向?

Yoshua Bengio:我知道那篇论文,但我还没读过。我认为这是对「disentangling」原本含义的误解。很多人目前将disentangling理解为顶层变量的相互独立关系,但那只是非常粗略的近似。想想你使用一门语言的情况。它们不是独立的,因为你可以构建词之间的联系并得到句子。所以使用某种基本统计假设是错误的。包括这篇 ICML 最佳论文在内的这整个体系的论文都试图发现这些独立的因素,我认为这不是正确的做法。这是我的看法。

如今很多大学已开办了人工智能硕士、博士、甚至本科专业(特别是在中国)。如何看待这种情况,这对于学界发展是否有好处?

Yoshua Bengio:这很好,非常重要。我们的研究需要人才,而人才成长于大学。

MILA与滴滴的研究合作

滴滴和 MILA 是如何开始接触的?这次合作的主要目标是什么?

吴国斌:实际上我们是从去年开始的。我们先访问了 MILA。去年年底,Yoshua Bengio 访问了滴滴。经过几次讨论之后,我们都认为我们在智能驾驶的深度学习方面有很多共同兴趣。这是研究方面。我们也都有为社会福祉研发 AI 的兴趣。尤其是在滴滴公司,我们有很多面向社会福祉的 AI 项目,比如照料司机的健康环境以及可用性项目。第三点是我们都关心人才培养。通过与 MILA 合作,我们肯定能培养出交通和 AI 人才。

去年 Bengio 教授访问滴滴的目的是什么?

Yoshua Bengio:我当时正在访问中国,而且拜访了中国多个组织机构。我受邀前去访问,而且我听说过滴滴以及他们的工作。之前在蒙特利尔也曾有一次会面。我听说过他们在强化学习领域的工作,而强化学习也是 MILA 的一大重要研究主题。

MILA 一开始基本只做深度学习研究。我们是深度学习领域的先行者,过去几年,我们一直在扩大深度学习延展的范围。所以如你所见,现代强化学习研究很多也都用到了深度学习,这也被称为深度强化学习,其应用领域包括机器人、移动机器人和许多其它的决策系统。另外,MILA 也不再是一个单纯关注基础研究的组织了,我们也希望与世界其它部分连接起来——通过与公司企业合作、参与到对社会有益的机器学习 AI 应用的研发中以及参与到那些公共讨论中,比如政府和企业应当如何定义什么是好的 AI 应用以及什么在社会福祉方面是可以接受的。

我和 Liam Paull(他是一位移动机器人的专家)等同事与滴滴的互动使我们认为这样的互动是互利共赢的。

能具体说明滴滴和 MILA 在做哪方面的共同研究吗?你们提到了强化学习,这会是你们研究的一大主要部分。其它部分呢?在 AI 实现社会福祉方面又如何呢?

Yoshua Bengio:目前来说,我认为这个项目还有待定义。但让我从我们 MILA 想要研究的方向来回答一下。这可能也会与滴滴有所关联。在深度强化学习方面,有很多有趣的研究都想要问答这一问题:一个学习系统可以如何与其环境交互,根据所见到的决策的效果来采取决策,从而搞清楚这个环境的运作方式?以及搞清楚哪些策略是有效的,哪些是无效的?这就是通常意义上的强化学习问题。

但在 MILA,我们感兴趣的是构建能以某种方式理解其环境的系统。因此,要构建一个模型,获取所观察到的现象的基本解释。这是一个非常基本的研究问题,涉及很多方面,比如我个人很感兴趣的理解变量之间的因果关系。实际上当前机器学习领域非常缺少这样的研究,但这对工业界非常重要;因为在工业界,你需要的不只是获取变量之间的相关性,你还要了解如何进行决策,你要了解这样或那样的动作会导致怎样的结果。

我举个例子。下雨与我打开雨伞是存在关联的,这是个事实,但我不能通过打开雨伞来实现下雨。但是,如果开始下雨,则会产生我打开雨伞的效果。所以可以看到,如果只是变量之间的相关性,是无法提供有关因果的信息的,但如果你要在真实世界中做决策,而且滴滴要做大量会影响到很多人的决策,你就需要理解因果关系。这是一个相当基本的研究问题。

我们也在使用 donkey car 环境研究移动机器人,这是学生也能非常轻松地应对的东西。它们其实就是有轮子的乐高积木,能够在非常迷你的城市中像非常小的汽车一样移动。然后我们就探索不同的强化学习和控制方法可以如何确定它们的路径、避免发生事故、优化某种奖励。这其实正是 Liam Paull 教授会在这次合作中参与的研究。他在这方面引领世界。

在社会福祉方面。MILA 的使命就聚焦于让研究成果能对世界产生积极影响。过去,我们已经参与了医疗保健应用。最近我们开始研究与环境相关的问题,比如气候变化问题。我们也在与将机器学习用于教育的公司合作。所以我们非常关心以一种让很多人受益的方式部署我们的研究。而且我们也在积极参与 AI 相关的社会对话。我认为政府、公司、研究者、人文学者、哲学家和人民之间需要大量讨论,以共同决定我们要如何处理 AI 给予我们的新力量。

吴国斌:我赞同 Bengio 博士。滴滴旗下有很多司机,就像是某种多智能体系统。所以如果考虑某种长期奖励,深度强化学习就是针对这类主题的非常好的研究。

Yoshua Bengio:多智能体系统实际上处于研究前沿。过去,强化学习研究者关注的是单智能体,旨在优化未来奖励。但在很多现实生活的场景中,智能体有很多,比如司机,每一个都会尽力优化他们各自的奖励。我们必须非常谨慎,因为博弈论告诉我们尽管每个智能体都有可能实现最优化,但它们也有可能被困在某个对所有智能体都不利的局面。

因此,它们需要彼此通信,以确保它们能以一种对尽可能多的智能体有利的方式协同运作。所以这需要协调,这也是语言存在的原因。它能帮助我们协同一起去做成事情,这比我们每个人都只独立去做自己的事要好得多。

这方面的研究还比较新。不同的智能体如何学习协调各自动作的通信语言,这方面还有很多问题。

上周四,MILA与滴滴出行宣布达成了战略合作协议

目前滴滴已在驾乘共享业务以及其它一些共享通勤业务上取得了成功。滴滴过去还曾表示其将会革新或甚至塑造交通乃至城市的未来。所以我想知道你们的合作将如何帮助实现这一目标?

Yoshua Bengio:MILA 现在是世界上深度学习研究者最集中的学术界机构。所以对于想要紧跟科学进展以及靠近这个研究者群体的公司来说,这是一个很独特的地方。需要记得一个重点,机器学习领域的研究发展速度非常快。我和同事曾在三年前为深度学习写了一本书(与Aaron C. Courville、Ian Goodfellow等人共著的《Deep Learning》),这三年来情况已经发生了很大的变化,也诞生了很多新思想。所以我想对于公司而言,紧跟发展进程是非常利益相关的。要做到这一点,一个好办法就是与引领该科学前沿的研究机构建立良好的关系。

吴国斌:在 AI 实现社会福祉方面,滴滴实际上付出了很多努力。去年我们在北京建立了一个 AI 赋能社会共创平台。所以我们已经有多个与 AI 实现社会福祉相关的项目,比如环境方面的。我们在我们的滴滴汽车中安装了一些远程传感器,用于发送某些空气污染指数。这是一个非常相关的项目。另一个是我们也安装了 AI 司机助手,能够为驾驶员的生活和驾驶提供帮助。

交流与冲突

加拿大和美国虽是两个不同的国家,但在如今的环境下能看到 MILA 愿意和中国的科技公司合作,着实有些出乎预料——毕竟美国现在正在清洗中国的学者。MILA 仍有兴趣与中国公司合作的原因是什么呢?

Yoshua Bengio:我喜欢你的问题。我认为现在美国和中国以及很多西方国家和中国之间发生的事情是非常不幸的。这无助于在国际层面上解决需要解决的问题,从而让这个社会变得更好。我认为我们现在处在人类历史的这样一个时期:我们比以往任何时候都需要强大和协同的国际合作。否则我们无法解决气候变化这样的问题。我们甚至可能无法处理由 AI 带来的问题,比如我很担忧的一个问题是机器学习被用在杀人无人机里面。所有这些事情都需要国际性的条约。国际合作是非常强大的。

当出现今年这种互相挑衅地拉帮结派和政治紧张局势时,一切都会走向错误方向。这也毫无用处。所以我想我们押注未来会走向更好的方向。我也认为我们与滴滴的这类合作也能向政府释放信号:互利共赢是要一起去努力。这可能只是个小举措,但如果有足够多的组织能跟随这类范例,那么就可能带来影响。

在我与滴滴的研究者的互动中,我的感觉是他们已经在机器学习专业知识方面达到了与时俱进;他们有很多数据,他们也在实验最先进的方法。因为 MILA 在做非常前沿的研究,所以他们也可以从中受益。同时全世界还有很多公司甚至不能适当地组织自己的数据,更别说及时使用机器学习了。

我们在建立合作关系时,我们希望合作伙伴已经准备好利用他们与我们的互动了。否则,就会出现很多让人挫败的结果。如果连基本的数据科学都做不好,那肯定是做不好 AI 的,因为这需要爆发式的数据。如果公司不建立自己的内部研究团队,那么学术界的研究者与产业界的研究者会很难沟通。虽然可以做,但双方都要付出多很多的努力去沟通,尤其是一开始双方甚至不说同一种语言时。

说到学术界和产业界,我们知道大学的很多人才正在流入产业界。这种学术界向产业界的人才流动会对基础研究产生什么影响?

Yoshua Bengio:这是好问题。我要说一两年前的情况甚至更糟,因为很大一部分的机器学习教职人员都被公司挖走了。所以现在,我这一代仍为大学工作并从事深度学习研究的资深研究者已经很少了,甚至二十年或十年前毕业人都不多了。总之人不是很多。

好消息是过去三四年 MILA 以及全世界许多研究机器学习深度学习的大学迎来了世界各地的研究生博士生,推动着这门科学的进步。现在这些人正在进入人才市场。所以我想我们将开始迎来新的教职人员,年轻的教职人员将开始教授深度学习。以蒙特利尔为例,大约六年前我们 MILA 只有五位教授。而现在我们 MILA 有二十位常驻教授,只是这个学年,我们就要在与我有联系的不同大学之间填补近十个教职岗位。所以有很多新的教授在进入大学。我们通过这种方式流失大量人员虽然仍是个问题,但情况在开始好转。

另一件有帮助的事情是我们可以和公司达成协议让某些教授兼顾产业界和学术界而工作。时间比例可以从非常极端的 80-20 或 20-80 到平均的 50-50。这种做法的好处是这些教授可以继续指导研究生。他们的教学时间可能更少了或完全不教课,但他们仍然能帮助训练下一代,当然他们也通常会有更好的收入。所以每个人都能满意。至少我们维持了训练下一代的能力,这是最重要的事情。

2019 年 6 月 15 日,Yoshua Bengio、Geoffrey Hinton 与 Yann LeCun 在图灵奖颁奖典礼上。

人工智能5G 中哪项技术对自动驾驶更重要?

Yoshua Bengio:5G 涉及的是基础设施和通信。AI 则关乎我们构建智能和决策的方式。当然 5G 也许能促进数据获取。在我看来,这两个领域的研究是独立的。

你知道训练深度学习算法也会导致气候变化吗?

Yoshua Bengio:这基本上是个假新闻。我有一些同事正要写点东西反驳这个说法。举个例子,比如谷歌训练的那些模型。谷歌已经设立了一个系统让他们的 GPU 和其它设备的能源消耗达到碳平衡。他们的方法是,对于他们的计算机使用的所有电力,他们会购买水电等负碳的电力来源,以将相同数量的能源投入电网。这样就以某种方式抵消了消费过程中潜在的碳产生。这一点要记住。当今负责任的公司虽然燃烧了大量能源,他们也在为此负责。

还有一件事,我知道我需要谨慎一点,因为我自己没做这些计算。但我和一些人谈过,我们做的研究所消耗的实际能量其实并不多——我想具体数字还需要仔细检验。原因是这取决于你是如何做计算的,也取决于你的模型大小。有些模型非常大,甚至我们 MILA 也无力运行它们,因为我们没有那样的基础设施。所以仅有少数几家公司能够运行他们谈到的那些非常大的模型。所以那个新闻存在很多问题。

但这个新闻好的部分是也许能帮助公司更有意识地去关注他们在计算上的能源消耗对气候变化的影响。然后它们能学习谷歌等公司的做法。我认为这能激励人们研究能耗高效的计算。公司能去开发也许能效高十倍甚至百倍的芯片。这是好的方面,但我认为这有些夸大了。


入门最佳论文ICLR 20195G深度学习Yoshua Bengio图灵奖
1
相关数据
Ian Goodfellow人物

Ian Goodfellow 是机器学习领域备受关注的年轻学者之一,他在本科与硕士就读于斯坦福大学,师从吴恩达,博士阶段则跟随蒙特利尔大学的著名学者Yoshua Bengio研究机器学习。Goodfellow 最引人注目的成就是在2014年6月提出了生成对抗网络(GAN)。这一技术近年来已成为机器学习界最火热的讨论话题,特别是在最近几个月里,与GAN有关的论文不断涌现。GAN已成为众多学者的研究方向。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

博弈论技术

博弈论,又译为对策论,或者赛局理论,应用数学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。博弈论被认为是20世纪经济学最伟大的成果之一

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

多智能体系统技术

一个多智能体系统,是由一个在一个环境中交互的多个智能体组成的计算系统。多智能体系统也能被用在解决分离的智能体以及单层系统难以解决的问题。智能可以由一些方法,函数,过程,搜索算法或加强学习来实现。尽管存在相当大的重叠,然而一个多智能体系统并不总是一个基于智能体的模型表现一致。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

主动学习技术

主动学习是半监督机器学习的一个特例,其中学习算法能够交互式地查询用户(或其他信息源)以在新的数据点处获得期望的输出。 在统计学文献中,有时也称为最佳实验设计。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

移动机器人技术

移动机器人是一种能够移动的自动机器。移动机器人具有在其环境中移动的能力,并且不固定到一个物理位置。移动机器人可以“自动”主要是指它们能够在没有物理或机电引导装置的情况下导航非受控环境。相比之下,传统的工业机器人或多或少都是固定的(stationary)机械臂或抓取组件。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

👏