Herin Zhao作者

对话Gary Marcus:人工智能还未找到它的牛顿,我们不能依赖它

Gary Marcus,他是一名成功的科学家、畅销书作家、企业家,以及 Geometric Intelligence (被优步收购的机器学习初创公司) 的首席执行官和创始人。作为一名作家,他经常为「纽约客」和「纽约时报」撰稿,并且是四本书的作者。作为纽约大学心理学和神经科学教授,他在人类和动物行为、神经科学、遗传学和人工智能等领域发表了大量文章,并经常刊登在 Science 和 Nature 等期刊上。

在这次的采访对谈中,Gary Marcus 与机器之心 (Synced) 开展了关于深度学习以及人工智能整体发展的谈话。

(以下为对话原文,机器之心做了不改变原意的整理。)

您能总结一下您 2018 年的研究工作吗?

我在 2018 年最重要的工作是写了一系列论文,概述了深度学习的局限性。人工智能现在的大体状况,我认为并不像大多数评论所说的那样。我写的两篇主要文章一篇叫做《Deep Learning: A Critical Appraisal》,另一篇是《Innateness, AlphaZero, and Artificial Intelligence》。它们都可以在 arXiv 上免费阅读。第一篇已被广泛阅读,我认为 AI 领域的每个人似乎对其持有意见。第二篇不太好读,但我认为这一篇也很重要,值得一谈。

第一篇试图阐述深度学习的局限性,并指出了 10 个问题,主要是关于深度学习依赖大数据并且归纳能力不很糟糕的问题。第二篇文章是关于先验知识以及其应该如何纳入 AI 系统中的问题。我想这是一种历史重现,这个现象在人工智能的早期就出现过。那时人们几乎在所有的应用中试图引入 AI,系统想从头学习几乎所有东西,但是几乎没有什么效果。在这个领域存在一种错觉,大家好像都认为只要从零开始学习就能实现真正的智能。这几乎是所有人对 AI 领域的偏见。深度学习最近取得了不错的成绩,但人们必须了解这些结果是什么以及有哪些限制。从根本上说,我认为实现智能和很多层面相关。我们已经构建了一些可以实现智能相关的系统,但是在很多其他方面,人类的表现远比机器好。我们需要理解这是为什么,因为它是解决方案的一部分。

如果用一个词来描述过去一年的人工智能发展,您会选择哪个词呢?

用一个词来概括很难做到,但我想我会选择「overhyped」(吹嘘过头/炒作过度)这个词。

在过去一年中,您经常批判深度学习的局限性。您一直在与很多人争论,尤其是大学教授或其他大公司的研究人员,特别是 Yann LeCun,请问您为何如此着迷于批判深度学习呢?

我与 Yann LeCun 的 Twitter 战争只是我所做的一小部分。我的背景是认知科学家。当我还是一个小孩的时候,我尝试了计算机编程并对人工智能感兴趣。但后来我的毕业作品是关于人类认知研究的,其中部分原因是我觉得人工智能并没有取得多大进展。当我从人类认知发展的角度看待当前的人工智能时,就会思考对于同一个问题孩子们是如何学习的呢?我有两个孩子,一个四岁,一个六岁。我对 AI 现在能做到的事情感到非常不满意。因为没有 AI 能像我四岁或六岁的孩子那样聪明。虽然 AI 确实可以在某些任务上表现良好,但是任务范畴实际上非常狭窄。每天我都将白日里观察到的工作中 AI 的状态与晚上在家时我孩子们的状态进行对比。我认为深度学习是被过度炒作了。作为认知科学家,我也会从人类认知的角度去思考深度学习常用机制背后的原理,这些机制的好处我认为有很大一部分是让人感到困惑的。

曾经有一个术语,我猜它可能来自古希腊人,称为「合成谬误」。它的意思是当你在一个案例中找到了一些正确的规律,然后你会自动认为这些规律在所有情况下都是成立,我认为这就是深度学习研究的现状。很多学习哲学的学者通常使用一些不那么正确的论证,而这正是哲学家所做的,并且其中一个让论证变得不那么正确的原因是由于过度概括。而深度学习,就是一个被过度概括的案例。如果人们发现某些方法适用于某些问题,并假设因为它适用于某些问题,所以它将适用于所有问题,那就是胡说八道。

事实上,我们可以系统地看待深度学习效用的问题。深度学习非常擅长图像分类,非常擅长标记单词,尽管并不完美,但表现已经非常好。不过深度学习不是很擅长理解场景。

你在推特上看到的一些辩论是由我发起的,因为我注意到这个领域正在发生变化,但是人们并不喜欢。因此,多年来我一直在说,深度学习是浅薄的,它自身并不能真实地反映出事物的运作方式或它们在世界上的作用,这只是某种统计分析。Yoshua Bengio 作为深度学习的先驱之一,也得出了相似的结论。所以我说,看看,Bengio 说的实际上和我在 2012 年所说的一样。这就是真正牵扯出那一系列 Twitter 辩论的原因。

而且我认为这对几个方面都很有启发性,一个是关于 AI 领域如何运作的社会学。现在像 LeCun 等人基本上基于我个人资格来攻击我,而不是基于我的论证。这绝不是一个好兆头。我认为当人们在论证中发表观点时攻击的是对方而并不是反驳观点,是因为他们没有一个好的论据,我感觉我和 LeCun 的辩论就是这样的情况。他也歪曲了我很多观点,所以我在 12 月份在 Medium 上写了一篇文章,指出了他歪曲我立场的地方。

我想表达的不是深度学习本身很糟糕,而是只有它本身还不足够。因此,对于我刚刚概述的这些问题,例如深度学习图像分类是有益的,但对于其它问题来说并不是。我想到的一个隐喻是工具包,我认为将深度学习作为多种解决方案中的其中一种工具是很好的。我认为,如果没有了其中一种工具,你就无法建造整栋房子。

那请问您现在与 Yann LeCun 的关系是什么呢?

我认为我们是亦敌亦友。虽然当他歪曲我时,就会更倾向于敌人那部分,我不认为朋友应该互相歪曲。如果你观看 2017 年我们在 YouTube 上的辩论,会看到我们当时相处得很好,之后还与一群人共进晚餐。我们聊了一整夜,很棒。但是我觉得他现在变得更倾向于一种戒备状态,并且产生了一些攻击性。我们确实在 12 月中旬进行了一些交流,当时我列出了我在 Twitter 上放出的我认为同意的观点和不同意的观点。

所以您是否曾在辩论中改变或调整过您关于深度学习的观点呢?

你可以阅读我在 2012 年在纽约客中写的那篇文章。我想我仍然支持我在那里所说的内容,基本上说的是深度学习是一个非常好的工具。这篇文章叫《Is「Deep Learning」A Revolution In Artificial Intelligence?》,我说深度学习对某些问题非常有效,但它对抽象、语言处理、因果推理等等方面并不是很有效。从这个意义上讲,我认为我的立场没有改变。

我认为人们对于如何利用深度学习非常聪明。这几乎就像是你拥有的只是一把螺丝刀,但你可以尝试将所有一切问题都转化为一把螺丝刀可以解决的问题。人们一直很擅长这一点。例如,人们已经大量尝试使用深度学习来使旧视频游戏具有更高的分辨率,这是一个非常聪明的应用案例。深度学习中还有很多非常聪明的应用,这肯定会对世界产生很大的影响,但我认为它并没有真正解决人工智能的根本问题。

您是混合模型的不懈倡导者,混合模型利用了经典符号系统和深度学习的优势。您能否给我们一些这方面的研究实例?

我不认为我想要的东西存在于 AI 中。我认为最好的例子实际上关于意识的泄露。所以如果你还记得 Daniel Kahneman 关于系统 1 和系统 2 认知的工作(https://bigthink.com/errors-we-live-by/kahnemans-mind-clarifying-biases),这有点类似。我们有不同的系统来解决不同的问题。他的版本是我们有一个自动工作的反射系统,以及一个通过推理工作的审议系统。你可以争论其中一些细节,但我认为背后的一般直觉是正确的。我们谈论的与心理学相关的另一件事是:自下而上的感知 vs 自上而下的感知。因此,任何心理学教科书都会告诉你,许多实验也指向这个方向,那就是我们可以自下而上地感知、我们可以识别像素等。

但比如,我现在正在通过视频会议看着你,如果你截取屏幕截图,你的眼镜中会出现一些小方块。这些看起来像电脑屏幕的小矩形实际上是屏幕的映像。实际上,如果我能够足够仔细地观察它们,我会看到我自己。但我也并不认为我存在于你的眼镜里。如果基于自下而上的感知,像素点似乎与你眼镜中的两个 Gary Marcus 的图像是一致的,但从我自上而下的感知认为这是不可能的。首先,除非我有一个长得完全相同的双胞胎,否则不可能有两个 Gary Marcus。然后他们坐在你的眼镜里太小了,而且他们太模糊了。因此,对这件事的更好解释是,它们是我无法看到的显示器的反射倒影。我看到你,而不是显示器。我把对这件事的解释合并在一起。就眼镜、反射、镜子等实体而言,这更像是经典 AI,而不是像素的简单分类。当然,我无法从数据中学到这一点。在你的眼镜里,我的映像或其他什么都没有预先贴上标签,所以我不能以同样的方式做到这一点。

因此,神经科学或心理学或认知神经科学(不管是什么名称吧),它们都告诉我有不同的视觉途径。我正在使用的当然有我从像素中获得的所有信息,但我也同时运用了我对这个世界的认知,例如眼镜是如何工作的、反射是如何形成的、人的大小等等,以便将所有信息都综合在一起。然后我正在看着你,我试着做一个分析,『他正在点头』。因此我认为他理解我在说什么,或者如果他看起来很迷糊,那么我会改变我的谈话进一步解释来解决对方的疑问。可我们现在没有能够做出这样判断的工具。我作为人类向你描述它的方式至少涉及概念,比如眼镜和反射等概念,所以我认为可以将这两个东西放在人工智能中,就像它们在人类进化中融合在一起一样。

如果你问我有没有人知道一个非常好的代码库正在为他们的商业产品做着这方面的融合,答案估计是没有。我想我们仍然需要做一些探索。我曾经写过一篇关于神经科学还没找到它的艾萨克·牛顿 (Isaac Newton) 的文章。这个观点也可以扩展到 AI,我也不确定 AI 是否已找到它的艾萨克·牛顿。我们已经拥有了一些基本的机制体系和想法,但我们并不真正理解它。因此,人们实际在某种程度上编写的代码或几乎所有人用 AI 写的东西都是脆弱和狭窄的,它只适用于它所构建的环境,但无法去适应别的。而对于人类而言,专家可以适应各种与他们所看到的或他们所已知的内容略有不同的事物。即使不是专家,当我们进行对话时,如果我告诉你一些新闻和不寻常的事情,你也可以适应它。比方说我告诉你,有人从一个非常大的梯子上掉下来,你就会开始想象到这个场景发生的状况,即使你从未真正置身于这种情况之中。

您认为最近哪些研究工作有着巨大潜力?

不能很精确的说吧,但是我认为有一些事情正朝着良好的方向发展,例如图网等。人们至少接受了这样一个事实,即知识的结构不仅仅是一个很大的载体,而且是一长串的数字。我认为没有人解决过这些问题,但至少他们现在正在努力认真地对待这些问题。这让我们考虑到更广泛的模型类型,我认为这就是我们需要的。

请问您 2019 年的研究工作重点是什么呢?

我对机器人技术非常感兴趣。关于这个我不会说太多。但是我认为机器人技术是一个很好的领域,因为它可以测试很多例如常识推理的想法,比如你如何推理世界运作的方式。如果你要建造一个人们几十年来一直在谈论的家用机器人,它可以在家里自由行走,走到厨房走到客厅,它可以捡东西或者以各种方式帮助人们,那么你必须深层次地了解这个世界,而不仅仅是处于肤浅的层面。

因此,深度学习的另一个问题是它通常可以在 80%的情况下起作用,然后在 20%的情况下产生奇怪的错误。当你推荐东西时,如果你使用的是推荐引擎或图像标注,那么成本非常低。如果我标记了一堆照片出现了一个错误,这可能没什么大问题。但即使是图像标记,如果是在一个容错率极低的场景设置里出错那可能也会带来很大问题。

家庭环境是最不希望出现差错的地方。你不希望机器人碰到桌子上的蜡烛,然后着火。所以你必须让人工智能以可靠的方式运作。因此,我正在撰写的书,或者说与 Ernest Davis 刚刚一起完成的书,是关于如何制作值得信赖和可靠的 AI 的。这需要让机器拥有足够的常识,它们可以通过行动后果来思考,这样机器人才算是真正具备智能。

您对 2019 年人工智能的发展有何期待?

我不期待任何巨大的进步,但巨大进展也是可能的。如果有大的进展,我们可能不会立即听到它们,因为采纳一个好主意并将其付诸实践需要时间。因此,类似地,我期望在 2019 年,你能够问 AI 系统更多、更广泛的事情,比如亚马逊的 Alexa 和苹果的 Siri 等。很多这样的企业今年没有着重展开与机器的真实对话。但是有很多尝试是在家庭环境里配备某种机器人,不过这些机器人现在还相对简单和粗糙,但我们会看到这个领域之后的进展。我不知道我们是否会看到人工智能发生重大改变,不过这是可能的。去年有足够多的人认识到深度学习的范式是有局限的,也许有人会真正解决这个问题并想出一些新的东西。

您对中美之间开展人工智能技术的竞逐有何看法?如果美国计划限制人工智能出口,那将如何影响人工智能的整体发展呢?

竞逐已经开始了。中国做的事情比美国做得更多。我认为美国是更有历史优势的。美国具备更好的研究生教育体系,可以促进创造力和创新等。但是现在,美国有一位总统,他以自己的方式狭窄地专注于自己所认定的道路。他并没有在培育科学和技术,这很不好。例如,我们一直在拒绝许多高质量的移民。拥有高质量移民是我们一直以来做得很好的原因之一。所以我认为,只要现任总统在任,我们就做得不好。另一方面,我认为目前中国的领导层对人工智能非常感兴趣,显然是投入了大量资金。

在过去一年中,人工智能出现包括数据泄漏、人才稀缺、模型偏见、可解释性、执法等问题,您最关心哪一问题?能否就此问题说说您的看法?

我现在最关心的问题,也是我的新书将要涉及到的,是 AI 还不是真的可靠。如果你在一个真正需要可靠性的任务中使用不可靠的东西,你会遇到麻烦。比方说用人工智能分类人们的工作申请、控制武器或者人们可能会想到的任何应用场景。如果在这其中的 AI 并不可靠但我们却依赖它,那么我们就会遇到问题。我的基本观点是,现在 AI 不可靠,这不是你可以在开放世界中使用的东西。我们现在拥有的最好的技术还属于狭隘的技术,适用于非常具体的问题,例如规则永远不会改变、你可以根据需求收集尽可能多模拟数据的场景。而当你把这些东西放到开放世界中,例如让它们驾驶汽车,虽然它们也可以工作,但你不能真正依赖它们。

在某些情况下,人们无论如何都会使用到它们,并且可能导致事故和死亡。在某些情况下,我们可能会推迟 AI 被应用的时间点。还有一个次要问题是,人们可能实际上已经放弃了人工智能,这由于一系列问题,比如构建聊天机器人和无人驾驶汽车等任务比炒作所说的要困难得多。但是我想很多人都认为我们到 2020 年将拥有无人驾驶汽车,可以将它们作为原型,但我们还不能指望它们。而且目前尚不清楚还要花多长时间才能达到真正可以依靠它们的程度。

因此,如果我们到了 2025 年,仍然需要人类进行演示,人们可能会厌倦人工智能,或许会开始减少资金投入,谁知道会发生什么呢?与此同时,如果有人说他们要在我家附近试行无人驾驶汽车,我会很担心,因为我认为无人驾驶汽车还不值得信赖。它们大部分时间都在工作,但你不知道它们什么时候就会做一些奇怪的事情。它们不会预先告知你,但就是这么做了。

理论Gary Marcus
2
相关数据
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

AlphaZero技术

DeepMind 提出的 AlphaZero 不仅征服了围棋,也在将棋、国际象棋等复杂游戏中实现了超越人类的表现。DeepMind 推出的 AlphaGo 曾在围棋项目中取得了超越人类的表现,其研究曾经两次登上 Nature。2018 年 12 月,AlphaGo 的「完全自我博弈加强版」AlphaZero 的论文又登上另一大顶级期刊 Science 的封面。在论文中,AlphaZero 不仅征服了围棋,也在将棋、国际象棋等复杂游戏中实现了超越人类的表现。

因果推理技术

基于因果关系的一类推理方法,是一种常见推理模式,涉及观察到的共同效应的原因的概率依赖性。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经科学技术

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

认知神经科学技术

认知神经科学(英语:Cognitive neuroscience)是一门科学学科,旨在探讨认知历程的生物学基础。主要的目标为阐明心理历程的神经机制,也就是大脑的运作如何造就心理或认知功能。认知神经科学为心理学和神经科学的分支,并且横跨众多领域,例如生理心理学、神经科学、认知心理学和神经心理学。认知神经科学以认知科学的理论以及神经心理学、神经科学及计算机模型的实验证据为基础。

推荐文章
暂无评论
暂无评论~