Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

文龙编译

对话《AI 3.0》作者:除非AI能够进行类比,否则永远不会真正像人类

来自波特兰州立大学的计算机科学教授梅兰妮·米切尔 (Melanie Mitchell) ,主要研究领域为复杂系统和遗传算法以及细胞自动机,著有科普畅销书《复杂》。米切尔承认深度学习神经网络的强大,但她同时也认为,人工智能研究如果能够回归本源,与认知科学等领域建立更牢固的联系,将会受益最大。

在米切尔最近的新书《AI 3.0》(Artificial Intelligence: A Guide for Thinking Humans)中,她对人工智能领域中一个著名的「莫拉韦克悖论」做了详细解说。该悖论指出,人类的高阶智慧只需要较少的算力,但直觉和本能却需要极大的算力。正如汉斯·莫拉维克(Hans Moravec)写的那样:
「要让电脑如成人般地下棋是相对容易的,但要让电脑有如一岁小孩般的感知和行动能力却是相当困难甚至是不可能的。」
图片梅兰妮·米切尔站在她最近一本书《AI 3.0》的封面投影前
米切尔和她的导师侯世达(Douglas Hofstadter)都认为,理解类比的认知过程对于解锁通用人工智能至关重要,这里的类比指的是人类如何在相似的想法、感知和经验之间建立抽象联系。
「类比是了解你所表达的意思的要点的过程。这是我们人类非常擅长的事情,但还没有人想出如何让计算机擅长这一点,」米切尔说。「『意思』的确很难定义。当我和你说话时,我能理解你的意思,因为我们有关于世界的共同的知识背景、共同的文化和相似的大脑,因为我们都是人类,都有过类似的经历。但是你如何让计算机有能力做到这一点呢?这很难。」
为了在计算机内部探索类比,米切尔和侯世达合作,共同开发了程序 Copycat,涉及字符串之间标准化测试中的类比。「如果字符串『abc』变成字符串『abd』,那么字符串『pqr』会变成什么?」但米切尔认为类比可以比这种模式匹配更深入,将「一种情况下学到的知识转移到另一种情况下」。
有趣的是,米切尔开始她的人工智能研究旅程,源于偶然读到的一本 1979 年获得普利策奖的著作《哥德尔、艾舍尔、巴赫:集异璧之大成》,当时她还在高中教数学。她很快就联系到了这本书的作者,并说服他给她了一个实习机会,这个人就是她的导师侯世达。当时的米切尔只学了几门计算机科学课程,但侯世达似乎对她的胆量印象深刻,并不关心她的学历。
图片米切尔说,进行类比(人工智能系统将现有知识应用于新问题)将帮助人工智能真正理解他们正在操纵的数据

以下是整理的部分采访内容。

为什么类比对人工智能如此重要?

这是一种基本的思维方法,可以帮助人工智能达到我们想要的目标。有人说,能够预测未来,或者能够有常识,或者能够检索对当前情况有用的记忆是人工智能的关键。无论是其中的哪一种,类比都是非常重要的。
例如,我们想要实现自动驾驶,其中一个问题就是,如果自动驾驶汽车面临一些与它们接受的训练略有差异的情况,他们将会不知道该怎么做。人类是如何知道在遇到从来没有遇到过的情况下该怎么做的?我们用原先的经验进行类比。这也是我们在现实世界中需要这些人工智能做到的事情。

类比是「人工智能中一个未被充分研究的领域」,如果它是如此基本,为什么会出现这样的情况?

人们没有深入研究它的原因之一是没有认识到它对认知的重要性。关注行为规则中的逻辑并编码——这就是早期人工智能的工作方式。最近,人们专注于从大量示例中学习,然后假设能够仅使用已学知识的统计数据对之前未见过的事物进行归纳。他们希望概括和抽象的能力能够从统计数据中产生,但它并没有像人们希望的那样有效。
例如,你可以向深度神经网络展示数百万张桥梁图片,它可能会识别出河上桥梁的新图片或其他东西。但它永远无法将「桥梁」的概念抽象为我们弥合性别差距的概念。事实证明,这些网络少了点什么,不会学习如何抽象,人们现在只是在努力解决这个问题。

神经网络永远不会学会抽象?

有新的机器方法,比如元学习,可以更好地「学会学习」;或者自监督学习,像GPT-3,学会用缺失的单词来填充句子,这让它能够生成非常有说服力的语句。有些人会认为,这样的系统在有足够多数据的情况下最终会完成学习抽象的任务,但我不这么认为。

您将这种限制描述为「含义障碍」 ——人工智能系统可以在某些条件下模拟理解,但在此之外会变得脆弱和不可靠。为什么你认为类比是我们解决这个问题的方法?

我的感觉是,解决脆弱性问题需要含义。这些系统不理解含义,这是最终导致脆弱性问题的原因,从任何人类的意义上来说,他们只是在处理的数据。
「理解」这个词是很难定义它真正含义的词中的一个——就像我们还无法解释的心理现象。但我认为,抽象和类比是所谓的理解的关键,是一种理解发生的机制。我们能够以某种方式把我们已经知道的东西映射到新的东西上。

那么类比是生物保持灵活认知的一种方式,而不像是机器行为那样?

我认为在某种程度上,是的。类比不仅仅是我们人类所做的事情,有些动物能够获取先前的经验并将它们映射到新的事物上。你能在多大程度上进行更抽象的类比,也许就是将一系列智能应用到不同种类的生命系统中的一种方式。
关于人类为何具有这种特殊智能的一种理论是,因为我们是按这种方式社交的。你要做的最重要的事情之一就是模拟他人的想法,了解他们的目标并预测他们将要做什么。这是你通过类比自己来做的事情,你可以把自己放在别人的位置上,把自己的想法映射到他们身上。这种「心理理论」是人工智能领域的人们一直在谈论的话题,它本质上是一种进行类比的方式。

您的 Copycat 系统是在计算机上进行此操作的早期尝试。还有其他人吗?

人工智能中的「结构映射」工作侧重于基于逻辑的情境表示,并在它们之间进行映射。肯·福布斯 (Ken Forbus) 和其他人使用太阳系与卢瑟福提出的原子进行了著名的类比,他们将描述这两种情况的一组句子,并且根据它们的结构而不是根据句子的内容来映射它们。这个想法很强大,我认为是对的。当人类试图理解相似之处时,我们更关注关系而不是特定对象。

为什么这些方法没有成功?

整个学习问题在很大程度上被排除在这些系统之外。结构映射会将这些非常具有人类意义的词相互映射,比如「地球围绕太阳旋转」和「电子围绕原子核旋转」。但没有内部模型「围绕」的意思,它只是一个象征。Copycat 与字母字符串配合得很好,但我们缺少的是如何将其扩展到我们真正关心的领域?

众所周知,深度学习的扩展性非常好。在产生有意义的类比方面是否更有效?

有一种观点认为,深度神经网络在其输入层和输出层之间发挥了这种魔力。如果它们能比人类更擅长识别不同种类的狗,它们应该能够解决这些非常简单的类比问题。所以人们会创建一个大数据集来训练和测试他们的神经网络,并发表一篇论文说「我们的方法在这个测试中获得了 80% 的正确率」,其他人则会说「等等,你的数据集有一些奇怪的统计特性,允许机器学习如何解决它们而不能概括。这是一个新的数据集,你的机器在这方面做得很糟糕,但我们的做得很好」……这样一直持续下去。
问题是,如果你不得不在成千上万的例子上训练它,你已经输了,这不是抽象的全部意义。关于机器学习中人们所说的「小样本学习」才是抽象的真正意义,这意味着你可以从非常少的例子中学习。

那还缺少什么?为什么我们不能像搭乐高积木一样将这些方法粘在一起?

我们没有指导手册告诉你如何做到这一点!但我确实认为我们必须把它们放在一起。这也是这项研究的前沿:所有这些的关键见解是什么,它们如何相互补充?
很多人对抽象和推理语料库(ARC)非常感兴趣,这是一项非常具有挑战性的小样本学习任务,围绕人类本质上与生俱来的「核心知识」而构建。我们知道世界应该被解析为对象,我们知道一些关于空间几何的知识,比如某物在某物之上或之下。在 ARC 中,一个颜色网格变成另一种颜色网格,人类可以用「一种颜色的所有方块都向右,其他颜色的方块到左边」这种核心知识来描述。
我认为这是一个类比挑战。你试图找到某种抽象描述从一张图像到新图像的变化,但并不会学习任何统计相关性,因为你只有两个示例。如何让机器利用婴儿拥有的核心知识进行学习和推理——这是我迄今为止提到的任何系统都无法做到的。这就是为什么他们都不能处理这个 ARC 数据集的原因。这有点像是一种崇高的理想。

如果婴儿天生就具有这种「核心知识」,那是否意味着人工智能要进行此类类比,还需要一个像我们这样的身体?

这是一个价值数百万美元的问题,也是一个非常有争议的问题,AI 社区还没有达成共识。我的直觉是,是的,如果没有某种实体,我们将无法在 AI 中进行类比。拥有一个身体可能是必不可少的,因为其中一些视觉问题需要你从三个维度来思考它们。对我来说,这与生活在这个世界上并四处走动,了解事物在空间上的关系有关。我不知道机器是否必须经过那个阶段,我认为它可能会。
产业《AI 3.0》人工智能
相关数据
模式匹配技术

在计算机科学中,模式匹配就是检查特定序列的标记是否存在某种模式的组成部分。 与模式识别相比,匹配通常必须是精确的。 模式通常具有序列或树结构的形式。 模式匹配的使用包括输出令牌序列内的模式的位置(如果有的话),输出匹配模式的某个分量,以及用另一个令牌序列(即搜索和替换)替换匹配模式。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

遗传算法技术

遗传算法是计算数学中用于解决最优化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择以及杂交等。 遗传算法通常实现方式为一种计算机模拟。对于一个最优化问题,一定数量的候选解可抽象表示为染色体,使种群向更好的解进化。

推荐文章
暂无评论
暂无评论~