围棋,Marvin Minsky与人工智能尚未跨越的鸿沟

本文作者Gary Marcus是机器学习公司Geometric Intelligence, Inc.的创始人兼CEO,也是纽约大学心理学与神经科学教授,最新的著作是《大脑的未来( The Future of The Brain)》。谨以本文向Marvin Minsky致敬。

短短一周时间,人工智能领域就发生了两件大事。1月24日晚,人工智能失去了一位最伟大的先驱者Marvin Minsky;28日,我们看到了在解决困扰人工智能数十年的围棋难题上所取得的重大进展。这两件事都值得大书特书,但其中也出现了很多炒作和混淆视听的言论。许多「AI威胁论」使人们试图阻碍人工智能的未来发展,而这对就业,甚至人类的未来意味着什么,所以了解现在我们到底已经走到哪一步——什么已经实现,什么尚未完成——就非常重要了。

1-OH8ytZN_tVz76_It5GAhYQ

事实:DeepMind发表在《自然》杂志上的论文展示了人工智能在下围棋上所取得重大进展,而下围棋对机器的难度是众所周知的。(本周早些时候另一篇由Facebook发表的论文也同样报道了重大的进展。)

事实:DeepMind击败了欧洲围棋冠军。

流言:欧洲围棋冠军并不是世界围棋冠军,甚至还差得远。例如,BBC的报道「谷歌实现AI『突破』,力挫围棋冠军」,另外还有其它数百家新闻媒体基本上也使用了类似的标题。但欧洲的围棋几乎算不上一项竞技运动,这位欧洲围棋冠军的全球排名仅为633。一个击败排名633位职业网球选手的机器人却是很了不起,但却不能就此认定它“已掌握”这项运动。DeepMind取得了重大的进展,但其围棋之旅仍未结束;YCombinator依据一条迷人的线索认为该程序(仍在进步中)目前的排名为279。

除了流言中的非典型问题,还有一个重要的技术问题:获胜的计算机系统的本质是什么?作为背景,长时间以来所谓的神经网络模型(其中最现代的形式被称为「深度学习」)和已故的Marvin Minsky所主张的经典「有效的老式人工智能(GOFAI)」系统之间一直存在着人们的争论。Minsky,以及其人工智能联合奠基者John McCarthy在罗素的逻辑主义传统中长大,并试图以类似于逻辑语言的方式发展人工智能。而另一些人,比如50年代的Frank Rosenblatt和现在的深度学习研究者Geoffrey Hinton以及Facebook的人工智能负责人Yann LeCun,则一定程度上是在得益于神经科学的简化神经元上构建模型。

读过了许多媒体报道的文章(甚至包括我一些同事在Facebook上发布的帖子)后,可以发现DeepMind的获胜是神经网络方法的轰动性胜利,因此Minsky选错了方向,他的方法已经完全失宠了。

但不要着急。如果你阅读过DeepMind发表在《自然》上的论文(或真的只读过摘要),你就知道AlphaGo并不是完全都是神经网络——实际上它是一个混合结构,结合了深度强化学习和经典人工智能的一项基础技术——树搜索(tree-search)。树搜索是Minsky的同事Claude Shannon在神经网络发明前几年发明的(尽管其更现代的形式是蒙特卡洛树搜索),同时也是他的许多学生的早期成果的组成部分。

对于任何知晓认知科学历史的人来说,有两个人应该对这样的结果非常满意:Steven Pinker和我自己。Pinker和我在1990年顶着这一领域的巨大敌意,为结合联想网络(associative network,即今日深度学习的前身)和经典符号系统的模块化系统进行游说。这是Pinker的书《词汇与规则》的中心论点,也是我1993年论文的核心。我们的主张引起了数十位学者激烈的争辩,他们认为单一的、未分化的神经网络就足够了。神经网络的两位主要倡导者为经典的符号操纵系统(symbol-manipulating systems)进行了有名的辩护,而Pinker和我表示那并不是「人类计算的本质」。

如果你仔细读过,可以看到《自然》的论文表明DeepMind著名的Atari游戏系统中纯净的深度网络方法在围棋问题上并不如混合系统,正如Pinker和我当初所预料的那样。

当其发生时,Pinker和我正在Minsky方法的基础上构建人工智能。神经网络(现在以「深度学习」更为人知)领域的人经常辱骂Minsky。几十年后,老套的人仍然还在拿Marvin 1969年的书《感知器》(与Seymour Papert合著)说事儿。在他们看来,Minsky和Papert无理取闹地向神经网络的早期领域泼了一瓢冷水,被许多人认为是他们过早地扼杀了这一领域。用计算机科学家和作家Pedro Domingos的话来说:「如果机器学习的历史是一部好莱坞电影,那大反派就是Marvin Minsky。」

但人们总是在乱讲故事。通常的说法是Marvin宣称不可能从神经网络中学到任何有趣的(「非线性」)东西。而Minsky和Papert真正说明的是不能使用现有的一些工具确保——证明——带有隐藏层的神经网络可以收敛出一个正确方案。他们邀请读者接受或反驳他们的猜想。2016年的网络越来越深,但它们与现实世界数据的工作方式仍然只有少量可证明的确定结论。

在关于围棋的这篇论文被公之于众的前几个小时,我参加了一个会谈,会上一位深度学习专家的研究生承认(a)这一领域的人仍然并不真正了解为什么他们的模型会工作得这么好,(b)如果将其模型放入与其被训练的坏境明显不同的坏境中进行测试,他们仍然不能真正确定任何结果。对许多神经网络领域的人来说,Minsky代表了邪恶帝国。但几乎半个世纪过去了,他们仍旧没有完全正视他的挑战。

DeepMind的围棋程序接下来会怎样呢?短期来看,如果它真正击败了真正的世界冠军,我也不会感到惊讶——也许很快,如他们所希望的三个月之后,或许是几年之后。但长期来看就少些确定性了。真正的问题是这个在游戏世界中开发的技术能否被应用于现实世界。IBM在利用深蓝(国际象棋冠军)和沃森(Jeopardy冠军)打造有说服力的产品上一直磕磕绊绊。部分原因是现实世界和游戏世界存在根本性的不同。在国际象棋中,每一个局面都只有大约30种不同的运动,规则也是固定的。Jeopardy中超过95%的答案是维基百科的词条标题。在现实世界,任何问题的答案都涉及到所有事情,没有人能想出该怎样扩展人工智能使其能在面对开放式的世界时能达到人类水平的复杂度和灵活性。

要全面了解,有必要瞥一眼《纽约时报》本周早些时候发布的个人助理(如Siri和Google Now)评估文章。每一个系统都有他们特有的优势和劣势。但它们中许多甚至答不出下周参加超级碗比赛的队伍是哪些。

人工智能在现实世界中应用仍然是相当困难的。真正值钱的问题——现在还没人知道答案——是通过围棋测试的人工智能能更快地应用到我们手中吗?

入门人工智能