Edge 2017年度人工智能话题预测:从算法、迁移学习到自产生程序

Edge.org 为著名知识分子俱乐部 The Reality Club 的线上社区,自 1996 年上线,如今已有 20 年历史。在其创刊 20 周年之际,Edge.org 也推出了 2017 年度问题——2017 年,最值得关注的科学术语或概念是什么?


以下是我们从206个回答中精选的一部分:


Terrence J. Sejnowski,计算神经科学家;萨克生物研究学院(Salk Institute)弗朗西斯·克里克学院(Francis Crick Institute)教授;《The Computational Brain》联合作者


科学术语:算法(Algorithms)


在 20 世纪,我们使用方程和连续变量的数学方法作为主要洞见来源,因此对物理世界有了一个深刻的认识。一个连续变量在空间和时间上的变化是平滑的。与火箭仅仅遵循牛顿运动定律不同,还没有一种简单的方法来描述。在 21 世纪,我们在算法的数学基础上——通常含有离散变量而非连续变量——在理解计算机科学和生物学中的复杂性质方面取得了进展。算法是一个按步骤进行以实现某个目标的方法,就像在烤一个蛋糕。


自相似分形(Self-similar fractals)产生自简单的递归算法,该算法能创建类似于灌木和树的模式。一个真正的树结构也是一个算法,由一系列决定着细胞分裂时基因的打开和关闭的决策所驱动。大脑的结构也许是宇宙中最苛刻的构造项目,它也受到嵌入 DNA 中的算法所支配,该算法能够调节大脑中数百个不同的部分的成千上万种不同类型的神经元之间的连接的发育。


大脑中的学习与记忆是由算法控制的,该算法根据神经元活动的历史来改变神经元之间突触的强度。学习算法最近也被用于训练深度神经网络模型来识别语音、翻译语言、为照片添加说明以及进行锦标赛水平的围棋对弈。获得这些惊人能力的方法就是将同一个简单的学习算法应用到不同类型的数据上。


生成复杂性的算法有多常见?「游戏人生(The Game of Life)」是一个元胞自动机,其生成对象似乎有自己的生命。Stephen Wolfram 想知道能够导致复杂行为的最简单的元胞自动机规则,因而对所有的规则开始了搜索。前 29 个规则产生的模式总是返回到无聊的行为:所有节点都以相同的值结束,陷入一个无限重复的序列或无尽的混乱变化中。但规则 30 却能产生不断演化的复杂模式。甚至可以证明,规则 30 能够进行一般计算——可以计算任何可计算函数。


这一发现的启示之一是,我们在自然界中所发现的显著复杂性,可能来自对分子间最简单的化学作用空间的取样。复杂的分子应该是从进化中演化来而不应该被视为一种奇迹。然而,元胞自动机可能不是一个早期生命的良好模型,而对于何种简单化学系统能够创造出复杂分子的探讨还仍然是一个悬而未决的问题。也许只有特殊的生化系统才有这种特性,该特性或许有助于缩小生命起源中相互作用的可能范围。Francis Crick 和 Leslie Orgel 认为,RNA 可能会有这些特性,它们在 DNA 的概念于进化早期出现之前打开了一个 RNA 的世界。


有多少算法?想象所有可能的算法空间,空间中的每一点都是一个处理问题的算法。其中有些算法有用而多产得令人吃惊。在过去,这些有用的算法是由数学家和计算机科学家像工匠那样手工制作的。与此相反,Wolfram 发现元胞自动机通过自动搜索能产生高度复杂的模式。Wolfram 定理规定,你不必在算法空间中走得太远去寻找一个解决一类有趣问题的算法。这就像是让机器人在网上玩 StarCraft 之类的游戏,尝试所有可能的策略。根据 Wolfram 定理,在能够赢得游戏的算法宇宙中的某个地方,应该有一个办法可以找到该算法。


Wolfram 专注于研究元胞自动机空间——所有可能算法空间中一个小的子空间——中最简单的算法。我们现在已确认了神经网络空间——人类所设计过的最复杂的一部分算法空间——中的 Wolfram 定理。每个深度学习网络是所有可能算法空间中的一个点,而且它们是通过自动搜索被发现的。对于一个大网络和一个大数据集,从不同起点进行的学习可以产生无限的网络,它们解决问题的能力大致相等。每个数据集产生自己的算法星系,而数据集还在激增。


谁知道宇宙算法对我们来说会是什么样子?可能整个有用的算法星系还未被人类发现,但可以通过自动搜索实现。21 世纪才刚刚开始。


Peter Lee,微软全球资深副总裁


科学术语:迁移学习(Transfer Learning)


「你永远不能理解一种语言——除非你至少理解两种语言」。


任何一个学过第二语言的人,对英国作家杰弗里·威廉斯的这句话应该都会「感同身受」。但为什么这样说呢?其原因在于学习使用外语的过程会不可避免地加深一个人对其母语的理解。事实上,歌德也发现这一理念的强大威力,以至于他不由自主地做出了一个与之类似但更为极端的断言:


「一个不会外语的人对其母语也一无所知」。


这种说法极为有趣,但令人惊讶的是恐怕更在于其实质——对某一项技能或心理机能的学习和精进能够对其他技能或心理机能产生积极影响——这种效应即为迁移学习。它不仅存在于人类智能,对机器智能同样如此。如今,迁移学习已成为机器学习的基础研究领域之一,且具有广泛的实际应用潜力。


今天的机器学习领域主要围绕着能力可随数据及经验的积累而提高的算法,且已取得惊人进步,并由此催生出可比肩甚至超越人类智能的计算系统,例如具有理解、处理及翻译语言能力的系统。近年来,机器学习研究多聚焦在深度神经网络(DNN)——一种通过从大量数据中推断异常复杂模式而进行学习的算法概念。例如,向一台基于 DNN 的机器输入数千个英文录音片段及其对应文本,机器便可从录音与文字的关联中推断出相关模式。伴随着关联模式的逐渐精确,系统最终将能「理解」英语语音。事实上,今天的 DNN 已经相当成熟,一台功能强大的计算机在学习过足够的训练样本后,完全可以对真人对话进行文字速记,并达到比专业速记员更高的准确率。


一些人也许会很惊讶,计算机化的学习机器(computerized learning machines)展现出迁移学习的能力。我们可以通过一项涉及两套机器学习系统的实验来思考这个问题,为了简单起见,我们将它们称为机器 A 和机器 B。机器 A 使用全新的 DNN,机器 B 则使用已经接受训练并能理解英语的 DNN。现在,假设我们用一组完全相同的普通话录音及对应文本来对机器 A 和 B 进行训练,大家觉得结果会怎样?令人称奇的是,机器 B(曾接受英语训练的机器)展现出比机器 A 更好的普通话技能,因为它之前接受的英语训练将相关能力迁移到了普通话理解任务中。


不仅如此,这项实验还有另一个令人更为惊叹的结果:机器 B 不仅普通话能力更高,它的英语理解能力也会提高!看来威廉斯和歌德确实说对了一点——学习第二语言确实能够加深对两种语言的理解,即使机器也不例外。


迁移学习的理念至今仍是基础研究的课题之一,因此,许多根本性的问题仍然悬而未决。例如,并非所有的「迁移」都是有用的。要让「迁移」发挥作用,学习任务之间至少需要相互关联,而这种关联方式仍然缺乏精确定义或科学分析,且与其他领域相关概念之间的联系仍有待阐明,如认知科学和学习理论。诚然,对于任何一个计算机科学家而言,从事计算机系统的「拟人化(anthropomorphizing)」在理智层面都是危险的,但我们却不得不承认,迁移学习让人类学习和机器学习之间产生了强烈而诱人的相似性;当然,如果通用人工智能真能有朝一日成为现实,迁移学习恐怕将是这一过程中的决定性因素之一。对于善于哲学思考的人来说,迁移学习的正规模型可能会为知识和知识迁移带来新发现和分类方法。


迁移学习同样具有极高的应用潜力。过去,机器学习在搜索和信息检索等领域中的实用价值较为单一,大多聚焦于通过万维网上大量数据集和人物信息进行学习的系统。但我们是否想过,经过网络训练的系统可以了解关于较小社区、组织甚至个人的信息么?未来智能机器可以学习与特定个人或小型组织相关的、高度专业化的任务么?迁移学习让我们可以想象这样一种可能性,让所有网络信息都成为机器学习系统的基础,而系统则可通过迁移学习获得更个性化的信息。实现这个愿景,我们将向人工智能普及化迈出又一大步。


Susan Blackmore,心理学家,《Consciousness: An Introduction》一书作者


科学术语:Replicator Power(复制体能力)


宇宙中的一切设计都从何而来?无论在何处,我都能看见一系列事物——它们有的被设计过,而有的则没有——岩石、星星、水洼里的雨水,桌子、书本、草地、兔子乃至我的双手。


人们并非通过这样的方式来区分被设计的与未被设计的(事物)。通常人们将地上的书与岩石区分开来——因为书籍是为特定目的而设计的,但岩石则不是。书籍会有作者、出版商、印刷者、封面设计者等等,这代表着一种自上而下(译者注:由整体概念到具体细节)的设计模式,是「真正的」设计。但对于青草、兔子乃至双手,它们的确能够服务于特定的功能,但它们是通过一种无意识的、自下而上的过程演化的。因而,它们不是「真正的」设计。


对于真正的设计与演化的「设计」之间的区别,偶尔被明确地说清。但在未被说清时,进化生物学家们往往对于将「设计」一词用在无意识的过程上会有某些畏惧的陈述。但它们真的「好像」是被设计的。它们并非是依据某种计划或意识的由上至下的模式,而是一种完全根据无意识过程的由下自上的模式。换句话说,我们大脑与「真正的」设计是不同的。


如果关于复制力(Replicator Power)的概念被更好的了解,那么这种错误的区分方法也许就会消除。因为我们会发现,所有的设计都基于一种相同底层过程。一个复制体(Replicator)是能够影响环境并能复制自身的信息(information)。基于变化与选择进行复制的进化算法,是一种能够无限制增加已有信息的过程。而复制体的能力,就从它在这种进化算法中扮演的信息载体的角色而来。基因就是最为明显的例子,它们带来了各种各样的生物作为它们(达到目的的)媒介或产物。而自然选择的作用则决定了复制体的成败。


「复制体」这个术语的价值在于它的普适性。这也是道金斯(英国演化生物学家)在撰写关于普适达尔文主义(Universal Darwinism,即将达尔文主义中最基本的想法应用到到所有的自复制信息中)时所强调的。当复制体存在并且环境适宜的情况下,「设计」将会随之发生。所以道金斯创造术语「文化基因(meme)」来说明世界上不止有一个复制体在进化。遵循关于进化的方式的思考,他也做出了这样的断言:复制体的有差别幸存(differential survival)导致了各个地方生命的进化。我则会补充认为:复制体的有差别幸存导致了各个地方智能的进化。


这也就表明,人类设计从本质上与生物设计并无二致。两者都基于复制体被复制(的过程)——要不然是以 DNA 碱基对的分子顺序进行复制,要不然是以书本上字词的顺序进行复制。在分子复制的情况下,新的序列由复制过程的错误、突变或重组而产生。在撰写书籍的过程中,新的序列通过作者重组熟悉的词汇到新词组、句子乃至段落产生。在两个例子中,许多不同的序列被创造但很少的被保留被继续复制,而创造性设计的产品因复制力而出现。要理解人类以这种方式进行设计,就要放弃对于自上而下设计、智慧与规划对创造力必不可少这样的假设,要将那些能力及它们带来的设计视为进化的原因而非结果。


接受这样的观点也许会带来不适,因为它意味着认同我们一切认为我们设计的东西实际上是一种从下到上、毫无头绪的过程利用我们作为一种复制机器(copy machinery)。这种不适也许就如同伯明翰主教之妻所说:这样知识贬低了人类自身,并且会消除我们的人性乃至能力。但我们已经能(或多或少在世界上的某些地方)学会拥抱而非畏惧这样的知识,我们的身体通过一种无意识的自下而上的过程进化。在相同方向上还有另一过程。


认识到复制力的意义在于认识到现在还有其他的复制体、以后还会有更多。这种无意识的过程将我们人类从猿猴转变为能讲话、能够复制文化基因(meme)的动物,让我们能生产桌子、书本、汽车、飞机以及复制机器——这是最重要的一步。这(复制机)包括了导致印刷过程的写作、产出家具的陶论、木头加工工具,以及导致现在信息爆炸的计算机技术。


人工智能,无论是被造成桌上箱子的样子,还是分布在网络世界中的机器人,都被以复制能力的方式而创造,就如同我们的智慧被复制能力创造一般。它们以远超过我们的速度进化,并且会带来更深刻乃至更快的复制体。这种能力不停止,因为我们即希望如此。并且它的产物并不会臣服于我们的陈述,不会受我们的控制也不会按照(我们希望的)它兴盛的方式设计。这种智能会不断地成长,并且我们越快接受复制能力的概念,我们将会对有人工机器的未来生活的态度越现实。


Ursula Martin,牛津大学计算机科学教授


科学术语:抽象(Abstraction)


翻开 Ada Lovelace 在 1843 年关于 Charles Babbage 未建成的分析引擎 (Analytical Engine) 的论文,如果你足够「极客」的话,你依然能够应付 19 世纪的长难句——令人惊讶的是,它们到如今仍然具有可读性。


这个分析引擎是完全机械的。设置一个具有十个齿的重金属盘来存储数字,五十个这样的盘堆叠后可以存储五十位数字,并且存储器将包含 100 个这样的堆叠。添加两个数字的基本指令将它们从存储器移动到 CPU 中,在那里它们将被添加在一起,而后移回到存储器中的新位置等待进一步使用,这些过程全都是机械的。它用冲孔卡来编程,代表了变量和操作,并进一步用精心设计的机制来移动冲孔卡,在需要循环时以组为单位重新使用。Babbage 估测认为这个巨大的机器将两个 20 位的数字相乘需要三分钟的时间。


这篇论文可读性非常高,因为 Lovelace 所描述的机器使用抽象——存储、mill、变量、操作等,而非精心制作的铁器。这些抽象及它们之间的关系在识别主要组件和组件间传递的数据的过程中捕获了机器的本质。他们用当时的语言捕获当时和现在计算中的一个核心问题——使用不同的机器可计算和不可计算的内容。本文确定了「若所有智力执行的操作本身能够被精确定义,则重现这些操作以获得确定结果」所需的元素,并且算术、条件分支等恰恰是百余年后阿兰·图灵证明其关于计算力量的结果所需要的元素。


仅在代表它们的机械行为中,你不能在 Babbage 的机器中指向一个变量或一个附加指令。在 20 世纪 60 年代,曾经 Lovelace 只能用来应对官方解释的抽象已被改进得更加精良。牛津大学的 Dana Scott 和 Christopher Strachey 等计算机科学家使用单一抽象来对机器和运行的程序建模,使得精确的数学推理能够预测其行为。这些概念已经进一步完善,如计算机科学家 Samson Abramsky 使用先进的逻辑和数学来捕获更微妙的抽象,不仅可以用于经典计算机,也可用于量子计算。


为实际问题确立一个优质的抽象不仅是一门科学,也是一门艺术。确立过程需要捕捉问题的构建块和连接它们的元素,这些元素应具有恰到好处的细节量;确立过程提取的是远离块内部复杂区域的部分,所以设计者只需关注与其他组件交互所需的元素即可。Jeannette Wing 将这些技能描述为计算思维,而这个概念可以在编程之外的许多情况下被指出。


Lovelace 发现了更广泛的抽象力,希望通过发展「利用法则建立大脑分子的相互作用」来理解神经系统,实现自己的理想。并且如今的计算机科学家确实在为此扩展技术开发并建立合适的抽象。


Samuel Arbesman,复杂性(Complexity)科学家;拉克斯资本公司(Lux Capital)住宅研究方面科学家;《Overcomplicated》一书作者


科学主题:自产生程式/奎因(Quines)


在计算机程序的无限空间中有一个特殊的代码子集:当执行程序时输出该程序本身。换句话说,这是一些自复制程序;当你运行它们时,它们会输出自身。这些短小的程序通常被称为「自产生程式/奎因(quines)」,来源于哲学家韦拉德·范·奥曼·奎因(Willard Van Orman Quine)的名字,基于侯世达(Douglas R. Hofstadter)所著的《哥德尔、埃舍尔、巴赫:一条永恒的金带(Gödel, Escher, Bach: an Eternal Golden Braid)》一书中的术语。


Quines 一词给人的第一印象往往显得不可思议。你要是曾经写过代码就更会有这种感觉,因为如果你不了解创建 quines 的技巧,便可能会觉得难以构建。它们往往是优雅的小东西,而现在有大量的计算机语言写出了各种各样的 quines 案例,从简短可爱型到不可思议之长。

 

不过它们为什么如此重要呢?quines 是计算机科学、语言学及其他学科思想的精华。简单点说,quines 可以被认为是定点,即数学中的 fixed point:一个输出自身而保持函数值不变的数学函数的值(想想 1 的平方根为什么仍然为是 1)。


不过我们可以进一步地讨论一下。Quines 表明计算机所产生的语言既可以是操作符也可以是操作数——一个 quine 文本运行并通过一个向自身反馈的过程输出原始代码。文本可以是有意义的单词,也可以是「有意义的单词」,思考这个句子「This sentence has five words.」,我们很高兴地看到,此句中的单词不仅是在描述(充当一个操作符)也是在被描述(充当一个操作数)。不过这个文字游戏也很有用。文本和功能之间的这种关系是 Kurt Gödel 在不完备性数学研究中用到的一个基本组成部分,而这又与阿兰·图灵在解决停机问题时所用的方法有关。这些基本思想显示出数学和计算机科学中的某种局限性:我们不能证明某些陈述在一个给定系统中的对与错,并且也没有任何算法可以确定任何给定的计算机程序是否将会永远地终止运行。


更广泛地说,quines 还表明了复制(reproduction)行为不是生物领域所独有的。就像一个细胞利用物理及化学规律来生存和繁衍一样,一个 quines 会添加一门编程语言的规则来执行代码。虽然它并不完全复制自身,但其工作原理是相似的。你甚至可以进一步在某个「辐射硬化(radiation hardened)」quine 中发现这种生物性质的迹象:在这种 quine 中,任何字符都可以被删除,而它仍然可以进行复制!对我们中的许多人来说,辐射硬化 quine 听起来无疑就像基因的 DNA 序列那样令人费解。冗长与坚固——生物学的标志——在有机体与计算机中输出的是相似的结构。


冯·诺依曼(John von Neumann)是计算机界的先驱之一,他在机器的自我复制方面做过大量的思考,把从计算早期开始研究的技术与生物学结合起来。我们仍然会在小段的 quine、小段的计算机代码中看到,它们通过其微小的努力将各个领域一个接一个地缝合起来。


Sean Carroll,加州理工学院理论物理学家;《The Big Picture》一书作者


科学术语:贝叶斯定理(Bayes's Theorem)


你担心朋友生你的气。你设了一个晚宴而没有邀请他们;这就是那种会令他们不开心的事情。但你并不确定。所以你给他们发了一条短信:「今晚想出去吗?」二十分钟后你收到一个回复:「不能,忙。」我们怎么解释这条新信息?


当然部分答案可以归结为人类心理学。但其中一部分是统计推理的一个基本原理,称为贝叶斯定理。


当我们不确定某些命题的真假时就会寻求于贝叶斯定理,而新信息会影响该命题为真的概率。这个命题可以是朋友们的感受、世界杯结果、总统选举结果,或有关早期宇宙活动的特定理论。换句话说:我们真的一直在使用贝叶斯定理。可能是以某些正确或不正确的方式,但它无处不在。


该理论本身理解起来不是很难:给定一些新数据,一个命题为真的概率正比于其在数据出现之前就为真的概率乘以该命题为真时出现该新数据的可能性。


因此它有两个影响因素。第一个是先验概率(prior probability),即我们在收集任何新信息前就确定某一想法的概率。第二个是在该想法为真时所收集的一些特定数据的可能性。贝叶斯定理认为:不同命题在新数据收集过程之后的相对概率就是二者的乘积。


科学家们总是以精确、定量的方法使用贝叶斯定理。但这个定理——或实际上是构成其基础的「贝叶斯推理」这个思想——无处不在。在你给朋友发短信之前,你已经知道他们有多大可能会生你的气。换句话说,你对「生气」与「不生气」的命题有一个先验预期。当你收到他们的回复时,你含蓄地对这些概率做了一个贝叶斯更新(Bayesian updating)。如果他们生气,那么他们有多大可能会发送这样的回复?要是他们不生气呢?乘以适当的先验概率,有了新信息后,现在你就可以明白他们生气的可能性有多大。


在这一条纯统计学逻辑背后潜伏有两个伟大而深刻、足以塑造世界观的思想。


一个是先验概率的概念。不管你承认与否,不管拥有什么样的数据,你都隐约会对所能想到的每一个命题持有一个先验概率。如果你说,「我不知道它是真是假,」那么其实你是在说「我的先验概率是 50%。」并且其设置过程不涉及客观的、事先准备好的步骤。人与人之间想法差别巨大。对某个人来说,一张看起来像是鬼魂的照片无疑是人死后生命的凭证;对另一个人来说,它更可能是伪造的。无论我们以何种先验概率开始思考,给定无限量的证据和完美的理性,我们都应该会趋于相似的信仰——但没有无限的证据,理性也并不完美。


另一个伟大的思想是,你对一种思想的信仰程度将永远不可能是 0 或 1。对某些数据的收集永远不是绝对不可能的,无论真相是什么——即使最严格的科学实验也容易出错,而大多数日常数据的收集根本算不上严格。这就是为什么科学从来没有「证明」什么;我们只是增加了对某些思想的凭证,直到它们几乎(但不完全)达到 100%。贝叶斯定理提醒我们在面对新信息时应当保持思想的开放性,而且它会告诉我们到底需要什么样的新信息。


Ian Bogost,Ivan Allen 学院媒体研究名誉主席,乔治亚理工学院交互式计算教授;Persuasive Games LLC 创始合伙人;《The Atlantic》特约编辑


科学术语:概率空间(possibility space)


有些问题很容易,但大多数问题都很难。它们超越了人类掌握和推理可能答案的能力。不仅仅是复杂的科学与政治问题,例如制定复杂的经济决策或建立模型以应对气候变化,日常生活也是如此。「今晚去吃晚饭吧。」「好啊,但是去哪呢?」这样的问题很快就陷入了无结构形式的存在主义危机(existential crisis)。甚至是,「我是谁?」


数学家思考复杂问题的一种方法是利用可能解的概率空间(possible solutions,有时也称为解空间/solution space 或 probability space)在数学中,概率空间被用作一个寄存器或所有可能解的分类帐目。例如,掷一枚硬币的概率空间是头或尾。对于两枚硬币:正面-正面、正面-反面、反面-正面、反面-反面。


这是一个相对简单的例子,因为任何概率空间的给定子集都可以被测量和记录下来。但在其他情况下,概率空间可能非常大,甚至无限大。例如宇宙中可能存在的生命形式,或可能的未来进化分支。或是可能的围棋游戏。甚至是你能够用一晚上的时间所能做到的所有事情。


在这些情况下,要完整地描绘概率空间不仅很难或根本不可能做到,而且往往连尝试甚至都毫无意义。一个经济学家可能会依据某些行为的相关效益成本而从其净边际效益(net marginal benefit)中建立一个可能外出吃晚饭的模型,比如看一部电影、骑一次自行车或吃一份惠灵顿牛排,但这种做法假定了日常生活中所不存在的理性主义。


在游戏设计中,创作者经常将自己的工作看作是为玩家创造概率空间。在源自古代中国的围棋游戏中,棋子、棋子摆放规则以及一块棋盘为整个对弈提供了一个非常大的概率空间。但每个人的行动都会越来越受限——依赖于每位棋手的先前决策集。否则棋手就不能移动一步。任何人都不能在所有围棋比赛的全部数学概率空间之内下棋,却可以在——于给定的时间点、给定的棋盘上所进行的可能且合乎规则的移动步骤中——更窄的概率空间内下棋。


一些设计师尊崇围棋和象棋类游戏的数学帮助,希望用最少的元素创造出最大的概率空间。但更多时候,令一款游戏在美学上显得独特的东西不是数学上的大或深,而是其组成元素及其可能配置有多么有趣而独特。俄罗斯方块只有七个不同的元素,所有元素以相同方式运作。俄罗斯方块的乐趣来自于学习在各种情况下识别和操作这些元素。


积极且慎重地去限制一个概率空间的练习效用远远超出了科学、数学和游戏设计。每种情况都可以通过确认或强加限制以产生一个可行的、可操作的可能行动领域而被更加慎重且卓有成效地解决。这并不意味着你每次启动洗碗机或与朋友进行通宵辩论时都必须制定效用图表。而是说,任何问题的第一步都得承认,现有的大量限制已经存在,正等待被确认和激活。


在面对巨大或无限大的概率空间时,科学家们试图强加一些限制以创造可测量且可记录的工作。例如,一个生物学家可以通过限制对一定规模和组成成分的恒星或行星的请求来建立一个可能存在外星生命的概率空间。当你为一顿晚饭的选址进行争论时也会这样做——即使你在正常情况下不这样想:你喜欢什么样的食物?你想花多少钱?你愿意跑多远?要决定其中的一两个问题往往会产生一些进步。而它在避免进入一个存在主义螺旋中时也是这样做的,向内心深处寻问你到底是谁,或人类选择的终极来源:你真正想要的是什么。在日常生活中,就像在科学中一样,答案已然存在于世,比它们在你头脑中被发明的都要多。


Scott Aaronson,德克萨斯大学奥斯汀分校计算机科学 David J. Bruton 的荣誉教授;《Quantum Computing Since Democritus》一书作者


科学术语:态(State)


在物理学、数学和计算机科学中,系统的状态是封装所有你所需要的预测它将做什么,或至少预测它做这件事而非另一件事的概率的信息,来响应任何可能的刺激。从某种意义上说,态是一个决定系统在表面外观下的行为的「隐藏现实」。但在另一种意义上,没有什么隐藏的态——对于从不重视观察的态的任何部分,都能够用奥卡姆剃刀原理(Occam』s Razor)将其切割,来产生更简单、优质的描述。


这样看来,「态」这个概念似乎很明显。那么,为何爱因斯坦,图灵和其他人还会在这个概念上,在走向人类最难得的知识胜利的道路上奋斗那么多年?


 一起来看几个迷题:


如果要添加两个数字,计算机显然需要一个包含着添加说明的添加单元。但是,它还需要一些说明解释这些说明,而后它便需要说明来解释这些说明的说明……所以我们得出结论,添加数字对于任何范围有限的机器来说是不可能的。


根据量子重力的现代理念,空间(space)可能并不是根本,而是对普朗克量级自由度的量子位(qubit)网络的描述。我曾有过疑问:倘若宇宙是一个量子位的网络,那么这些量子位在哪里?它们是不是没有意义(例如,假设两个量子位是「邻居」,却没有预先存在的空间来使量子位成为邻居)?


根据狭义相对论,可知光速最快。但假设我翻转一枚硬币,将结果写在两个相同的信封中,然后将一个信封放在地球上,另一个放到冥王星。接着,我打开地球上信封的瞬间,改变了冥王星上信封的状态,从「正面和反面可能性相同」变成「绝对是正面」或「绝对是反面」(我们可以看到,这种类型的量子纠缠甚至成为了经典谜题)!


关于计算机的谜题是我与非科学家知识分子进行无数次辩论的一个话题。我认为,分辨率可以指定计算机的状态,涉及到要添加(编码,如二进制)的数字,和横跨数字的添加和携带、由布尔逻辑操控并最终通过物理定律实现的有限控制单元。你可能会问:物理定律本身是什么?无论对于这个问题有什么答案,它的基础在哪里?这些都是我们的问题;同时,计算机工作所需要的一切都包含在它的态中。


 这个关于量子位的问题是许多其他问题的附加问题:例如,如果宇宙正在扩张,那么它正扩张到哪里?这些问题未必不好。但从科学的角度来讲,一个人完全有理由回应:「你在建议我们在世界的态上创建新事物,比如扩张或寻找我们的第二个生存空间。那么这第二个空间对观察有什么影响?如果永远不会有影响,为什么不把它切割出去呢?」


关于信封问题,可以通过认为你在地球上决定是否打开信封不会影响观察者在冥王星上感知信封内容的概率分布来解决。如此便可以证明一个定理——即使地球和冥王星之间存在量子纠缠,类似的事实在量子情况下同样成立:在这里你选择做的任何事情都不会改变局部量子状态(即密度矩阵)。这就是与爱因斯坦的担忧相反,量子力学与狭义相对论相一致的原因。


 这种情况下,相对论、量子力学、计量理论、密码学、人工智能以及其他 500 个可能的领域都可以总结为「没有差异的区别不能算作区别」。这个总结可能会使一些读者想到 20 世纪早期的逻辑实证主义教义,或者想到波普尔所坚持的理论:从不冒险伪造预测的理论都是伪科学。然而我们没有必要冒险做出关于实证主义者或波普尔究竟是否正确的复杂辩论(或者实证主义本身是实证主义的还是可伪造的)。


我们只要记住一个简单的道理就足够了,那便是——世界真实存在于我们的感觉之外,但我们不能坐在扶手椅中便说出它的态由什么组成。我们的工作是围绕最优的科学理论创建本体,而不能本末倒置。也就是说,我们应实时修改对于「实际存在」的概念,将我们所发现的可以通过观察来区分的新事物包含进来,并排除不能区分的事物。


有些人发现把自己的本体限制在态的程度似乎远远不够,只达到解释观察的程度。但考虑到替代时,Charlatans 这个种族主义者的每个有说服力的忠告都在不断地激励我们超越系统的态,到达它隐藏的本质,并在没有要求的地方做出区分。


甚至在自由意志中的许多困惑也存在对「态」概念的不清晰。许多人认为,根据物理学,你未来的选择由宇宙的当前状态所「决定」。但这忽视了一个事实,即无论何种物理学都需要与该主体契合,宇宙的当前状态总会被认为秘密地决定未来的选择,而这确实是隐藏变量所解释的量子力学,如 Bohmian 力学。对我来说,这使得「决定(determination)」这一概念在这些讨论中几近空洞,而实际的可预测性更为重要。


态是应当广为人知的科学概念,因为在我看来,这其中蕴含着全部的科学世界观。


Joshua Bongard,佛蒙特大学威诺德计算机科学教授,《How the Body Shapes the Way We Think》一书作者


科学术语:符号接地问题(The Symbol Grounding Problem)


阿兰·图灵二战期间的合作者 I.J. Good 曾经写道,比人类更聪明的机器将是我们所做的「最后发明」。许多人认为社会将走到这一步,因为智能机器正愈加侵入我们的日常生活和想象力,而这种入侵正沿着两条战线前进。这些机器愈发被扣上诱发经济变革的帽子,导致一些人质疑工作的必要性。但更深层的是,我们不知道这样的超级智能机器是否会「和我们一样」:他们可能会思考,但他们有感觉吗?


 为了帮助锚定后面的问题,Stevan Harnad 提出了符号接地问题(symbol grounding problem)。对机器而言,通过将所听到的单词直接转换为口语来学习构成人类语言的符号的意思是有问题的。这就像试图使用词典学习埃及象形文字,其中每个象形文字是使用其他象形文字定义的。下面来看我刚刚与网络上功率最大的聊天机器的交流内容:


我:你好。

它:你好,最近过得怎么样?

我:不错啊,你呢?

它:我过得很好,谢谢。

我:我最近一直在思考。

它:思考什么?

我:符号接地问题。

它:你可以给我讲一个令人开心的故事吗?


符号接地问题的解决方案是使符号在物理经验丰富的土壤中接地。例如,机器人可以知道符号「跳跃(jump)」与其脚底压力的突然消失有关。这个机器人可以通过让一个人跳跃,观察她的双脚离开地面,并推断这个人类的感觉与它在跳跃时的感觉相同来与人类共情。最后,这样的机器可以递归地将已接地的符号中越来越抽象的符号接地,直到最终它可以在第一次听到成语「don』t jump to conclusions」时理解为「三思而后行」。


公众理当关注这个看似神秘的认知科学角落,因为不以这种方式将符号接地的机器会很危险。来看我与这个聊天机器的交流:它不仅不知道它最后的回复是「错误的」,也没能预测我对于它的回复会感到沮丧还是开心。同样,另一台机器也可能无法预测我对于它的行为的恐惧反应。


如今机器可以在接收到一百万张包含人类的照片和另一百万张不含人类的照片之后,不必经历接地符号便可分辨新照片是否包含人类。但换成由两百万段对话组成的数据集:第一百万中,演讲者正在讨论如何最好地帮助 Bob; 在第二百万中,他们在密谋伤害他。就算目前最先进的机器也不能分辨一个新的对话中的发言者是想帮助还是伤害 Bob。


大多数人可以通过听一段谈话来预测被讨论的人是否处于危险之中。因为我们在现实生活、书籍和电影中听过足够的讨论,从而能够延伸至当前的谈话,而不像在之前未见到的照片中识别人类的计算机,所以我们也许可以对电脑也这样做。然而,我们也可以通过连接词,图像和亲身体验来感同身受:我们可以处于谈论 Bob 的人的立场中或 Bob 自己的立场中。如果一个人说「善有善报」,并伴以一个讽刺的嘲笑,我们可以提取这些语言符号(「一个」,「好」,...)且结合视觉提示,并做一些心理模拟。


首先,我们可以回溯并假装自己是 Bob,并想象他/我们的行为减缓了讲话者的饥饿或消融了另一个身体或情感的痛苦。然后我们做回自己,想象她会说的话。我们不会像她那样做出讽刺的嘲笑,我们的预测失败了。


所以我们再次想象自己是 Bob,但这次精神上模拟在某种程度上想要伤害讲话者。在此行为期间,我们再转变为讲话者并遭受她的痛苦。回到现在,我们想象自己说同样的话,并且预期中报复的感觉出现了,于是我们做出冷笑来匹配讲话者的嘲笑。故而我们预测,讲话者想要伤害 Bob。


神经科学越来越多的证据表明,听到的词点亮了大部分的大脑,而不仅仅是某些本地化的语言模块。这会不会表明一个人扭曲的话、行动、自己之前的感受经历和精神抢到了感官/行动/经历的编织电缆?这些电缆可以作为从他人的行为和感觉转到我们自己的行为和感觉,而后再返回去的桥梁吗?


这些机器可能是有用的,甚至能够共情。但它们会有意识吗?意识是目前科学无法达到的,但我们可以思考。倘若我「感觉」你的痛苦,主体和客体是清晰的:我是主体,你是客体。但倘若我感到自己脚趾的疼痛,主体和客体的区分便不那么明显了。或者他们是一致的?如果两个人能够通过彼此的共情相连,当我伤害自己时,我的大脑的两个部分不能共情吗?也许感觉是动词而不是名词:它们可能是细胞群之间的特异性交换。那么,意识可以不仅仅是一个更小的上接接地符号的感觉/运动/经验的分支的分形安排吗?如果神话告诉我们地球是平的,并且放在一只巨龟的背面,我们可能会问什么拿着乌龟。答案当然是:一直都是乌龟。所以也许意识也一直只是细胞群之间的同感。


Roger Highfield,Science Museum Group 外事部门负责人、 Supercooperators 作者之一、复杂度前沿者


科学术语:可以采取行动的预测(Actionable Predictions)


 对显而易见的事根本不值一提的想法一般不会被怪罪,更不用说它即将成为一种文化越来越流行。毕竟,「pre」意味着「以前」,因此毫无疑问你应该在得到预测后采取行动来改变你的未来——举个例子,就像大雨要来了买伞一样。


 天气预报确实是一个促使你采取行动的预测的例子,是从卫星和各处传感器汇总过来的数据与模型的完美结合。但是当你的视线从物理科学转移到医学,这些预测却很难辨别。


 在医生能够针对每个患者做出规范的、可信并能够采取行动的预测上,我们仍有很长的路要走——哪种治疗会对患者的帮助最大,哪种药会对患者的副作用最小等等。


 很遗憾,对于很多简单的问题,答案依然不易捉摸。我应该因为嗓子疼而吃抗生素吗?免疫疗法对我管用吗?那个长长的药品副作用清单中的哪部分应该引起我的注意?对我来说最好的食谱安排是什么?如果我们能像气象学家预测明天的天气那样预测出每个患者需要的答案。


 今天很多人讲大数据可以提供所有答案。在生物学上,举个例子,曾经,人类基因工程所得到的数据曾经为我们带来了很大的希望和愿景——如果我们获得一段病人的 DNA 序列,我们可以预测它们最后的衰亡。


 抛开基因组的扩散、表观基因组、蛋白质组和转录物组不谈,情况已经比预想的糟糕了,最初有关个性化定制的基因药物的梦想已经降格成了精确药物,在这里我们假定一个特定的人会与之前研究过的基因相似的人群相同的药物反应。


 生物学领域里盲目地搜集大数据依然盛行,不过重点突出变换技术,比如机器学习—人工神经网络—来发现所有数据中有意义的特征。但不管它们多「深」多复杂,神经网络仅仅是尽可能适配了可用数据的变化曲线。它们也许能做插值,但对于超过训练范围的外扩,效果依然让人忧心忡忡。


 数据的量并不是能成为解决问题的全部。我们是收集了很多数据,但是我们收集到保质保量的数据了吗?我们能从一系列错误的关联关系中分辨出有用信号吗?假定身体是动态且不断变化的,数据的即时记录样本真的能记录下生命的全部复杂性吗?


 为了得到医学上有效的预测,我们同样要在生物学的数学建模中进行一个改变,这改变很好理解:细胞是非常复杂的,更不用说器官和身体了。


 我们应该增加对复杂系统的研究兴趣,以使得我们能预测单个病人的后续发展。而不是从早期传播研究中推断应该存什么,谁开的新处方,谁没有,谁有严重的副作用。我们需要更深入的探究,至少不能到死后尸检的程度,这可以防止成千上万的人免于人为医疗事故的伤害。


 最终我们需要在医学理解的基础上更好的开展建模,只有这样,终有一天,你的医生可以在你的数字分身上做实验,而后才是你。现代医学需要更多的可操作的预测。


Daniel Rockmore,达特茅斯学院 Neukom 计算科学学院主任、数学教授、计算科学 William H. Neukom 1964 终身杰出教授


科学术语:电车问题(The Trolley Problem)


科学的历史是由各种各样的「思想实验」堆成的。「思想实验」这个词是爱因斯坦想出来的,它的意思是针对一个虚构的场景,在这个场景中能够精精准的表达一些难于思考的问题症结,以这种方式能够激发一些就此问题的深度思考最终得到解决方法或者相关发现。这些「思想实验」中最著名的是爱因斯坦的「追光传说」,最终促使他发现了狭义相对论。还有薛定谔的猫,它被困在一个刻意严格设计的量子机械盒里,永远半生半死,这更加明晰地揭示了波动理论机理与测量间的复杂交互关系。


「电车问题」是另一个思想实验,它源自于道德哲学。它有许多的流传版本,这就是其中一个:一个有轨电车沿着铁轨行驶,遇到了一个铁轨分叉点,其左方向上,有一个人被困在铁轨上,右方向上则是五个人。你可以改变分叉点以使电车从朝向五个人的方向变为一个人的方向。你会怎么做?这个电车无法刹车。如果铁轨上的人中有我们的熟人我们会怎么办呢?也许如果其中一个是儿童而另外五个是成年人呢?又或者是其中一个有孩子而其他五个是单身呢?所有这些不同的场景如何来决定事情的发展变化呢?什么是至关重要的?你更珍视什么以及为什么?


这是一个有趣的思想实验,但在很多时候远不是这样仅仅有趣而已。鉴于我们正逐渐将我们的决定赋予管理这些事情的机器和软件,开发人员和工程师将要做越来越多这样需要解析那些重要并很有可能潜在关乎生死的决策机制的事情,并把这些事情直接编码给机器。决策机制来源于一种价值评估系统,一种「效用方程」,在这种系统中我们决定做这件或那件事原因在于这样做比其他选择能获得更大的价值。有时这种价值评估看上去很平常且显而易见——推荐给你这个食物搅拌器而不是那个是因为你有更大的概率买这个,这是基于各种各样历史上的购买数据得出的结论。这双鞋比其他的更好卖(或者不算更好卖但起码因为它某些方面利润更高所以值得一试——这使得我们愿意计算概率和期望的回报)。这首歌对比那首歌等等。


 但有时在紧要关头它会更重要:是这条新闻还是那条?更广泛意义上来说,是这件事的这条信息还是那条信息?嵌入价值评估体系的程序可以开始评估你的价值了,并以此类推以至于整个社会的价值。有一些是价值相当大的决策赌注了。电车问题告诉我们价值评估体系渗透在编程的方方面面,甚至有时关乎生命:很快我们会有无人驾驶的电车、汽车、卡车。当糟糕的事情发生了,决定就需要做:事故车道上的骑车少年还是停在前面车里的世界 500 强公司的 CEO 和他的助理?你的算法会怎么做以及为什么这么做?


我们终将制造出无人驾驶汽车而它们也一定会具备道德指南。我们的机器人伴侣也是一样的情况。它们会有价值评估体系且必然是受道德约束的机器,而它的道德和伦理是由我们设计的。「电车问题」是我们时代的思想实验,它是我们新人机时代工程高度复杂的光辉体现。


Bruno Giussani,TED 欧洲办事处主任及全球活动策划人


科学术语:指数(Exponential)


(有关指数的这一小故事)已经不清楚当时用来计数的是米粒还是麦粒了,由于故事有很多版本,我们对故事的起源也不太确定。但故事的内容大致是这样:国际象棋的发明者向国王展示了有趣的象棋游戏,国王甚是开心,便要求象棋发明者自己点名要奖赏。象棋发明者谦虚地要了些米粒(或者是麦粒),具体数量通过最简单的公式计算得出,即第一个格子 1 粒,第二个格子 2 粒,第三个格子 4 粒,依次往下格子中谷粒的数量翻倍,直至第 64 个也就是最后一个。国王欣然同意,直到发现自己已经受骗。到棋盘一半时,国王的城堡就几乎不够存放谷物了,但剩下棋盘中的第一个格子就会将谷粒数量再翻一倍。


从 13 世纪的穆斯林学者到物理学家/作家卡尔·萨根(Carl Sagan),再到社会传媒界的电视录像制作人无不引用该故事来阐释指数序列的威力,事务起于微小,非常微小,但之后一旦开始增长,就增长地越来越快—按欧内斯特·海明威(Ernest Hemingway)的说法:成长缓慢,然后突然暴涨(they grow slowly, then suddenly)。


每个人都应该更深刻地知道并理解指数及其衍生(棋盘寓言是一个非常实用的比喻),因为我们生活在一个指数世界。实际上,这种情形已经存在一段时间了。但是,目前为止我们处在棋盘的上半部分,也就意味着由于我们即将进入棋盘的下半部分,事物将急剧加速发展。


1999 年雷·库兹韦尔(Ray Kurzweil)在他的著作《灵魂机器的时代》(The Age of Spiritual Machine)中提出了「后半个棋盘」的概念。他指出,尽管指数在前半个棋盘时重要,但正是在进入后半个后其影响变得巨大,事情变得疯狂,其加速度开始远超人类的想象和控制。


15 年后,Andrew McAfee 和 Erik Brynjolfsson 在《第二次机器时代》中通过对比摩尔定律来讨论库兹韦尔的观点。戈登·摩尔(Gordon Moore)是仙童公司(Fairchild)和英特尔公司(Intel)的联合创始人,这两个公司是硅谷很有开拓性的公司。回顾硅晶体管刚发展的前几年,在 1965 年摩尔做出了一个预测,在给定的成本下,大约每 18 至 24 个月,计算能力会翻一番。换句话说,也就是呈指数级增长。摩尔的预测已经维持了数十年,对科技与商业带来了巨大的影响,尽管近些年节奏有一点点放缓——需要指出的是摩尔定律是一个产业规律的洞察定律,而非物理定律,而且,我们很可能从晶体管时代迈进量子计算的时代,而后者依赖粒子来进行计算。


McAfee 和 Brynjolfsson 认为,如果我们把摩尔定律的起始点定为 1958 年,即第一个硅晶体管商业化的时间,那么依指数曲线,从数字技术的角度看,我们进入棋盘第二部分的时间是 2006 年(这种观点是考虑到,人类基因组第一次绘制完成是在 2003 年,当前智能手机操作系统启动是在 2007 年,同一年 IBM 的 Deep Blue 在象棋比赛中打败了 Garry Kasparov,同时耶鲁大学的科学家开发出第一个固态量子处理器是在 2009 年。)


因此,我们会发现我们自己正处于棋盘第二部分的第一个,可也能是第二个格子中。这有利于帮助我们理解我们所见的在科技领域发生的引人注目的高速进步,这些进步表现在从智能手机、语言翻译、区块链到大分析、自动驾驶和人工智能的领域,从机器人学到传感器,从太阳能电池到生物技术,再到基因组学和神经学及更多其他领域中。


当这些领域中的每一个其自身都呈指数级增长时,它们的组合效应——每个对其他领域的加速性影响是巨大的。另外还要加上人工智能系统自我改进能力的空间以及我们正在聊的近乎不可思议的改变速度。


还是以最初的棋盘寓言作为比喻,进入棋盘的第二半部分意味着:到目前,谷粒是以越来越快的速度累积着,但还在国王城堡能容纳的限度内。但之后格子的谷粒就会淹没这座城市,然后淹没这片土地,这个世界。之后仍然有 32 个格子还要走,所以这将不是一个短暂的转变期,而将是一个长期、深度、史无前例的剧变。这种发展将带领我们进入一个物质丰富,并以技术为驱动的新兴时代,我们的权利和/或希望与坠入无法控制的黑洞等其他忧虑一样多。


当然,我们仍然生活在一个对其大部分都不甚了解的世界,这部分也不适用于指数规律。基本上社会运行的每一结构和方法——政府机关、民主、教育和医疗系统、法律和规范性框架、出版业、公司、安全防范设施,甚至科学管理本身都被设计为在一个可预测的线性世界发挥作用,在此,猛然上升或下降被看作为危机。因此,我们几乎每天都在见证的各种指数级变化所带来的从政治到社会再到心理学方面的忧虑及压力也就不足为奇了。


在没有深入思考,深思熟虑和细致入微关注的情况下,我们该如何以指数式思维思考问题?在棋盘第二半的现实条件下,社会该如何运行?在指数型社会中,政府治理与民主的意味着什么?我们又该如何重新审视从教育到法律框架再到伦理与道德理念的诸多事宜?

 

这些事情都开始于对指数和「后半个棋盘」的比喻更好的理解,以及将这种「后半程思考」的思维方式施加到几乎所有事情上所带来的结果。

入门人工智能迁移学习产业观点贝叶斯