TOM SIMONITE作者路雪翻译

Geoff Hinton:我反对谷歌军事项目,论文评审机制正在阻碍创新

作为人工智能先驱者、Google Brain高管和多伦多大学教授,Geoffrey Hinton对于谷歌参与五角大楼AI军事项目的态度如何?在最近的一次访谈中,他终于告诉人们:我反对!此外,Hinton还对人工智能在创新上的挑战等问题发表了意见。看得出,Hinton对于人工智能的未来非常有信心,他也希望研究者们能够将眼光放得更加长远。

20 世纪 70 年代初期,Geoff Hinton 开始做简单的数学模型,模仿人脑神经元视觉理解世界的过程。之后数十年,人工神经网络仍然是一门不实用的技术。但是 2012 年,Hinton 和他的两名本科生使用神经网络实现了计算机图像目标识别准确率的大幅提升。之后六个月内,谷歌收购了这三名研究者创办的创业公司 DNNresearch。

现在,这项技术已经成为所有大型科技公司未来规划的重中之重。

「作为谷歌高管,我不应该公开抱怨五角大楼项目,因此我私下里抱怨。」Geoff Hinton 说。

NeurIPS 2018 期间举办了人工智能 G7 大会,来自世界顶尖工业化经济体的代表讨论如何鼓励 AI 的优势,并最小化其负面影响(如工作职位减少和学会歧视的算法)。Geoff Hinton 参加了这次会议,《连线》对他进行了访问。访问内容如下:

Wired:加拿大总理贾斯丁·特鲁多在人工智能 G7 会议上说,需要更多研究来应对人工智能带来的伦理挑战。你怎么认为?

Geoff Hinton(下称 GH):我一直很担心致命自主武器的滥用。我认为应该设立类似《日内瓦公约》的法规来禁止它们的使用,就像禁用化学武器那样。即使并非所有国家或地区都签署这样的条约,但它可以作为一种道德旗帜。你会注意到谁没有签署它。

Wired:超过 4500 名谷歌员工签名抗议抗议五角大楼合同。谷歌称该项目并非用于攻击目的。你是否签署了抗议书?

GH:作为谷歌高管,我认为我不应该公开抱怨它,因此我私下里抱怨。我没有签署抗议书,而是和谷歌联合创始人 Sergey Brin 吐槽了几句。他说他对此也很苦恼。还好现在谷歌放弃竞标五角大楼的合同。

Wired:谷歌的领导者决定仅完成合同,而不是续约合同。他们发布了关于 AI 应用的准则,保证不将技术用于武器。

GH:我认为谷歌做出了正确的决定。将来或许所有事情都需要云计算,我们很难知道在哪儿画线,一定程度上画线这件事是随意的。我很高兴谷歌画下了这条线。这些准则对我来说意义重大。

Wired:人工智能在日常生活中也引发了一些伦理问题。例如,用软件为社会服务或医疗做决策。我们应该注意什么呢?

GH:在让技术运转这方面我是专家,但在社会政策方面我是外行。我对此持有技术专业见解的地方在于,监管结构是否坚持让你解释 AI 系统的运行原理。我认为这将是灾难。

人们无法解释自己做很多事的工作原理。当你雇佣某人时,决策是基于你能够量化的所有事物,以及所有本能直觉。人们不知道自己是怎么决策的。如果你让人解释自己的决策,你就是强制他们编故事。

神经网络也有类似的问题。当你训练神经网络时,它会学习从训练数据中提取的十亿个表示知识的数字。如果你输入一张图像,它会输出正确的决策,比如这是不是行人。但是如果你问它「为什么你这么认为?」,要是有用于决定一张图像中是否包含行人的简单规则,那这个问题早就解决了。

Wired:我们怎么知道何时应该信任这些系统呢?

GH:你应该基于执行效果来管理它们。运行实验来看是否存在偏差,或者它会不会杀人。拿自动驾驶汽车来说,我认为人们逐渐接受它了。即使你不怎么了解自动驾驶汽车的运作原理,但如果自动驾驶汽车的事故率大大低于人类驾驶汽车,那么这就是件好事。我认为我们必须像对待人类一样对待人工智能系统:只看它们的执行效果,如果它们不断遇到困难,那你可以说它们不够好。

Wired:你曾经说过,思考大脑的运作原理对你在人工神经网络方面的研究有所启发。人类大脑通过由大量突触联结而成的神经元网络从感官中获取信息。人工神经网络通过由权重连接的数学神经元网络获得数据。在上周发布的一篇论文《Assessing the Scalability of Biologically-Motivated Deep Learning Algorithms and Architectures》中,你和几位共同作者认为我们应该进一步揭示人脑中的学习算法。为什么?

GH:人脑与大部分神经网络解决的问题大相径庭。人脑中大约有 100 万亿个突触,是人工神经网络权重数量的 10,000 倍。人脑使用大量突触尽可能多地从几个 episode 中学习。而深度学习擅长利用神经元之间的连接(比人脑突触少得多)来学习,且它还需要有很多 episode 或样本。我认为人脑不考虑将大量知识挤到少量连接中,它考虑的是用大量连接来提取知识

Wired:要使机器学习系统更多地按人脑的方式运作,我们应该怎么做?

GH:我认为我们需要转向不同类型的计算机。幸运的是我有一台。

(Hinton 从钱包里掏出一个大的硅芯片,是 Graphcore 公司的一款芯片原型。)

我们用来运行神经网络的几乎所有计算机系统,甚至谷歌的特殊硬件,都使用 RAM 来存储正在运行的程序。将神经网络权重从 RAM 中取出以便处理器使用需要耗费大量能源。因此每个人必须确保自己的软件能够获取权重,软件还会多次使用权重。这是一笔巨大的成本,而你对每个训练样本都必须这么做。

在 Graphcore 芯片上,权重存储在处理器上的缓存中,而不在 RAM 中,这样权重就无需移动。这样很多事就比较好探索了。我们或许将得到这样的系统:拥有一万亿权重,而每个样本只能接触其中十亿权重。这样就更像大脑的规模了。

Wired:近期对 AI 和机器学习日益高涨的兴趣意味着对相关研究的资助前所未有。该领域的快速增长是否也带来新的挑战?

GH:社区面临的一项巨大挑战是,如果现在你想发表一篇机器学习论文,那么论文中必须有图表,表中列举不同数据集、不同的方法,且你提出的方法必须看起来是最好的那一个。如果不是,那么这篇论文很难发表。我认为这不利于人们思考创新型想法。

现在如果你写了一篇表达全新想法的论文,它几乎没有可能被接收,因为很多年轻的论文评审者压根不理解它。或者它到了资深评审者手里,但 ta 要评审太多论文,无法在第一轮就理解它,并认为这篇论文无意义。任何让大脑受伤的事物都可能不会被接受。我认为这非常糟糕。

在基础的科学会议上,我们应该追寻全新的想法。因为我们知道长期来看,全新想法要比小的改进具备更大的影响力。现在我们的做法颠倒了,我认为这是最大的弊端。

Wired:这会导致该领域的发展脱离正轨吗?

GH:只需要等待几年,失衡会纠正失衡。这只是暂时的。公司忙于教育员工,大学忙于教育学生,大学终将雇佣更多该领域的教授,它会自行回归正确的道路。

Wired:一些学者提醒,当前的人工智能炒作将导致「AI 寒冬」,就像 1980 年代那样,由于进展无法满足期望,而导致兴趣和资金的干涸。

GH:不会进入「AI 寒冬」,因为 AI 已经进入你的手机了。在之前的「AI 寒冬」中,AI 并没有成为人们日常生活的一部分。而现在它是了。

原文链接:https://www.wired.com/story/googles-ai-guru-computers-think-more-like-brains/

入门谷歌军事Geoffrey Hinton
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

神经元技术

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

推荐文章
暂无评论
暂无评论~