纽约时报: 2012, 神经网络改变了机器观察世界的方式; 现在, 历史即将重演

来源 | 纽约时报

编译 | Rik R

2012 年,Geoffrey Hinton 改变了机器观察世界的方式。

Hinton 是多伦多大学的教授,他与该校的两名研究生共同建立了一个系统,该系统可分析成千上万张照片,并能够通过自我学习来识别常见的物体(比如鲜花和汽车),且其精准度高得惊人。

他和他的学生们很快搬到了谷歌,而驱动他们的系统(被称为一个神经网络)的数学方法则传遍了科技界。这就是自动驾驶汽车得以识别出街道标志和行人的原因。

但正如 Hinton 先生自己所指出的,他的思想也有其局限性。举例来说,如果用于训练神经网络的咖啡杯图片总是朝一个方向,那么该系统就不太可能认出倒置的咖啡杯。

现在,Hinton 先生正与一名年轻的谷歌研究员 Sara Sabour 一起,试图探索出另一种被称他称之为胶囊网络(capsule network)的数学方法。

该思想是建立一个视觉方式与人类更加相像的系统。如果神经网络是以二维视角来观看世界,那么胶囊网络就是三维的观察方式。

Hinton 先生,一位 69 岁的英国侨民,于今年在多伦多创办了谷歌的人工智能实验室。一些人认为,这个新实验室象征着前沿技术研究的未来:欧洲、中国,以及长期以来的人工智能研究中心,如多伦多等,这些美国以外的地区被寄予了厚望,更受移民研究者的欢迎。

Sabour 女士是一名伊朗籍研究员,她之前申请到华盛顿大学学习计算机视觉,但遭到了美国政府的拒签,随后来到多伦多开始了新的生活。

她的任务是将 Hinton 先生的概念性想法以数学方式表达出来,目前该项目正在开花结果。他们最近发表了一篇论文,表明在某些情况下,当以不熟悉的视角进行观察时,使用他们的方法可以更准确地识别出物体。

「与当前人人都在使用的传统神经网络相比,它的识别归纳能力(generalize)要好得多,」Sabour 女士说。

今年 12 月,我走进了 Hinton 先生的办公室。他身穿平日里的纽扣衬衫和毛衣,递给了我两个白色的大积木。它们看起来像是从旧玩具箱底翻出来的。

他解释说这两个积木是一个金字塔的两半,并问我是否可以把它们拼回去。这似乎并不难。这两个积木形状奇特,但每个积木只有五个面。我所要做的就是找到互相匹配的两个面并把它们拼接起来。但是我没能做到。

大多数人都没能通过这个考验,他告诉我,没通过考验的还包括麻省理工学院的两位终身教授。一位拒绝尝试,另一位坚持认为这是不可能的。「这是可能的,只不过我们都失败了,」Hinton 先生解释说,因为这个问题破坏了我们观察金字塔形物体的自然方式。

我们观察物体时不是一个面一个面地看,而是把整个物体放到一个三维空间里来看。由于该金字塔被切成两半的方式很离奇,因此这使得我们不能像往常那样将其放置在三维空间进行想象。

运用他的胶囊网络,Hinton 先生的最终目标是赋予机器以人类那样的三维视角,即仅从一个角度来观察物体,就能从任意视角对其进行识别。这是神经网络所办不到的。

「这是一个被计算机视觉研究者们忽略的事实,」他说道,「这是一个巨大的错误。」

神经网络模拟人脑中神经元网络的方式并不严格,它是通过识别大量数据中的模式来学习离散任务的算法。例如,通过分析成千上万张的汽车照片,一个神经网络可以学会去识别一辆汽车。

这一数学概念可以追溯到 20 世纪 50 年代,但由于处理能力的提高以及因特网所产生的大量数据,近年来这一概念得到了实际应用的机会。在过去的五年中,从智能手机数字助理到语言翻译服务再到自主机器人,神经网络加速了这一切的进展。

但这些方法距离实现真正的智能机的目标还很远——它需要进行新的研究来交付众多顶尖科技公司所期许的自主机器,包括对话式计算机和无人驾驶汽车。

一小撮影响力日益壮大的专家群体正在努力推动行业进入这些另类的研究领域,作为人工智能界的教父级人物,Hinton 先生也是其中之一。

Oren Etzioni 是西雅图艾伦人工智能研究所的首席执行官,他称当前行业关注神经网络的现象是「一种行业的短视行为」(industry』s myopia)。他说,从长远来看,这会妨碍人工智能的进展。

Eric Horvitz,是一位在微软负责人工智能方面的工作人员。他认为,相比于未来几年内将会出现的技术,神经网络及其相关技术只是微小的进步。

「现在,我们所做的不是一门科学,而是一种炼金术,」他说。

Hinton 承认,到目前为止,他在多伦多的项目只显示出了初步的结果。而像 Etzioni 与 Horvitz 等其他人则认为,要实现真正的智能机,就需要截然不同的技术。

Etzioni 表示,虽然机器学习方法将继续保留人工智能研究的中心地位,但它们必须通过引入其它技术得以加强。机器学习方法在根本上是受限的,因为它们是从数据中进行学习。正确的数据并不总是可用的。

但是 Hinton 先生认为,他的胶囊网络最终将能够扩展到更加广泛的应用场景,加速计算机视觉以及会话计算之类的事物的进展。胶囊网络是一种以更复杂的结构化方式来模拟大脑神经元网络的尝试,他解释说,这种附加结构也有助于其它形式的人工智能。

他当然明白,有许多人将对他的技术持怀疑态度。但是 Hinton 先生也指出,五年前也有许多人怀疑神经网络。

「我认为,」他说道,「历史将重演。」

产业产业多伦多大学Geoffrey Hinton神经网络
暂无评论
暂无评论~