Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Leah Hoffmann作者杜伟 shooting编译

深度学习来得太晚也太猛,对话2018年度图灵奖三位「大佬」

虽然曾经遭受质疑甚至嘲笑,但 2018 年度图灵奖获得者 Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio 一直在他们的研究生涯中不断发展人工神经网络,其研究成果已成为了从搜索到内容过滤等领域不可或缺的组成部分。所以,当前炙手可热的深度学习人工智能领域究竟怎么样呢?下面,三位人工智能领域的「大佬」将与大家分享一些令人振奋的发现以及依然存在的一些问题。

现在关于人工智能的讨论远多于您刚开始研究生涯的时候——有些您可能听说过,有些可能没有。那么,您希望人们不再问哪些问题呢?

GEOFFREY HINTON:「神经网络只是一场泡沫吗?」以前,人工智能业内人士给出很大的承诺,而这些承诺有时被证明只是一场空谈。但是,神经网络远不止给出承诺那么简单。这项技术确确实实在发挥作用,并且能够缩放。当你提供更多数据和一台运行速度更快的计算机时,神经网络性能会自动提升,而不需要任何人再多写几行代码。

Geoffrey Hinton

YANN LECUN:的确是这样。深度学习的基本理念并没有消失。但当人们问我们,让机器变得更智能的方法是不是只有简单地扩展现有方法时,这的确令人沮丧。我们需要一些新的范式。

YOSHUA BENGIO: 当前技术得益于之前很多年的工业和科学应用累积。比如说,我们三个都是研究者,但常常迫不及待地想要开发更多新技术,因为我们离人类水平的人工智能以及理解自然或人工智能原理的梦想还差得远呢。

Yoshua Bengio

哪些方面没有得到充分讨论?

HINTON:人工神经网络会告诉我们大脑如何工作吗?人们会问这个问题,但问的人还不够多。

BENGIO:是的。不过遗憾的是,虽然深度学习从大脑和认知中汲取灵感,但很多相关领域的工程师目前并不关心这些主题。这也不难理解,因为只要能够把技术应用到工业中,其它东西都仿佛不重要了。但就研究而言,如果我们不能与那些努力理解大脑工作原理的研究人员保持联系,则是一大损失。

Yann LeCun

HINTON:也就是说,神经科学家现在正在认真对待这个问题。多年来,神经科学家一直在说:「人工神经网络与真正的大脑一点也不像,它们并不能告诉我们任何有关大脑如何工作的东西。」但现在,这些神经科学家正在认真考虑大脑中存在反向传播这种东西的可能性,这是一个非常令人兴奋的领域。

LECUN:现在,几乎所有关于人类和动物视觉的研究都使用卷积网络作为标准概念模型。这种情况最近才出现。

HINTON:我认为人工神经网络还会慢慢地对社会科学产生巨大的影响,因为它能够改变我们对人自身的看法。我们过去认为人是理性存在的,并且人的特别之处在于能够借助推理来得出结论。现在,我们对人有了更好的理解,即人基本上是能够做出大量类比的机器。人发展这些表征的过程非常缓慢,之后这些表征决定了人所能做出的类比种类。当然,我们可以做出推理,并且如果没有推理则发展不出数学,但这并不是基本的思考方式。

作为具有开创性研究的学者,您似乎常常不满足自己现有的成绩。

HINTON:在我看来,那些发明了当前标准技术的人虽然会有一些特殊之处,但他们并没有什么天赋异禀,并且还可能存在一些更好的技术。但是,当一个领域已经有了一种标准的做事方式时,那么进入该领域的人不会理解这种标准的做事方法是多么的武断。

BENGIO:有时候,学生在谈论神经网络的时候就好像是在描述《圣经》一样。

LECUN:标准的方法可能会造成教条主义。而且,一些最有创意的想法可能是由年轻人提出来的。

该领域已经取得了一些令人瞩目的进展。20 或者 30 年前,哪些可能发生的事物会让您感到惊讶呢?

LECUN:让我感到惊讶的东西太多了。比如,深度学习革命开始得太晚了,而开始革命后它发展的速度也太快了。我本来希望神经网络的发展更加地循序渐进,但遗憾的是,人们在 20 世纪 90 年代中期到 21 世纪前 10 年中期完全放弃了神经网络。我们有证据表明神经网络之前就发挥过作用。但这一观点被证明之后,神经网络的发展开始变得势不可挡:先是在语音识别领域,然后是图像识别,现在已经扩展到自然语言理解领域了。

HINTON:20 年前,如果有人可以提取一种语言中的句子,将它分割为小的单词片段,然后将其输入一个始于随机连接的神经网络,然后训练这个神经网络神经网络再将这个句子翻译成另一种语言,而不需要任何语法或语义知识——完全没有运用到语言知识——并且翻译效果比任何其它工具都好。这会让我非常惊讶。虽然这种翻译并不完美,不如双语人才,但它已经在做得越来越好。

LECUN:令我惊讶的还有这些技术应用到很多产业中的速度,也是如此之快。如果现在你从谷歌或 Facebook 中移除深度学习,则两家公司会陷入瘫痪。它们完全是围绕深度学习来构建的。当我加入 Facebook 时,令我感到惊讶的是该公司有一个小组使用卷积网络来研究人脸识别。当时我对卷积网络的第一感觉是它们可能对分类的识别有用:汽车、狗、猫、飞机和桌子,而不适用于人脸等细粒度目标识别。但结果证明卷积网络非常有效,并且现在完全成为了标准。另一件令我感到惊讶的是 Yoshua 实验室中开发的生成对抗网络——人们基本上可以将神经网络作为生成模型使用,以生成图像和声音。

BENGIO:在我攻读博士期间,我曾竭尽全力扩展自己的想法,即神经网络的作用不是仅限于模式识别——将固定大小的向量作为输入并生成类别。但直到最近的翻译研究才让我们摆脱了这种固有认识。正如 Yann 所说,网络生成新事物的能力的确已经出现革命性的变化。所以神经网络有能力操纵任何种类的数据结构,而不仅仅是像素和向量。以传统的观点来看,神经网络只限于执行那些人类可以快速且无意识完成的任务,如目标和图像识别。现代神经网络在本质上有别于我们在 20 世纪 80 年代所以为的那样,这些神经网络现在能做的事情更加接近我们推理以及编程时所做的事情。

尽管已经取得了这么多成就,Yoshua,您曾讨论过促使发展中国家更容易获取神经网络技术的紧迫性。能够谈谈这些吗?

BENGIO:我认为这个问题非常重要。我以前没有考虑太多的政治问题,但机器学习人工智能已经从大学的象牙塔里走出来了。我认为我们有责任考虑这个问题,并参与到关于人工智能用法的社会和政治讨论中去。其中一个问题是,专业知识和技能、财富和技术将集中在哪里?这些是否由少数国家、少数公司以及一小群人集中掌控?或者是否有方法使人们更容易获取这些?特别是在一些它们能够对更多人产生更大影响的国家。

HINTON:谷歌已经开源了发展神经网络的主要软件,这就是大家所称的 TensorFlow。人们还可以使用特殊的谷歌硬件在云端建立神经网络。所以,谷歌正努力促使更多的人获取并使用这项技术。

LECUN:我认为这是非常重要的一点。深度学习社区在这一方面已经做得很好了。具体而言,在学术界有学术会议公开发表论文和评审,在业界有谷歌和 Facebook 等公司开源其绝大多数自己编写的软件,并为他人提供工具以便他们在这些软件的基础上进一步构建。所以,任何人都可以复现其他人的研究,有时几天内就可以完成。任何顶级研究组织都不可能在任何特定主题上领先其他人几个月。重要的问题是这个领域的整体进展速度有多快。因为对于我们真正想要构建的东西——能够回答任何问题且在现实生活中为我们提供帮助的虚拟助手,我们不仅缺少相关技术,还缺少一些基本的科学原理。我们越快地促使整个研究社区致力于此,则对我们所有人来说越好。

原文链接:https://cacm.acm.org/magazines/2019/6/236987-reaching-new-heights-with-artificial-neural-networks/fulltext


理论Geoffrey HintonYoshua BengioYann LeCun图灵奖神经网络
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经科学技术

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

推荐文章
暂无评论
暂无评论~