Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

深度学习能否达到人类推理水平?三位图灵奖得主激辩海德堡论坛

Bengio 和 LeCun 都认为深度学习系统未来能够进行推理,但 Bengio 的信心来源更加具体——「从生物学和人类智能中获得更多的灵感」。

85 岁的图灵奖得主 Raj Reddy 参加了最近举行的第九届海德堡获奖者论坛。他发出由衷感叹:「我在人工智能领域工作了近 60 年,没想到这种技术会在有生之年实用化。」

10 年前,也就是 2012 年,深度学习取得了突破。当时,一种基于多层神经网络图像分类创新算法突然被证明比之前的所有算法都要好得多。这一突破使得深度学习在语音和图像识别、自动翻译和转录以及机器人等领域得到应用。

随着深度学习被嵌入到越来越多的日常应用中,越来越多可能出错的样本也浮出水面:人工智能系统会进行歧视,制定刻板印象,做出难以捉摸的决定,并需要大量的数据,有时还需要大量的能源。

在此背景下,第九届海德堡获奖者论坛为来自 50 多个国家的约 200 名青年研究人员组织了一场关于深度学习的应用和影响的小组讨论。包括图灵奖获得者 Yoshua Bengio、Yann LeCun 和 Raj Reddy,2011 年 ACM 计算机奖获得者 Sanjeev Arora,以及研究人员 Shannon Vallor、Been Kim、Dina Machuve 和 Shakir Mohamed 都参与了讨论。

Meta 首席 AI 科学家 Yann LeCun 是小组成员中最乐观的:「有很多人声称深度学习不能做这个或那个,而这些说法在经过几年的工作后大多被证明是错误的。过去五年,深度学习已经能够做到我们所有人都想象不到的事情,而且进展正在加速。」

LeCun 举例说,Meta 公司旗下的 Facebook 现在能自动检测出 96% 的仇恨言论,而大约四年前,这个比例只有 40%。他把这种改进归功于深度学习。「我们每天都受到大量信息的轰炸,而且这种情况只会越来越严重。我们将需要更多的自动化系统,使我们能够筛选这些信息。」

英国爱丁堡大学教授 Shannon Vallor 则反对 LeCun 的观点,即技术只是向前发展,它似乎有自己的意志,而社会只需适应。「这正是我们陷入某些问题的原因。技术可以走很多分叉的道路,人们决定哪条分叉路是最佳的。深度学习系统是人类根据自己的价值观、激励措施和权力结构建造和部署的彻头彻尾的人工制品,因此我们要对它们负全责。」

深度学习的批评之一是,虽然它擅长模式识别,但目前不适合进行逻辑推理,而老式的符号 AI 却适合。然而,Bengio 和 LeCun 都认为没有理由不能让深度学习系统进行推理。正如 Bengio 所观察到的,「人类也在他们的大脑中使用某种神经网络,我相信有办法通过深度学习架构达到类似人类的推理。」

然而,Bengio 补充说,他不认为仅仅扩大现今的神经网络就足够了。「我相信,我们可以从生物学和人类智能中获得更多的灵感,以弥补当前人工智能和人类智能之间的差距。」

普林斯顿大学的理论计算机科学家 Sanjeev Arora 补充说,不仅仅是深度学习还不能推理,其实我们也不能推理深度神经网络。Arora 说:「我们需要更多地了解深度学习系统的黑匣子里面发生了什么,而这正是我正在努力做的事情。」

Raj Reddy 是迄今为止参与人工智能社区时间最长的小组成员,他从 20 世纪 60 年代起就参与了人工智能先驱约翰 · 麦卡锡的博士研究工作。Reddy 认为杯子是半满的,而不是半空的。「深度学习的一个重要应用是帮助了社会金字塔底部的人。世界上大约有 20 亿人不能阅读或书写。各种语言技术现在已经足够好用了,比如语音识别和翻译。我在这个领域工作了近 60 年,没想到这种技术会在有生之年实用化。十年后,即使是文盲也能阅读任何书籍,观看任何电影,并与世界上任何地方的任何人用他们的母语进行对话。」

然而,对于深度学习技术来说,处理较小众的语言仍然是一个未解决的问题,因为可用的数据要少得多。数据科学顾问 Dina Machuve 说,仅在非洲,就有 2000 种语言,但没有人工智能技术可用。重要的是要进入一个社区,看看什么对该社区有用,所以在为非洲寻找深度学习应用时,Machuve 集中于图像应用方面——「我们已经开发了基于图像识别的家禽疾病和农作物疾病的早期检测系统。」

不幸的是,在许多方面,非洲仍然是深度学习研究和部署中「缺失的大陆」,DeepMind 的研究员 Shakir Mohamed 补充说。「我们统计了 2006 年至 2016 年期间,在著名的神经信息处理会议 NeurIPS 上,有多少来自非洲人的论文被提交,答案是:0。拉丁美洲也是如此,或许是 1 篇。我希望你们所有人,无论你们在哪里,都能认真对待代表性的问题,谁在做这项工作,在哪里做,以及如何与他人分享你们的经验。」

谷歌大脑的研究科学家 Been Kim 说,她希望大家认识到,深度学习并不是一个可以解决所有社会问题的神奇工具。事实上,她观察到,「可能有比机器学习更适合你所遇到问题的非 AI 解决方案。你要停下来质疑:这是正确的工具吗?

当被问及普通大众应该知道什么是人工智能及其前景时,Mohamed 说:「未来还没有被决定。我们仍然可以创造和塑造未来,这就是我们应该永远记住的。」


原文链接:https://cacm.acm.org/news/265733-deep-learning-is-human-through-and-through/fulltext

理论图灵奖深度学习
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~