机器之心编辑部报道

斯坦福2018 AI指数报告出炉:DL职位需求两年增长35倍

由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,目标是促进基于数据的 AI 的广泛交流和有效对话。昨天,AI Index 发出了 2018 年度报告。经「人工智能指数」项目委员会授权,今日头条联合机器之心翻译的该报告中文版将于近日发布。本文仅对其进行概要介绍。

这份报告试图从学术、工业、政策等角度全面介绍全球人工智能的发展现状,今年的报告更加注重全球数据。报告指出,美国的 AI 研究力量仍是全球最强,但中国的追赶速度很快。报告特别介绍了清华大学学习 AI 课程的学生数量:2017 年人工智能+机器学习课程的入学人数比 2010 年时多 16 倍。

AI Index 2018 版介绍

我们很高兴推出 AI Index 2018 年度报告。本年度的报告要实现两个目标:更新上一年的指标以及尽可能地提供全球性的背景。前一个目标是 AI Index 至关重要的使命——为探讨人工智能设定基础,即意味着要持续不断地跟踪规模和技术的进展。但后一个目标也很重要。没有全球化的视野,不可能讲好 AI 故事。2017 年的报告严重偏向了北美地区的活动。这只是因为我们的全球合作关系还有限,并不是因为我们有内在的偏见。今年,我们开始填补这一全球性漏洞。我们认识到,要使本报告真正完备全面,前方还有很长的路要走——会涉及到更多合作和外部参与。

尽管如此,我们仍可以断言 AI 是全球性的。2017 年,Scopus 上 83% 的 AI 论文都来自美国之外。其中来自欧洲的占到了最大的比例(28%)。在全世界范围内,AI 和机器学习(ML)大学课程的入学人数都在增多,尤其值得一提的是中国的清华大学,该校 2017 年人工智能+机器学习组合课程的入学人数比 2010 年时多 16 倍。2017 年,中国生产的工业机器人的数量也占到了世界的最大比重——占全球机器人总出货量的 30%。而且不只是美国、中国和欧洲,其它地方也在推进 AI 的发展。根据我们的统计 AI 专利的方法,韩国和日本在 2014 年产出的 AI 专利分列全球第二和第三,仅次于美国。另外,南非成功举办了第二届 Deep Learning Indaba 大会,这是世界最大型的机器学习教学活动之一,吸引了来自 20 多个非洲国家的超过 500 名参会者。

 AI 的多样性不仅体现在地理上。如今,Partnership on AI 已有大约 50% 的成员组织是非营利性的,包括美国公民自由联盟、国际特赦组织、牛津大学人类未来研究所和联合国开发计划署。而且人们也对 AI 领域中的性别和少数族裔多样性的重要性有了更高的认识。AI4ALL 和 Women in Machine Learning(WiML)等组织正在加大力度鼓励和支持代表性不足的群体参与进来。

下面的指标也能体现本报告所传达的关键信息:AI 是全球性的。

报告目录如下:

领域活力

学术

1996~2017 年间论文发表数量年增长情况

下图展示了 1996 年~2017 年 AI、CS 及所有领域论文数量的增长情况。从图中可以看出,AI 领域的论文增幅最大,比 1996 年增加了 7 倍多。

1998~2017 年间 Scopus 平台 AI 各子领域论文数量年增长情况

下图展示了 Scopus 上的 AI 论文数量(按 AI 子领域划分,各个类别之间可能有交叉)。可以看出,机器学习和概率推理、神经网络计算机视觉方面的论文最多,增速也最快,反映了这些领域的火热程度。

2000 年&2017 年中国、美国、欧洲区域的活跃 AI 研究方向

下图显示了中国、美国、欧洲的 AI 研究相对活跃指数(RAI,一个国家/地区 AI 出版物份额与全球 AI 出版物份额的对比,1.0 表示该国家/地区在 AI 领域的研究活跃度与全球活跃度完全一致)。可以看出,2000 年中国的工程、技术研究活跃程度高于平均水平,但医疗健康、农业、社会科学、人道主义方面的研究活跃度比较低。到了 2017 年,这几个领域活跃程度有所提高,其中最突出的是农业科学。

1998~2017 年间中国、美国和欧洲论文数量变化情况(按领域划分)

下图展示了中国、美国和欧洲来自政府、企业及医疗领域的论文数量变化情况。从中可以看出,中国、欧洲的 AI 论文主要来自政府,而美国的 AI 论文则主要来自企业。

1998-2016 年各地区发表论文的领域权重引用影响系数(FWCI)

美国的 AI 论文作者获得的引用量要比全球平均水平高 83%,另一方面,中国论文的被引次数增长迅速。

各个国家和地区在 2018 AAAI 大会上的论文发表数量

70% 的 AAAI 论文来自美国、中国。

大型 AI 会议参与度

下图显示了 1984-2018 年间大型 AI 会议的出席人数以及 2012-2018 年各个大型会议出席人数的增长变化。从图中可以看出,1986-1993 年左右,出席大会的人数下降得比较厉害。而从 1995 年至今,出席大型 AI 会议的人数呈波动增长,尤其是从 2013 年开始急剧增加。注:这里对大型会议的定义是 2017 年出席人数超过 2000 的大会。

小型 AI 会议参与度

下图展示了 1995-2018 年间出席小型 AI 会议的人数以及 2012-2018 年各个小型会议出席人数的增长变化。小型会议是指在 2017 年出席人数不足 2000 的大会。

ICLR 2018 的出席人数是 2012 年的 20 倍,这一趋势反映了当前的人工智能更加注重深度学习强化学习

业界

AI 工作机会

下图根据所需 AI 技能展示了 2015-2017 年工作机会变化趋势(AI 技能有交叉)。可以看出,机器学习深度学习方面的工作机会最多,深度学习工作机会增速最快。

开源

GitHub 收藏量(star)

下图展示了 2015-2018 年不同的 AI 和 ML 软件包在 GitHub 上的收藏量变化。从图中可以看到两个近期趋势:大公司支持的框架(如 TensorFlow (谷歌)、PyTorch (Facebook)、MXNet (亚马逊))流行度不断增长;与其他包相比,TensorFlow 具备更强的流行度。

技术表现

计算机视觉

1. 目标检测:ImageNet

下图展示了 2010 到 2018 年目标检测模型在 ImageNet 数据集上的准确率变化。

2. 目标检测:ImageNet 训练时间

下图展示了 2017 年 6 月到 2018 年 11 月训练神经网络在 ImageNet 数据集上得到高准确率所需时间。

3. 实例目标分割:COCO

下图展示了 2015-2018 年模型在 COCO 数据集上的性能变化。

自然语言理解

1. 解析

下图展示了 1995-2015 年 AI 系统在确定句子句法结构的任务上的性能变化。

2. 机器翻译

下图展示了 2008-2018 年机器翻译系统在英语-德语翻译和德语-英语翻译任务上的性能变化。

3. 问答系统:ARC

2018 年 4 月-11 月问答系统在 ARC 基准上的性能变化

4. 问答系统:GLUE

2018 年 5 月-10 月问答系统在 GLUE 基准上的性能变化

识别下方二维码,阅读完整版报告。

延伸阅读:

2017 年报告(中文):http://cdn.aiindex.org/AI-Index-2017-Chinese-Translation.pdf

2018 年报告中文版将于近日发布,敬请期待。

产业AI 指数报告斯坦福
11
相关数据
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

工业机器人技术

工业机器人是面向工业加工制造的可自动控制,多用途,需有三轴及以上可编程的固定或可移动机械手。其系统中包括带有执行机构的机械手以及示教控制器。 它可以依靠自身控制能力来执行预设的轨迹及动作。典型应用包括焊接,刷漆,组装,采集和放置等工作。工业机器人完成工作具有高效性,持久性和准确性。目前常用的工业机器人包括关节机器人,SCARA机器人,并联机器人和直角坐标机器人等。

MXNet技术

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

问答系统技术

问答系统是未来自然语言处理的明日之星。问答系统外部的行为上来看,其与目前主流资讯检索技术有两点不同:首先是查询方式为完整而口语化的问句,再来则是其回传的为高精准度网页结果或明确的答案字串。以Ask Jeeves为例,使用者不需要思考该使用什么样的问法才能够得到理想的答案,只需要用口语化的方式直接提问如“请问谁是美国总统?”即可。而系统在了解使用者问句后,会非常清楚地回答“奥巴马是美国总统”。面对这种系统,使用者不需要费心去一一检视搜索引擎回传的网页,对于资讯检索的效率与资讯的普及都有很大帮助。从系统内部来看,问答系统使用了大量有别于传统资讯检索系统自然语言处理技术,如自然语言剖析(Natural Language Parsing)、问题分类(Question Classification)、专名辨识(Named Entity Recognition)等等。少数系统甚至会使用复杂的逻辑推理机制,来区隔出需要推理机制才能够区隔出来的答案。在系统所使用的资料上,除了传统资讯检索会使用到的资料外(如字典),问答系统还会使用本体论等语义资料,或者利用网页来增加资料的丰富性。

推荐文章
所以什么时候发布呀。。。