今日头条&机器之心联合发布:斯坦福AI指数2017年度报告官方中文版

由斯坦福大学人工智能百年研究(AI100)推出的「人工智能指数」(AI Index)是一个追踪 人工智能行业动态与发展的非营利性项目,其研究覆盖了百年以来人工智能的总体情况, 目标是基于数据来推动人工智能的广泛交流和有效对话。2017 年,AI Index 推出了首份年度报告,从多个角度观察和解读了人工智能领域的动态和进展。 经「人工智能指数」项目委员会授权,今日头条联合机器之心对此报告做了中文翻译(译文错误由翻译方负责),官方中文版报告近期正式发布。


中文版本报告下载链接:http://cdn.aiindex.org/AI-Index-2017-Chinese-Translation.pdf


报告目录

以下是对该报告核心内容的摘取,完整报告请点击阅读原文前往官网下载:

领域活力

学术领域

1.论文发表数量

下图统计了 Scopus 学术论文库中标注关键词「人工智能」的计算科学论文数量。

自 1996 年至今,每年发布的 人工智能论文数量增加了 9 倍多。

这里是各类学术论文年发表率与其 1996 年发表率的比较。图表显示了各领域论文、 计算机科学领域论文以及计算机领域内人工智能论文年发表率的增速。

数据揭示了人工智能论文发表率的增长不仅仅是出于对更广泛计算机科学领域兴趣的 增长。具体来说,尽管自 1996 年以来整体计算机科学领域内的论文数量已经增长了 6 倍,同时期人工智能领域每年发表的论文数量已经增长了 9 倍多。

2.课程选修人数

除了论文发表数以外,课程的参与人数也能体现这个领域的活力。以下展示的是斯坦 福大学每年选修人工智能与机器学习导论课程的学生数量。机器学习是人工智能的子领域。我们着重关注机器学习导论课程的参与度是因为目前人工 智能领域很多成果都基于机器学习的算法与理论。

自 1996 年以来,选修斯坦福大学人工智能导论课程的人数已经增长了 11 倍。

注:斯坦福大学 2016 学年机器学习入学人数的下降是基于当年的行政问题而非学生兴趣。详情请见附录。

本报告之所以着重突出斯坦福大学导论课程的选修人数是因为其数据最全面。不过如下所示,其它高校导论课程的选修趋势也与斯坦福相似。

注:许多大学从上世纪 90 年代起开设人工智能课程。上图展示的是可获取数据的年份的情况。

注:许多大学从上世纪 90 年代起开设机器学习课程。上图展示的是可获取数据的年份的情况。

需要注意的是,这些图表展示了高等教育领域中的一个侧面,这些数据并不一定代表 学术机构总体的发展趋势。

3.学术会议出席情况

以下展示了人工智能领域有代表性的学术会议的参会情况,其中既有如 AAAI、IJCAI 和 ICML 这样的大型综合性会议 (按 2016 年参会人数超过 1000 人为标准),也有像 CVPR、ACL、ICRA 那样专注于计算机视觉、自然语言处理和机器人的小型会议 (2016 年参 会人数不足 1000 人)。

注:大多数学术会议自 1980 年代起即开始举办,上图展示的是参会人数有记录的年份的情况。

研究重心转移:上图的参会人数同样表明了研究重点已经从符号推理转向了机器学习与深 度学习。

下图展示了参会人数少于 1000 人的小型学术会议的参会情况,其中需要注意的是 ICLR,该会议专注于深度学习领域,第一次会议于 2013 年由深度学习先驱 Yann LeCun 及 Yoshua Bengio 主办。

稳步前进:尽管学术界研究重点近年来已转移至机器学习及深度学习,仍有一小部分 研究者继续在符号推理方法上进行探索并取得进展。

 产业领域

1.AI 领域创业公司 

下图展示了得到风投资本支持并开发了人工智能系统的美国活跃创业公司的数量。

这一数量自 2000 年以来已增加了 14 倍。

2.AI 领域风险投资 

下图为风投资本对美国人工智能创业公司所有融资阶段的年投资总额。

这一金额自 2000 年以来增加了 6 倍。

3.工作机会

下图分别展示了两个在线招聘网站 Indeed 和 Monster 上需要人工智能技能的工作数量的增 长。我们通过标题和工作描述的关键词区分出需要人工智能技能的工作。

下图是 Indeed 网站上美国需要人工智能技能的工作数量的增长数据。涨幅是基于 2013 年 1 月 Indeed 网站上美国要求人工智能技能的就业岗位所占份额的增长倍数。

自 2013 年以来,在美国需要人工智能技能的工作比重增长了 4.5 倍。

下图为 Indeed.com 平台报告的多个国家需要人工智能技能的工作比重的增长趋势。

注:虽然在加拿大和英国 人工智能就业市场增长很快,但 Indeed.com (http://indeed.com/) 称相对来说它们在 绝对规模上仍然只有美国 AI 就业市场的 5% 和 27%。

下图为 Monster 平台发布的按照所需的特定技能划分的一年内人工智能工作机会总量。

注:一份与人工智能相关的工作可能出现被计算两次的情况 (属于不同的类别)。比如,一份工作可能尤其需要自然语言处理和计算机视觉两种技能。

4.自动化及机器人应用

工业机器人进口到北美和全球的数量。

 工业机器人进口到北美和全球的数量增长趋势。

 开源生态

1.GitHub 项目统计

下图展示了 GitHub 上 TensorFlow 和 Scikit-Learn 软件包被收藏 (star) 的次数。二者都是深度学习和机器学习的常用软件包。

软件开发者在 GitHub 上收藏 (Star) 软件项目以表示感兴趣并希望快速导航至该项目。收藏 可以代表开发者对软件和软件使用的兴趣。

下图展示了 GitHub 上不同人工智能和机器学习软件包被收藏的次数。

注:GitHub 库的 fork 数量遵循几乎同样的趋势 (尽管每个库的 fork 量和 star 量不同)。

公众认知及媒体报道

1.舆论倾向

下图展示了包含关键词「人工智能」的大众媒体文章的百分比,文章根据其意见倾向性 被分为正面报道或负面报道。

技术性能

计算机视觉

1.物体检测

下图展示了 LSVRC 竞赛 (Large Scale Visual Recognition Challenge) 中人工智能系统在物体检 测任务上的性能表现。

图像标注的误差率从 2010 年的 28.5% 降至低于 2.5%。

2.视觉问答

下图展示了人工智能系统在针对图像问题提供开放式回答任务上的表现。

注:VQA 1.0 数据集已经被 VQA 2.0 数据集超越,目前尚不明确 VQA 1.0 数据集在未来会 获得多少关注。

自然语言处理

1.解析

下图展示了人工智能系统在确定句子句法结构任务上的表现。

2.机器翻译

下图展示了人工智能系统在英德新闻互译任务中的表现。

3.问答

下图展示了人工智能系统在从文档中找到问题答案任务上的表现。

4.语音识别

下图展示了人工智能系统在语音识别上的表现。

定理证明

可处理度 (tractability) 是指自动定理证明器在大量定理的数据集上的平均可处理程度。它可 以被用来衡量部分最先进的自动定理证明器。参见附录以获取与「可处理度」有关的更多信息。

注:引进最先进的证明器虽然可以解决新问题,但由于其在处理其他证明器擅长解决的问题上表现糟糕,平均可处理度可能会下降。

 SAT 求解

这里指的是 SAT 求解系统解决问题 (那些可应用到产业实践中的问题) 的百分比。

 流行趋势关系研究

通过研究不同流行趋势之间的关系,我们可以从前述章节中的评估中获得进一步的领 悟。本章展示了人工智能指数收集的数据可以如何被应用到进一步的分析中,以及这些数 据如何推动了一个全新、精确的衡量指标的发展。

由于这是一个案例研究板块,我们会着眼于横跨学术圈与产业界的流行趋势去探究其 之间的动态关系。进一步,我们会将这些标准整合成一个联合的人工智能活力指数。

学术界-产业界的动态关系

为了研究学术界与产业界人工智能相关活动的关系,我们首先从之前章节中选择了部 分具有代表性的评估结果。特别地,我们考察了人工智能论文的发布情况与斯坦福大学人 工智能与机器学习导论课程的修读情况,此外还考察了风投资本对人工智能创业公司的投 资情况。

论文发表数、注册学生数和投资金额这些数量指标并不能直接比较。为了分析这些趋 势之间的关系,我们首先以 2000 年为起始为每个测量指标设定了时间标准。这使得我们 可以来比较这些指标随时间的增长情况变化,而不是仅仅从最后的绝对值入手分析。

注:注册学生数在 2016 年有所下降,这反映了学校行政上的某些问题,并非没有足够的学生对课程感兴趣。具体细节可参考附录 A2。

数据显示,首先,学术活动数量 (论文发表与注册学生数) 在稳步上升。在 2010 年 左右,投资者便开始注意到了这个领域,到 2013 年,投资者已经成为了推进该领域发展 的核心驱动力。此后,学术界逐渐赶上了产业界的步伐。

人工智能活力指数

人工智能活力指数整合了来自学术界和产业界的各类数据 (论文发表量、课程注册学 生数、风险资本投资) 来量化整个人工智能领域的活力。为了计算人工智能活力指数,我 们按照时间对来自论文发表、学生课程注册和投资领域的数据进行了归一化平均处理。

我们希望这份简要调查可以激发大家在研究如何进一步分析人工智能指数中数据类别 方面的兴趣,也希望可以引起讨论来研究出一个可以长期追踪的有价值的测量方法。

产业人工智能斯坦福大学
1
暂无评论
暂无评论~