Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

杜伟、陈萍编辑

2022斯坦福AI指数发布:AI期刊出版和引用中国均第一,TF开源库最受欢迎……

一年一度的斯坦福「人工智能指数」报告来了,过去一年,全球 AI 领域又有哪些热门趋势和动向呢?
人工智能领域,由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,旨在促进基于数据的 AI 广泛交流和有效对话。

刚刚,AI Index 正式发布了 2022 年度报告。

图片


报告下载地址:https://aiindex.stanford.edu/report/

2022 年度发布的报告要点可总结为以下八点:

1. AI 领域私人投资猛增,投资集中度加剧。

2021 年 AI 领域的私人投资总额约为 935 亿美元,是 2020 年私人投资总额的两倍多,但新投资的 AI 公司数量却在继续下降,从 2019 年的 1051 家和 2020 年的 762 家公司减少到 2021 年的 746 家。2020 年有 4 轮 5 亿美元以上的融资,2021 年有 15 个。

2. 美国和中国主导了 AI 跨国合作。

尽管地缘政治紧张局势加剧,但从 2010 年至 2021 年,美中两国在 AI 出版物方面的跨国合作数量最多,自 2010 年以来增加了五倍。美中之间合作产生的出版物数量是英中之间合作数量(第二高)的 2.7 倍。

3. 语言模型比以往任何时候都更有能力,但也更有偏见。

大型语言模型在技术基准上创造了新的记录,但新数据表明,更大的模型也更易于从训练数据中反映出偏见。与 2018 年被认为是 SOTA 的 1.17 亿参数模型相比,2021 年开发的 2800 亿参数模型产生的「毒性」增加了 29%。随着时间的推移,这些系统的能力显著增强,既有性能增加也暴露出潜在愈加严重的偏见。

4. AI 伦理的兴起无处不在。

自 2014 年以来,关于 AI 公平性和透明度的研究呈爆炸式增长,在伦理相关会议上的相关出版物增加了五倍。算法公平和偏见已经从主要的学术追求转变为具有广泛影响的主流研究课题。近年来,具有行业关系的研究人员在以伦理为中心的会议上发表的论文同比增加了 71%。

5. AI 变得更负担得起,性能更高。

自 2018 年以来,训练图像分类系统的成本降低了 63.6%,而训练时间提升了 94.4%。在其他 MLPerf 任务类别(如推荐、对象检测和语言处理)中出现了训练成本更低但训练时间更快的趋势,有利于 AI 技术更广泛的商业应用。

6. 数据,数据,还是数据。

跨技术基准测试的顶级结果越来越依赖于使用额外训练数据来实现新的 SOTA 结果。截止 2021 年,本报告中 10 个基准测试中有 9 个 SOTA AI 系统接受了额外数据的训练。这种趋势隐式地有利于私人机构参与者访问大量数据集。

7. 关于 AI 的全球性立法比以往任何时候都多。

AI Index 对 25 个国家的 AI 立法记录的分析显示,被通过成为法令的包含 AI 的法案数量从 2016 年的 1 项增长到 2021 年的 18 项。2021 年,西班牙、英国和美国通过与 AI 相关的法案数量最多,平均通过了三项法案。

8. 机械臂越来越便宜

AI Index 调查显示,在过去六年中,机械臂手臂的价格中位数下降了 4 倍,从 2016 年的每只手臂 50000 美元降至 2021 年的 12845 美元。机器人研究变得更易于获得和负担得起。

从结构上来看,2022 AI Index 报告共分为五章,具体如下:

  • 第一章:研究与开发(Research and Development)

  • 第二章:技术性能(Technical Performance)

  • 第三章:技术 AI 伦理(Technical AI Ethics)

  • 第四章:经济与教育(Economy and Education)

  • 第五章:AI 政策与管理(AI Policy and Governance)

  • 附录


以下是对报告前两章内容的简要解读。

研究与开发

研发是推动人工智能快速发展不可或缺的力量。每年,广泛的学术、行业、政府和民间社会专家和组织通过大量论文、期刊文章和其他与人工智能相关的出版物、人工智能会议或图像识别等特定子主题的会议,为人工智能研发做出贡献。

本报告第一章利用多个数据集分析 2021 年人工智能研发领域的主要趋势。本章首先着眼于人工智能出版物,包括会议论文、期刊文章、专利和知识库。然后,报告分析了 AI 会议出席情况。最后,报告检查了研发过程中使用的 AI 开源软件库。

AI 出版物总体概览

图 1.1.1 为全球 AI 出版物数量。从 2010 年到 2021 年,AI 出版物的总数量翻了一番,从 2010 年的 162444 篇增加到 2021 年的 334497 篇。

图片



按专业划分:自 2015 年以来,模式识别机器学习领域的出版物增长了一倍多。而受深度学习影响较大的其他领域,如计算机视觉数据挖掘自然语言处理方面,则增幅较小。

图片


跨国合作:从 2010 年到 2021 年,中美在 AI 出版物方面的跨国合作数量最多,自 2010 年以来增加了五倍。两国之间合作产生的出版物数量是中英合作产生出版物数量的 2.7 倍(排名第二)。

图片

图片


AI 期刊出版物

在从 2010 年到 2015 年仅略有增长之后,AI 期刊出版物的数量自 2015 年以来增长了近 2.5 倍(图 1.1.7)。 

图片


图 1.1.10 按三大 AI 强国划分了过去 12 年 AI 期刊出版物的份额。中国始终保持领先地位,2021 年为 31.0%,其次是欧盟和英国为 19.1%,美国为 13.7%。

图片


引用次数:在 AI 期刊论文的引用次数上,中国的份额逐渐增加,而欧盟以及英国和美国的份额则在下降。这三个地理区域的总引用量占全球总引用量的 66% 以上。

图片


AI 会议出版物


AI 会议出版物数量在 2019 年达到峰值,比 2021 年的峰值下降了约 19.4%(图 1.1.12)。然而,尽管总数有所下降,但自 2010 年以来,人工智能会议出版物在全球会议出版物总数中的份额增加了超过 5 个百分点(图 1.1.13)。

图片

图片


按地域划分:2021 年,中国以 27.6% 的比例在全球 AI 会议出版物中所占份额最大,比 2020 年的领先优势更大,而欧盟和英国以 19.0% 紧随其后,美国以 19.0% 位居第三 16.9%(图 1.1.15)。

图片


引用次数:尽管中国在 2021 年发表了最多的 AI 会议出版物,图 1.1.16 显示,美国在 AI 会议引用次数方面领先于其他大国,2021 年为 29.5%,其次是欧盟 + 英国 (23.3%) 和中国(15.3%)。

图片


AI 专利

图 1.1.22 为 2010 年到 2021 年 AI 专利申请数量。2021 年 AI 专利申请量是 2015 年的 30 倍以上,复合年增长率为 76.9%。

图片


按地理区域:中国现在申请了全球一半以上的人工智能专利,并获得了约 6% 的授权,与欧盟和英国大致相同。美国在北美申请了几乎所有专利。图 1.1.24c 显示,与不断增长的人工智能专利申请和授权数量相比,中国的专利申请数量(2021 年为 87,343 件)远高于授权数量(2021 年为 1,407 件)。

图片

图片



AI 开源软件库

图 1.3.1 和 1.3.2 反映了 2015 年至 2021 年 GitHub 开源 AI 软件库的用户数量。TensorFlow 仍然是 2021 年迄今为止最受欢迎的,GitHub 累计 star 量约为 161,000 ,比 2020 年略有增加。TensorFlow 在 2021 年,它的受欢迎程度大约是排名第二的 GitHub 开源 AI 软件库 OpenCV 的三倍,紧随其后的是 Keras、PyTorch 和 Scikit-learn。图 1.3.2 显示了 GitHub star 量少于 40,000 的库的受欢迎程度—— FaceSwap 位居榜首,其次是 100-Days-Of-ML-Code、AiLearning 和 BVLC/caffe。

图片


技术性能

今年,在技术性能一章对人工智能各个子领域的技术进步进行了比以往更多的分析,包括计算机视觉、语言、语音、推荐、强化学习、硬件和机器人技术的趋势。

计算机视觉:图像

截至 2021 年底,顶级图像分类系统 Top-1 准确率上平均每 10 次分类出现 1 个错误,而在 2012 年底,平均每 10 次分类出现 4 个错误。

图片



图 2.1.5 记录了生成模型在 STL-10 数据集上取得的性能。由首尔大学等机构的研究人员开发的最先进的 STL-10 模型的 FID 得分为 7.7,明显优于 2020 年 SOTA 结果。

图片



人脸检测:从 FRVT face-mask 测试中可以得出三个重要趋势:(1)面部识别系统在 masked 上的表现仍然相对较好;(2) masked 的表现比 non-masked 差;(3) 2019 年以来差距缩小。尽管人脸识别技术已经存在了几十年,但最近几年的技术进步是显著的。当今一些表现最好的面部识别算法在具有挑战性的数据集上的成功率接近 100%。

图片


计算机视觉:视频


MTV 是 Google Research、密歇根州立大学和布朗大学的合作项目,于 2022 年 1 月发布,在 600 系列上实现了 89.6% 的 Top-1 准确率,在 400 系列上实现了 89.1% 的准确率,在 700 系列上实现了 82.20% 的准确率 (图 2.2.2)。

图片


对 2022 AI Index 更多细节内容感兴趣的读者,请阅读原报告。

机器之心作为斯坦福「人工智能指数」项目的合作伙伴,将继续为中文阅读习惯的读者带来2022年度斯坦福「人工智能指数」报告的官方中文版,并邀请斯坦福「人工智能指数」的核心成员就今年的报告进行解读分享,敬请期待!

理论AI Index
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

OpenCV技术

OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

参数模型技术

在统计学中,参数模型是可以使用有限数量的参数来描述的分布类型。 这些参数通常被收集在一起以形成单个k维参数矢量θ=(θ1,θ2,...,θk)。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

人脸检测技术

人脸检测(face detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。

推荐文章
暂无评论
暂无评论~