Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱、泽南报道

中国AI技术领先,是因为数学好?美国杂志直指中美数学教育差距

美国 CS 专业超过 64% 博士生和近 70% 的硕士生是留学生,数学博士学位有一半授予了非美国公民,中国和印度学生占大部分。

上个星期,一位华人留学生题为「亚洲人数学能力其实很差?」的视频登上了热搜。

「知其然而不知所以然,他们仅仅擅长使用而不追求真理。」这名女生认为大多数亚洲人学习数学时注重运用却不关心原理推导,论据有一定的道理,不过结论引发了不少人的吐槽。

很快,博主「他们都叫我雪姨」新发布了一个视频向大家道歉,表示个人经历不能指代群体,有关亚洲人数学很差的言论十分不正确。在应试教育为主,升学压力很大的国内,如果说学生们花费如此大的精力却不能把一门学科学明白,确实非常可怕,数学是当代高等教育最重要的基础是有目共睹的。

7 月份,2020 阿里巴巴全球数学竞赛结束,活动创办者马云如此评价数学的重要性。

有趣的是,在数学水平太差这件事上,大洋彼岸的美国人和我们有着同样的担忧。在亚洲人数学很差的视频在国内流行的同时,美国《国家利益杂志》刊载了一篇文章给出了完全相反的观点:因为中国人数学好,在人工智能领域里中国正在逐渐成为决定性力量。

这篇报道在开篇即提到:「忘记人工智能本身吧,它只是一个数学问题。美国没有培养出足够擅长数学的公民,因此无法保持统治地位。」

以下为美国《国家利益杂志》报道的主要内容:

海外第一次注意到中国人工智能技术的非凡能力可能是在 2017 年底,当 BBC 记者 John Sudworth 在贵阳尝试挑战「天网系统」时,仅用 7 分钟就被找到。如今,像依图科技和旷视科技这类在人脸识别领域处于引领地位的公司,已经能够将这个 7 分钟缩短为几秒钟。这不仅体现了中国的人工智能技术实力,更重要的是背后所展现的数学实力。

人工智能领域的竞争已经成为中美两国竞争中最显著的一个方面。占据人工智能主导地位的那一方将拥有重塑全球金融、商业、电信、战争和计算的能力。2019 年 2 月,美国总统特朗普签署了一项行政命令,名为「美国人工智能倡议(American AI Initiative)」,旨在保持美国人工智能技术领域的领导地位。在短短几年内,美国的企业、高校、智库和政府相继颁布了数百个政策文件以及项目,来应对这一挑战。

但这并非人工智能本身的问题,而是数学的问题。

人工智能并不能被简单地看作「黑箱」——只要无限投入资金就可以发展壮大。如果美国人才不能掌握人工智能领域所需的数学基础知识,那这么多的智库项目和政府报告将毫无意义。如果没有抽象数学能力,那数十亿美元的投资要求也是不现实的。

今天我们所说的「人工智能」实际上是各种算法及其特色化发展的结合,大量地借鉴了高等数学和统计学知识。以深度神经网络为例,它不是人造大脑,而是大量通过重复计算一系列梯度(高中微积分几乎不教)来「学习」的信息转换模块,梯度也是反向传播算法家族的主干。

反向传播(Backpropagation)是一种与最优化方法(如梯度下降法)结合使用的,用来训练人工神经网络的常见方法。

所有的机器学习都可以做类似的分析,这项研究就是关于如何编写计算机程序来学习一项任务,而不是执行一个预先编码的任务。快速分类数据、识别模式、结果预测和自学的能力,都归结于愈发复杂的算法,以及逐渐强大的算力和海量数据。

从 iPhone 到世界上最强大的超级计算机 Summit,从谷歌到 Facebook,这些计算平台和计算程序都使用了极其复杂的数学计算,从模拟核爆炸到网络搜索结果,无所不及。

与《人工智能超级大国:中国、硅谷和新世界秩序》作者李开复的观点相反,人工智能不仅仅是数据。李开复曾经提到,今天的数据就宛如 20 世纪早期的石油资源,拥有最多数据的中国就是新的沙特阿拉伯。然而,如果没有与之匹配的数学能力,以及一些推动数学领域创造性发展的人,世界上所有的数据加在一起也只能带你走到这一步——而不足以走到 AI 领域前沿研究者们大胆畅想的未来。

不管你怎么划分,这个世界都是在 1 和 0 的基础上运行的,运行它们的算法都是经过反复锤炼的。创造这些算法的人才都经过了多年的训练,才能掌握这些复杂的数学知识。

不幸的是,美国的中学生和大学生没有掌握基本的数学知识,比如统计理论和微分几何,而这些知识恰恰是他们进入更高阶段的基础,也是人工智能的基础。

在经济合作与发展组织(OECD)2018 年的国际学生评估项目测试中,15 岁的美国学生的数学成绩为 35 分,远低于该组织成员国的平均水平。即使在大学阶段,由于没有掌握解决抽象问题所需的基本知识,美国学生通常要记忆算法,然后在需要的时候插入算法。

在学生高等数学能力培养方面的失败,意味着越来越少的美国公民去攻读数学和科学类的高等学位。美国国家科学基金会的数据显示,2017 年,美国计算机科学专业超过 64% 的博士候选人和近 70% 的硕士生是国际学生,当年数学专业的博士学位有一半授予了非美国公民,其中中国学生和印度学生占了大部分。亚洲优秀学生希望去到美国大学深造,这很大程度上是因为美国大学的培养体制比他们本国的培养体制要先进,尽管中美之间的教育差距不断缩小。

然而这也同时意味着,美国大学培养出来的那些在计算机科学和数学领域开辟新方向的人,不是美国人。这些人一部分将留在美国,但许多人也会回国,投身于本国科技产业的发展。

有充分的理由认为美国应该放宽对于熟练技术工种的入境签证限制,鼓励更多的人在完成学业之后留在美国。但最重要的问题是,根本没有足够数量的美国公民把高等数学作为主修科目,这些细节造成了相应的影响,从应对全球竞争到硅谷的创业文化,从对于国家安全的担忧到美国公司是否认为自己需要为美国利益着想。

美国在数学教育上的停滞与中国积极推进 2030 年 AI 计划形成了鲜明的对照。在如今的人工智能技术领域里,美国和中国占据了最重要的地位。中国在人工智能相关技术上投入了大量资金,使其成为国内工业现代化的核心重点。在《中国制造 2025》战略中,「中国智造」这一名词被提出,制造技术与信息技术结合的系统成为发展方向,人工智能等技术占据了主导地位。

目前,中国的 AI 市场约有 245 亿人民币的规模。在国务院印发的《新一代人工智能发展规划》中到 2025 年人工智能基础理论将实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力。而在那个时候,人工智能核心产业规模预计会超过 4000 亿元,带动相关产业规模超过 5 万亿元。

为实现这样的目标,国内已投资 140 亿元人民币在北京打造 AI 工业园区。而华为等引领全球行业发展的科技企业也在推出自己的 AI 芯片,打造「全场景 AI」战略。

在中国,人工智能已经从实验室走出来,进入了技术落地探索的阶段。基于高度精确的面部识别技术,我们可以实现很多快捷方便的应用,如银行大额转账时的认证、券商远程开户,甚至虚拟身份证。一些科技公司的 AI 实验室也已推出了可以识别出 Deepfake 换脸技术的深度学习模型,对于打击黑产、证据造假等任务上,这些技术将能发挥非常重要的作用。

尽管中国的 AI 产业正在不断与美国拉近距离,但中国仍将眼光放得更为长远——他们在努力提高年轻人的数学水平。据经济合作与发展组织(OECD)对于全球 15 岁学生的最新一期统计,中国学生的数学能力全球第一(科学和阅读能力也是第一)。毫无疑问,中国正将重点放在 STEM(即科学、技术、工程和数学)教育上,其程度超过了美国和欧洲国家。

2020 年 1 月,教育部发布了在部分高校开展基础学科招生改革试点(也称强基计划)的通知,其指出「要服务国家战略,招收一批有志向、有兴趣、有天赋的青年学生进行专门培养,为国家重大战略领域输送后备人才…… 主要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生。」

5 月 6 日,参与强基计划的大学已经发布了第一年的招生简章,包括清华、北大等 36 所「一流大学」建设高校开展了试点。这一计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,主要突出基础学科的支撑引领作用,全部限定为基础学科专业,且不得转换专业,这也是和以往自主招生最大的不同(高校的自主招生也已被取消)。

看来,想要提升基础教育水平,在人工智能等尖端领域提高自身实力,中国和美国人都有着同样的想法。但在数学之外,决定因素或许还有很多。

参考内容:

https://nationalinterest.org/feature/why-chinas-race-ai-dominance-depends-math-163809

http://www.moe.gov.cn/srcsite/A15/moe_776/s3258/202001/t20200115_415589.html

入门数学水平中美
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

分类数据技术

一种特征,拥有一组离散的可能值。以某个名为 house style 的分类特征为例,该特征拥有一组离散的可能值(共三个),即 Tudor, ranch, colonial。通过将 house style 表示成分类数据,相应模型可以学习 Tudor、ranch 和 colonial 分别对房价的影响。 有时,离散集中的值是互斥的,只能将其中一个值应用于指定样本。例如,car maker 分类特征可能只允许一个样本有一个值 (Toyota)。在其他情况下,则可以应用多个值。一辆车可能会被喷涂多种不同的颜色,因此,car color 分类特征可能会允许单个样本具有多个值(例如 red 和 white)。

反向传播算法技术

反向传播(英语:Backpropagation,缩写为BP)是“误差反向传播”的简称,是一种与最优化方法(如梯度下降法)结合使用的,用来训练人工神经网络的常见方法。该方法计算对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法,用来更新权值以最小化损失函数。 在神经网络上执行梯度下降法的主要算法。该算法会先按前向传播方式计算(并缓存)每个节点的输出值,然后再按反向传播遍历图的方式计算损失函数值相对于每个参数的偏导数。

微积分技术

微积分(Calculus)是高等数学中研究函数的微分(Differentiation)、积分(Integration)以及有关概念和应用的数学分支。它是数学的一个基础学科。内容主要包括极限、微分学、积分学及其应用。微分学包括求导数的运算,是一套关于变化率的理论。它使得函数、速度、加速度和曲线的斜率等均可用一套通用的符号进行讨论。积分学,包括求积分的运算,为定义和计算面积、体积等提供一套通用的方法 。

推荐文章
暂无评论
暂无评论~