Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI/ML在地球科学中备受瞩目,急需培养下一代物理数据科学家

编辑/凯霞

人工智能(AI)、机器学习(ML)和数据科学在整个地球科学领域越来越受欢迎,但地球科学教育并没有跟上这些趋势。

美国俄克拉荷马大学计算机科学学院和气象学院 Amy McGovern 教授和中央密歇根大学地球与大气科学系和地球与生态系统科学系 John Allen 副教授共同发表了他们的看法:

AI、ML 和数据科学提供了灵活、可扩展和可解释的方法来利用不断增长的可用数据量,帮助我们提高对各种地球科学现象的理解和预测,包括自然灾害、气候变化和恶劣天气事件。因此,AI/ML 和数据科学在整个地球科学领域越来越受欢迎。

然而,地球科学教育并没有跟上这一趋势,给学生和研究人员留下了知识空白,阻碍了他们通过开发新的研究方法和应用来创新和成长的能力。为了弥合这些差距,我们需要培养准备好应对地球科学数据和相关现象的独特需求的新一代数据科学家。

AI/ML 方法是领域不可知的,并且缺乏对自然过程内在的基于物理学的理解。AI/ML 方法的这种特性在某些情况下可能是有利的,但将 AI/ML 应用于地球科学现象和问题,需要对所涉及的物理学有深入的了解。尽管肤浅的训练可能使研究人员能够选择可能对其工作有用的现有 AI/ML 方法,但创建可以改变科学理解的新方法需要用户了解其数据和方法的基本特征。

在 2019 年 10 月 11日,科罗拉多州立大学(Colorado State University)的科学家为研究人员概述了几个建议的步骤,来解决如何最好地同时利用基于物理和数据驱动的方法的问题。

  1. 提出指导性问题;
  2. 探索将科学知识融入人工智能;
  3. 促进跨学科合作和教育。

因此,物理数据科学家需要全面准备,包括在各自学科(大气科学、海洋学、地球科学等)以及 AI/ML 方面的基础培训,这将使他们能够处理越来越大和复杂的数据集并进行创新。

超越基础数学和编程

扎实的数学基础是理解基础地球科学过程以及计算机科学原理的基础。一些数学课程已经在全国的地球科学课程中开设。这些课程提供的背景可能足以让你对 AI/ML 方法有一个「肤浅」的了解。然而,创新需要更深层次的 AI/ML 基础数学知识。

图示:在地球和空间科学中应用 ML 的十种方法。(来源:eos.org)

例如,向现有 AI/ML 方法添加基于物理的约束,需要了解偏导数以及变化的损失函数如何影响机器学习。因此,对于下一代毕业生,我们必须扩大数学的核心培训,包括偏微分方程和统计课程。

许多地球科学学科已经在他们的课程中增加了介绍性的计算机编程,但物理数据科学家还需要在计算机科学基础方面进行培训,例如高效的数据结构、并行编程和高性能计算,以使用 AI/ML 实施和测试想法。入门课程通常向学生教授变量、简单循环和函数等概念,但不教授更高级的概念,如面向对象编程(OOP)和数据结构。我们主张了解如何使用和创建数据结构(如树、哈希图和集合),对于高效且可重复地处理大型地球科学数据集至关重要。

高效的高性能计算还需要掌握当代超级计算机的工作方式,包括图形处理单元 (GPU)。GPU 最初广泛用于街机游戏,后来用于桌面游戏,但其对多个数据集执行并行操作的能力极大地扩展了其应用范围。如果使用得当,GPU 可以为多维地球科学数据提供数量级更快的处理。许多数据库已经使用 GPU,尽管可能需要创建专门的代码(通常需要线性代数)才能将这些处理器用于新目的。

AI/ML 和数据科学基础培训

确保下一代物理数据科学家做好充分准备,可能需要与传统的数据科学和 AI/ML 研究科学家培训方法不同的培训。

在地球科学中,AI、ML、统计学和数据科学都有重叠之处——因此经常被混淆或误解。我们将 AI 定义为包括所有类别的智能解决问题的方法。此类方法包括智能搜索技术,例如 A*,这是大多数地图搜索应用程序中使用的方法。它们还包括多代理系统,使 AI 方法能够协调不同代理之间的行动,例如完成搜索和救援行动的人类和机器人团队。

图示:AI 是一个广泛的领域,包括数据科学、机器学习和统计学等其他领域并与之重叠。这些领域的工具被广泛应用于各种科学领域。

在 AI 中,ML 专注于随着时间、给定经验或数据而适应的模型。ML 方法部分借鉴了传统的统计方法,如回归或 Kullback-Leibler 散度,因此并不完全独立于统计。新技术涉及混合统计和机器学习方法。例如,数据科学方法往往侧重于大数据的分析以及数据管理,并借鉴了人工智能、机器学习和统计方法。深度学习是一种专注于使用专门神经网络的机器学习,它是目前地球科学中最流行的机器学习方法之一。

数据科学家的传统培训通常包括针对上述每个主题的单独课程。我们建议对物理数据科学家的培训可以转而专注于与所有这些主题相关的基础方法,并结合数学和计算机科学的强大和协同参与。这种方法会更有效,并且可能需要更短的类系列。

例如,我们并没有在 AI/ML 中学习更长时间的以学科为重点的课程,而是提出了一个跨学科的三门课程序列。该序列将涵盖 ML 方法的数学基础,同时侧重于应用程序,以促进了解哪种方法最适合哪种类型的现象。课程顺序将包括一门关于更传统的机器学习方法的课程,一门专注于深度学习的高级课程,以及一门汇集数据科学和统计学方法,以促进对大数据集的有效探索和实验的课程,包括经验和统计分析并验证应用于不同科学领域的 AI/ML 方法。

劳动力发展与多元化

随着 AI/ML 方法的普及,除了重塑学生教育课程之外,我们还为现有的地球科学研究人员、预测人员和从业人员提供继续教育和发展的途径,这一点至关重要。鉴于职业限制,期望当前的劳动力成员像攻读学位的学生一样参加多个学期的课程是不现实的。因此,必须开发其他路径。

已经有几个有效的概念可以再培训大气科学家,并且可以作为与 AI/ML 和数据科学相关的类似项目的模型。这些概念包括:

暑期学校旨在让人们快速了解一个广泛的主题,但深度较浅。由于 COVID-19,国家大气研究中心 (NCAR) 将其传统的面对面暑期学校形式调整为在线观众,将 2020 年夏季的出席人数扩大到 2,000 多人。7 月,NCAR 和美国国家科学基金会资助的人工智能天气、气候和沿海海洋学可信人工智能研究所 (AI2ES) 举办了为期 4 天的联合暑期学校,旨在为环境科学开发可信人工智能,包括讲座、教程、 和小组讨论。暑期学校提供实时和异步两种方式,因此人们可以随时访问它,这应该会增加其影响。

短期课程涵盖更深入的重点主题。例如,大气研究合作研究所教授了一门关于在天气和气候研究中使用 AI/ML 的短期课程。AI2ES 教授了一门关于可解释 AI 的短期课程,并将在未来几年教授其他课程。与最近的暑期学校一样,这些短期课程是现场举办的,观众人数较少,以促进参与者的互动,并进行录制,然后在线提供给公众。事实证明,教师提供的示例 AI/ML 代码对这些课程的成功至关重要——通过代码,参与者能够快速了解这些方法的工作原理,并将其应用于自己所在领域的现象和问题。

教程通常是全天或半天的活动,研究人员在参加大型会议时跳入一个主题。例如,美国气象学会 (AMS) 人工智能委员会多年来一直在 AMS 年会上为天气研究提供有关人工智能的深入教程。

通过 AI2ES 开发和教授的完整在线课程与传统的为期一学期的面对面课程一样,为大学生提供;它们也在网上免费提供。员工无需注册完整课程,而是可以根据需要按照自己的节奏查看特定模块——这种方法有助于有针对性和高效的再培训。

人工智能社区大学证书是最近的发展。位于德克萨斯州科珀斯克里斯蒂市的德尔马学院是 AI2ES 的合作伙伴,它已开发出首批此类社区学院人工智能环境科学证书之一。这五门课程以及其他类似课程可用于劳动力再培训,以及扩大对地球科学的参与。

我们强调,这种加强和简化劳动力再培训的努力应该广泛提供给地球科学界的每个人,以帮助提高劳动力的多样性。

加州大学洛杉矶分校的教育研究员和作家 Jane Margolis 和卡内基梅隆大学计算机科学学院本科教育前副院长 Allan Fisher 的合著《Unlocking the Clubhouse Women in Computing》讲道:如果女性和边缘化社区的女性能够看到工作在现实世界中的应用,她们就会对科学、技术、工程和数学 (STEM) 领域更感兴趣。然而,专注于编程基础的课程,甚至关于特定 AI/ML 方法的课程,很少提供欣赏有形应用程序的机会。确保对未来物理数据科学家的培训包括基础计算机科学和数学原理适用性的相关和频繁的演示,从而可以提高地球科学和计算机科学的多样性,这也可以促进创新。

不断发展和适应教学

培训和教育的发展和创新需求反映了更广泛研究界的趋势。例如,最近发布的欧洲中期天气预报中心 AI/ML 10 年路线图指出,「我们预计,未来将越来越难以区分从事机器学习的科学家和领域科学家。」


参考链接:https://www.ecmwf.int/en/elibrary/19877-machine-learning-ecmwf-roadmap-next-10-years

快速调整培训和教育以利用新兴技术在传统上并不是学术界的强项。然而,随着 AI/ML 和数据科学方法的快速发展,以及它们可以应用于一系列紧迫的地球科学问题,我们认为值得花时间和投资来重新制定教学方法来培训学生的物理数据科学和更好地为未来的工作做好准备。

参考内容:https://eos.org/opinions/training-the-next-generation-of-physical-data-scientists

https://eos.org/opinions/thoughtfully-using-artificial-intelligence-in-earth-science

https://eos.org/opinions/ten-ways-to-apply-machine-learning-in-earth-and-space-sciences

产业
1
暂无评论
暂无评论~