Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

文龙作者

​多国学者共同绘制「机器学习+高能密度物理学」新蓝图,发表在Nature上

Set the Controls for the Heart of the Sun(给太阳的心脏设置控件)

这是 Pink Floyd 于1968年发布的歌曲。数年来,科学家们一直在朝着在实验室中创造出类似于太阳心脏的目标不懈努力,也取得了重大的进展。但是,这颗「人造太阳心脏」应该由谁来控制?是人类还是人工智能
发表在杂志《自然》(Nature)上的题目为「数据驱动的高能密度物理学的未来」(The data-driven future of high-energy-density physics)为我们提供了一种答案,也为高能密度物理学的研究人员指明了方向。
文章认为,由于等离子体的高度非线性,机器学习模型和数据驱动的方法正在重塑我们对强等离子体系统的探索过程,持续高效地为我们提供新的见解。论文的作者多从事于英国、美国、荷兰、葡萄牙各国的大型(高能物理)研究所。
图片
该论文重点介绍了哪些数据科学问题与强等离子体科学有关,讨论了该领域成功的经验,确定了仍然存在哪些挑战,并展望了未来。不仅如此,文章还就研究设计、训练、最佳方案以及对综合诊断和数据分析的支持等方面向高能密度物理学社区提出了建议。

什么是高能密度物理学(HEDP)

高能密度物理学(HEDP)是与凝聚态物理学、核物理学、天体物理学和等离子物理学交叉的一个新的子领域,被定义为能量密度超过约100 GJ / m ^ 3的物质和辐射的物理学。
HEDP 包括巨行星深层内部常见密度的凝聚态物质和恒星内部典型的热等离子体的研究。这个多学科领域为理解各种各样的天体观测和理解并最终控制融合机制提供了基础。具体而言,在实验室中控制热核聚变以及自然界中从行星到褐矮星或恒星的转变,都是通过 HED 机制进行的。
在过去的几百年中,观测天文学为我们宇宙的运转绘制了一幅画。今天,最新的 HED 设施使我们能够在实验室中重现行星和恒星的核心。这些新的 HED 功能共同创建了一个天体物理学现象的微型观测站,「给太阳的心脏设置控件」可能不再只是一种幻想。

为什么 HEDP 需要借助机器学习

HEDP 具有丰富的实验数据资产,目前已有数千名科学家在全球数个大型机构中进行实践。除了实验之外,超级计算机一直是 HEDP 的关键支持,许多在顶级高性能计算设施上运行的复杂的仿真代码也得到了发展。
现在,该领域需要能够系统地管理大量数据,这不仅是因为实验数据的数量被设置为大规模增长,还因为模拟大量实验的能力已经超出了常规方法的范围。机器学习、贝叶斯方法和数据科学已经在粒子物理学和天体物理学中使用了很多年,并正在对具有高度非线性的其他物理领域产生影响,其中,一些AI解决方案很可能适用于等离子体物理学。
机器学习可以帮助解决 HEDP 中的三个主要挑战:实验设计与自动化、数据整合、物理模型。
图片

具体如何实施

天体物理学

大量天体等离子体的数据以多种方式采集,但不幸的是,它们目前以不同的形式被不同的社区所拥有。自大约2015年以来,天文学家就实践了「多信使」天文学(从电磁波、引力波、宇宙射线等多个信使中获取天文数据),现在是时候步入「多源」天文学了。具体来说,需要将来自观测和实验的数据整合到一个对天体物理理解的连贯模型中。
用一种机器学习算法将来自多个来源的数据进行合并,并基于此算法更新信息(「数据同化」)。最终的数据驱动结果将吸收来自理论以及观察和实验的所有数据,从而给出更精确的预测、合理的不确定性。
图片天体信息的整合。(来源:论文)

惯性约束聚变(ICF)

我们对 ICF 内爆的物理理解是基于大量低保真模拟集成,稀疏、难以诊断的实验,以及推动高性能计算技术发展的最佳物理模拟三者的组合。创建和综合这些数据以更好地理解物理学,将需要来自数据科学、不确定性量化和人工智能的多项互补技术。
图片将信息源整合到ICF研究中。(来源:论文)

自动化实现高重复频率激光器

另一个重要的 HED 设施是高重复频率激光器,它每天最多只能发射一次,每秒可以发射多次。这意味着针对给定的研究目标获取大量数据需要大量的实验,也就意味着实验过程的大部分操作必须自动化。为了取得成功,自动化的实验需要在单个算法过程中控制实验参数并实时分析实验结果。
AI 系统须具有以下功能:对其不确定的物理状态进行最佳估计的模型;建立激光当前状态的模型、目标模型;快速选择下一枪是什么算法;在没有人工干预的情况下实际发射该枪的系统;快速自动数据收集,快速建模,以及更新诊断性能模型的能力。
图片高重复频率高功率激光器的一系列不同组件。(来源:论文)

总结与建议

结论

  1. 机器学习和数据科学方法在强等离子体物理学和 HEDP 中的应用正在迅速增长,并正在帮助产生对预测的合理不确定性。
  2. 高重复率的设施开辟了多种工作方式;数据驱动的发现、盲法实验、更高的可重复性和自动数据采集。
  3. 将基于机器学习的方法集成到工作实践中可以节省大量金钱、时间和人力。
  4. AI 工具现在在优化非线性极端物理系统和理解多模态数据方面通常比人类更成功。
推荐建议
  1. 研究人员应仔细考虑如何最好地使用其数据:可以使用哪些方法和诊断方法来获取最佳数据、合理的不确定性以及与其他数据集相结合。
  2. 奖金奖项应包括对不确定性量化、建立综合诊断和数据分析的更大支持。
  3. 等离子体物理研究生教育和国家实验室培养计划应开始包括基础数据科学的课程。
  4. 研究人员应尽可能尝试实践开放式科学最佳方案;通过使用不同设施之间的共享数据标准,使代码和数据公开可用。

论文链接:https://doi.org/10.1038/s41586-021-03382-w

参考内容:https://en.m.wikipedia.org/wiki/High_energy_density_physics#cite_ref-4
理论Nature高能密度物理学机器学习
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

推荐文章
暂无评论
暂无评论~