Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

物理约束神经网络 (PCNN) ,求解强相对论带电粒子束电磁场的麦克斯韦方程组

图片

电动力学研究电磁场的基本属性、运动规律以及电磁场和带电物质的相互作用。其渗透到物理学的各个分支,从宇宙膨胀模型、形成宇宙射线晕的星系盘和基于加速器的高能 x 射线光源,到消色差超表面、动态全息的超表面、片上衍射神经网络(NN),再到单个加速电子的辐射阻尼。

电动力学起源于迈克尔·法拉第(Michael Faraday)和詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)的早期研究,他们首次表明,现实的某些方面存在于有形物质之外。

自麦克斯韦和法拉第时代以来,高性能计算极大地提高了物理学家研究电动力学现象的能力。然而,物理学家在使用数值模拟来计算控制等离子体湍流、同步辐射和其他现象等混沌条件的相对论性带电粒子动力学时,仍然面临着挑战。

现在,美国能源部洛斯阿拉莫斯国家实验室的科学家们提出了一种物理约束神经网络 (Physics-constrained Neural Network,PCNN) 方法,来求解强相对论带电粒子束电磁场的麦克斯韦方程组。PCNN 可以将硬物理约束引入神经网络的结构,这种方法可以帮助解决有关高能带电粒子束的电磁场的一些悬而未决的问题。

该研究以「Physics-constrained 3D convolutional neural networks for electrodynamics 」为题,发布在《APL Machine Learning》上。

图片

「PCNN 方法背后的主要原理是生成势函数,而不是直接生成场函数,」论文一作 Alexander Scheinker 说。举个例子,如果一组研究人员向神经网络展示了一个特定的磁场,标记为 B,他们试图产生,并且它产生了一个与其大致匹配的磁场(在本例中称为 B')。

「在这种情况下,网络的近似值 B’ 可以任意接近正确的场 B,」Scheinker 说。然而,仔细观察会发现 B' 实际上非常不稳定。

「另一方面,如果你创建一个势函数,并使用它来生成 B',它就会符合物理学,」Scheinker 说。「然后网络不仅尝试逐点匹配,而且实际上在导数和平滑度方面在物理意义上匹配它。」

这描述了该研究中应用于该问题的相同过程,研究人员「通过迫使神经网络创建矢量和标量势,然后根据麦克斯韦方程从这些势产生电磁场」来实现这一过程,从而将物理约束硬编码到方法的结构中。

图片

图示:从电流密度 J 生成磁场 B̂(B 的估计值)的各种 NN 方法。(来源:论文)

但是他们是如何设法实施这些物理约束的,从而使产生的磁场与向神经网络显示的磁场具有零散度?

「将其作为硬约束强制执行的方法是,神经网络生成向量势 A,然后我们将 B 创建为 A 的旋度(curl),」Scheinker 解释道。「这样,根据矢量演算,根据定义 B 的散度为零,因为矢量场旋度的散度始终为零。」

过去,由于物理信息神经网络(PINN)在神经网络函数中引入了软约束,复杂带电粒子行为和相关现象的研究取得了一些成功。虽然 PINN 既灵活又强大,但它的软约束并不能保证研究人员引入的约束总是能得到满足。

Scheinker 说:「PINN 类型的方法不会在神经网络的结构中建立任何硬性约束,它们只是在成本函数中添加一个附加项,轻轻地将网络的输出推向满足某些所需约束的方向。」

「与此相反,PCNN 方法保证了网络无法违反的内置硬物理约束,」他补充道。根据其设计,他和 Pokharel 在他们的研究中使用的 PCNN 只能生成满足此类硬约束的场。

图片

图示:NN、PINN 和 PCNN 可以在训练数据上实现类似的错误,因为它们都使用类似的 3D 卷积神经网络 (CNN) 编码器-解码器架构。(来源:论文)

「直觉上,如果你考虑一个产生磁场的神经网络,并且你知道散度应该为零 (divB=0),那么 PINN 方法会在成本函数中添加一个额外的项,以惩罚散度的非零值,」 Scheinker 解释道。

在统计学中,成本函数(也称为损失函数)将事件或至少一个变量的值映射到一个实数上,该实数表示与给定事件相关的「成本」。

在 PINN 方法中,「这是有代价的,因为当你惩罚发散时,」Scheinker 补充道。Scheinker 说:「让网络产生零散度场的最简单方法就是让场等于某个任意常数,这与场的正确值无关。」 在 PINN 方法的情况下,成本函数的两个部分是不一致的,其中一个部分试图以各种方式匹配磁场,但无法衡量约束,例如磁场的导数应该如何表现。

与此同时,「另一部分试图尊重物理学,」Scheinker 说,「但不尊重输出应与正确值相匹配的事实。」

「在 PCNN 方法中没有这样的权衡,」他说。「通过构建,网络只能创建满足硬约束的场,唯一的成本函数就是匹配的准确性。」 然而,在该研究中,Scheinker 和 Pokharel 能够通过找到一种结合 PCNN 和 PINN 方法的方法来利用这两种方法。

Scheinker 解释说:「我们使用 PCNN 方法来构建保证满足物理约束的场,这样我们就可以信任它们进行光束动力学模拟,」并补充说,这意味着它们「将保证满足其他物理学,例如能量守恒和 Liouville 定理。」

「但是,我们还添加了一个 PINN 类型的软约束,它将推动我们的 PCNN 的势函数以满足 Lorenz 规范。

「在我看来,这种组合方法是任何人在尝试将物理学构建到他们的神经网络时都可以而且应该使用的方法,」Scheinker 说。

Scheinker 还以这种方式描述了组合方法的几个潜在实际结果。其中包括先进粒子加速器的新应用,这可能有助于减少高空间电荷力和相干同步辐射的影响,这些影响可能导致它们产生的短粒子束的形状和能量发生显着变形。

Scheinker 说:「为了为如此短而强的光束设计加速器和组件,例如束压缩器,你真的必须开始考虑这些集体效应。」

他说:「你无法再通过更简单、更快速的模拟来逃脱,」他指出,即使是当今最强大的超级计算机之一,也可能需要多达数万小时来模拟其中的一个。

「现在想象一下模拟由数百个紧密排列的密集束组成的列车,」Scheinker 说。「这些问题需要昂贵的计算上。」

他说:「拥有一个由 PCNN 辅助的模型,你可以信任它,因为它保证满足物理约束,将改变游戏规则。」

他补充说:「这将使这些事情的速度提高几个数量级,并允许你在办公室使用功能强大的工作站快速研究此类设计。」

论文链接:https://doi.org/10.1063/5.0132433
参考内容:https://thedebrief.org/breakthrough-in-teaching-hard-physics-to-neural-networks-reported-by-los-alamos-physicists/
产业
暂无评论
暂无评论~