Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

大路编辑

机器学习加速宇宙学模拟

图片
在计算机里模拟一个演变了几十亿年的宇宙是非常困难的,有无数的变量需要考虑。以前,科学家们通常使用「超级计算机」通过压缩宇宙学层面的数据来进行粗略的模拟。但运行一台超级计算机是非常昂贵的,仅仅是租用一台,每小时的费用就高达数千美元。因此,对于处理那些「需要试错的问题」,超级计算机并不是一个好的解决方案。
近期,卡耐基梅隆大学的一个研究小组想出了一种新方法,使用「教人工智能绘画或创作音乐的机器学习技术」,在图形处理单元(GPU)上运行高级模拟,可以在不到一天的时间内创建一个复杂的模拟宇宙!
这项技术发表在本周的《美国国家科学院院刊》上,它将机器学习、高性能计算和天体物理学结合在一起,将有助于开创一个「高分辨率宇宙学模拟」的新时代。
图片
宇宙学模拟是揭开宇宙众多谜团的一个重要部分,包括暗物质和暗能量的谜团。至今为止,科学家们还没有一套可以适用于整个宇宙的规则——如何将经典物理学定律与他们在量子领域观察到的情况相协调。
这意味着研究人员必须边做实验边进行定义。而在具体实验中,科学家们必须用不同的数值去试错,例如,预测宇宙中存在多少暗物质。这种情况下,实验就是一个反复试错的过程:他们运行模拟实验,与我们通过太空望远镜和其他数据收集源在当地观察到的情况进行核对,然后不断重复。
模拟是研究宇宙学的重要途径,但在模拟中,提高分辨率又是个难题。
图片低分辨率,高分辨率和超分辨率 (phys.org/news/)
卡内基梅隆大学物理学教授Tiziana Di Matteo和Rupert Croft、Flatiron研究所研究员Yin Li、卡内基梅隆大学博士生Yueying Ni、加州大学河滨分校物理学和天文学教授Simeon Bird和加州大学伯克利分校的Yu Feng通过教授一种基于神经网络的机器学习算法,将模拟从低分辨率升级到超分辨率,克服了这个难关。
「宇宙学模拟需要覆盖大体积的宇宙学研究,同时也需要高分辨率来解决小尺度星系形成的物理问题,这是艰巨的计算任务。我们的技术可以作为一个强大而有前途的工具,通过对大宇宙学体积中的小尺度星系进行物理建模,来同时满足这两个要求。」Ni说,他在此次研究中负责了模型的训练,测试验证任务,和数据可视化
训练后的代码可以采用全尺寸的低分辨率模型,并生成包含多达512倍颗粒的超分辨率模拟。对于宇宙中一个大约5亿光年的区域,包含1.34亿个粒子,以前的方法需要560个小时来使用一个处理核心做出一个高分辨率的模拟。而使用新方法,研究人员只需要36分钟。
当更多的粒子被添加到模拟中时,效果更是出奇的好。对于一个有1340亿个粒子的1000倍大的宇宙,研究人员的新方法在单个图形处理单元上仅需要16个小时。而使用以前的方法,这种规模和分辨率的模拟必须用一台专门的超级计算机来完成。
当然,这并不意味着人工智能「知道」我们无法触及的宇宙是什么样子。其实它只是可以将低分辨率的模拟图像更新为高分辨率,从而使科学家使用少得多的时间、能量和电力来生成这些大型高分辨率图像。
图片模拟的生成(https://www.cmu.edu/mcs/news-events/2021/0504_supersims.html)
从本质上讲,这就像给人工智能一个电影的粗略草图,让它吐出它认为完成的作品会是什么样子,而不需要实际拍摄这部电影。
Di Matteo说道,「减少运行宇宙学模拟的时间,有可能为宇宙学和天体物理学提供重大贡献。宇宙学模拟会跟踪宇宙的历史和命运,一直到所有星系及其黑洞的形成。」
「以前,我们可以模拟宇宙来发现新的物理学,但这只是在低分辨率的规模,」卡内基梅隆大学物理系教授兼系主任、国家科学基金会规划研究所所长Scott Dodelson说:「宇宙是最大的数据集,而人工智能将是理解宇宙和揭示新物理学的关键。」
「很明显,人工智能正在对许多科学领域产生巨大的影响,包括物理学和天文学,」NSF物理学部的项目主任James Shank说,「我们的人工智能规划研究所项目正在努力推动人工智能加速发展,这次的新成果很好地展现了人工智能如何改变宇宙学。」
为了创建他们的新方法,Ni和Li使用神经网络来预测引力如何在一段时间内移动暗物质。这些网络接受数据训练,然后进行计算,并将结果与预期结果进行比较。随着进一步的训练,网络适应并变得更加准确。
图片生成对抗网络示意图 (https://zhuanlan.zhihu.com/p/54096381)
研究人员使用的具体方法,被称为「生成对抗网络」,让两个神经网络相互对抗。一个网络对宇宙进行低分辨率的模拟,并使用它们来生成高分辨率的模型;而另一个网络试图将这些模拟与传统方法制作的模拟区分开来。随着时间的推移,两个神经网络都变得越来越好,直到最终,模拟生成器胜出,并生成出快速模拟的结果。
尽管只是使用小面积的空间进行训练,但神经网络准确地复制了「只有在巨大的模拟中出现的大规模结构」。
不过,这些模拟并没有捕捉到一切。因为他们专注于暗物质和引力,而较小规模的现象(如恒星形成、超新星和黑洞的影响)则被排除在外。研究人员现在正计划继续升级他们的方法,以包括负责此类现象的模拟。
论文连接:https://www.pnas.org/content/118/19/e2022038118
参考内容:
https://thenextweb.com/news/carnegie-mellon-researchers-trained-ai-to-simulate-our-universe-on-a-gpu
https://phys.org/news/2021-05-machine-cosmological-simulations.html
理论宇宙学模拟生成对抗网络机器学习
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据可视化技术

数据可视化被许多学科视为现代视觉传达的等价物。为了清晰有效地传递信息,数据可视化使用统计图形、图表、信息图和其他工具。数字数据可以使用点、线或条编码,以视觉传达定量消息。有效的可视化帮助用户对数据进行分析和推理。它使复杂的数据更容易理解和使用。用户可以根据特定的分析任务进行数据可视化,例如进行比较或理解因果关系,并且图形的设计原则(即,显示比较或显示因果关系)来进行可视化。表通常用于用户查找特定测量的地方,而各种类型的图表用于显示一个或多个变量的数据中的模式或关系。

推荐文章
暂无评论
暂无评论~