Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

使用 AI 和超级计算机模拟由 4400 万个原子组成的蛋白结构


编辑 | 萝卜皮

在人工智能的帮助下,世界顶级超级计算机已经运行了由数千万个原子组成的物体的最精确模拟。

由于所需的计算能力,现有的详细描述原子行为、相互作用和演化的模拟仅限于小分子。有些技术可以随时间的增加模拟更多数量的原子,但这些技术依赖于近似值,并且不够准确,无法提取所讨论分子的许多详细特征。

现在,哈佛大学的 Boris Kozinsky 团队开发了一种名为 Allegro 的工具,它可以使用人工智能准确地模拟具有数千万个原子的系统。

该研究以「Scaling the leading accuracy of deep equivariant models to biomolecular simulations of realistic size」为题,于 2023 年 4 月 20 日发布在 arXiv 预印平台。

图片

了解包含数千万和数亿个原子的复杂系统的时间演化对于各种异质和无序材料系统非常重要,在生物学领域尤其必要,因为即使是最简单的生命形式及其构建模块也具有这些尺寸大小 。同时,准确模拟化学和生物过程的动力学需要非常高的精度。

Kozinsky 团队使用世界上第 8 大强大的超级计算机 Perlmutter 来模拟 HIV 蛋白质壳中涉及的 4400 万个原子。他们还模拟了其他常见的生物分子,例如纤维素、血友病患者体内缺失的一种蛋白质和广泛传播的烟草植物病毒。

图片

图示:用于基准测试的生物分子系统。(来源:论文)

「任何基本上由原子构成的东西,你都可以用这些方法以极高的精度进行模拟,现在还可以大规模模拟。」Kozinsky 说,「这是一个演示,但绝不局限于这个领域。」 他说,该系统还可以用于材料科学中的许多问题,例如研究电池、催化和半导体。

为了能够模拟如此大量的粒子,研究人员使用了一种称为神经网络的 AI 来计算从各个角度对称的原子之间的相互作用,这一原理称为等变性。等变模型现在被广泛认为其独特的领先能力能够准确捕获量子多体相互作用,超越了所有早期的经验和机器学习潜力。

图片

图示:Allegro 网络架构。(来源:论文)

「当你开发从根本上包含这些对称性的网络时......你会在准确性和我们关心的其他属性方面获得这些重大改进,例如模拟的稳定性,或者机器学习模型在你用更多数据教授它时学习的速度。」同样在哈佛的团队成员 Albert Musaelian 说。

这项研究有效地将当前原子间相互作用模型可实现的最高精度与领先 GPU 计算提供的极端可扩展性结合起来。因此,它建立了分子动力学的新技术水平,并为模拟以前无法访问的系统打开了大门。

该团队首次实现了复杂生物系统的大规模分子动力学模拟,完全利用量子精度的机器学习原子间势,这代表了生物分子模拟的新阶段。选择特定的生物系统是为了证明在规模和复杂性方面可实现的准确性。然而,Allegro 架构可用于模拟任何原子结构的动力学,例如多晶和多相复合材料、玻璃中的扩散、聚合和催化反应等。研究界对等变原子间势模型的快速采用也已经证明了该方法的广泛影响。

PyTorch 和 Kokkos 性能可移植库的结合使用允许在各种硬件计算架构上部署该团队的等变模型架构,包括 CPU 以及为领先级资源提供支持的 NVIDIA、AMD 和 Intel GPU。

在不久的将来,将有可能在更新的计算资源上部署 Allegro,其规模甚至比本工作中所示的规模还要大。通过在 LAMMPS 中实施该模型,研究人员可以访问其广泛的 MD 生态系统以及增强采样模拟方法和分析工具。这些集成以及训练模型以利用它们所需的 Allegro 框架都是开源的,并且是为社区使用而设计的。

该工作证明了高容量等变 Allegro 模型在准确学习整个 SPICE 数据集(包含超过 100 万个类药分子和肽结构)的力量方面的优势。这种数据规模意味着比以前更准确地学习整套无机材料和有机分子的前景,这将为前所未有的广泛材料系统的快速百亿亿次模拟开辟前景。

最近,该团队证明可以有效地量化力和能量的深度等变模型预测的不确定性,并使用它来执行主动学习以自动构建训练集。Allegro 中高斯混合模型的自然适应将开启使用单个模型(而不是集成模型)进行大规模不确定性感知模拟的可能性。

剑桥大学的 Gábor Csányi 说:「这是编程方面的杰作,并证明了这些机器学习的潜力现在是可扩展的。」

然而,他说,模拟这些生物分子更多的是证明该工具适用于大型系统,而不是对研究人员的实际推动,因为生物化学家已经拥有足够准确的工具,可以运行得更快。Csányi 说,它可能有用的地方是具有大量原子的材料,这些材料会在很短的时间内经历冲击和极端力,例如行星核心。

相关报道:https://www.newscientist.com/article/2373022-watch-44-million-atoms-simulated-using-ai-and-a-supercomputer/

论文链接:https://arxiv.org/abs/2304.10061

产业
暂无评论
暂无评论~