编辑 | 绿萝
复杂分子和材料系统的制造和表征,常常受到此类系统的复杂性和可用设计空间的巨大阻碍。分子长尺度的工程系统仍然是一项具有挑战性、成本高且耗时的工作。急需新的设计和优化方法,机器学习方法提供了新的可能,但此类方法的有效性仍存在局限性。
近日,来自芝加哥大学的研究人员为分子和材料工程探索了一种基于机器学习和物理学的组合方法:自由能表面剪裁的集体变量(Collective Variables for Free Energy Surface Tailoring,CV-FEST)。
具体来说,类似于增强采样模拟中使用的那些集体变量,是使用从单个系统收集的数据训练的机器学习模型构建的。通过构建的集体变量,可以识别所考虑系统中的关键分子相互作用,对其进行调制可以系统地剪裁系统的自由能景观。
为了探索所提出方法的有效性,研究人员使用它来设计复杂无序弹性网络中的变构调节和单轴应变波动。它在这两个案例中的成功应用提供了关于如何在以广泛连接为特征的系统中控制功能的见解,并指出了它在复杂分子系统设计中的潜力。
该研究以「Systematic modification of functionality in disordered elastic networks through free energy surface tailoring」为题,于 2023 年 6 月 7 日发布在《Science Advances》上。
CV-FEST
对于复杂分子和材料系统的设计和优化,几个有前途的策略围绕着机器学习的使用,特别是它在与所考虑的设计问题对应的不同系统集相关的大型数据库中的应用。
鉴于通过实验和模拟生成的数据量不断增加,以这种方式将机器学习用于分子和材料设计的情况持续增长。然而,此类方法的有效性存在局限性。其中包括 (i)所需的训练数据量,(ii)鉴于许多基于 AI 的算法的黑盒性质,无法解释某些结果,以及(iii)构建的模型在基础训练领域之外的有限适用性。
虽然克服以上问题是整个机器学习领域内正在进行的研究。但芝加哥大学研究人员最近提出了一种基于机器学习的方法,旨在规避这些问题。该方法被称为 CV-FEST,通过(i)使用单个系统的模拟或实验中生成的大量数据,以及(ii)依靠某些机器学习算法的强大能力来生成复杂高维数据的有洞察力的降维表示。
具体来说,CV-FEST 依赖于这样一种概念,即许多系统的功能通常可以使用一组集体变量(CV)跨越的空间内的自由能面(FES)的降维表示来表征。这样的描述服务于两个相互关联的目标:(i)它提供了对所考虑系统功能的潜在机制的洞察,以及(ii)它允许将关于这样一个系统的最基本信息浓缩为可以在优化算法的帮助下进行调整的少量参数,用于设计目的。
在之前的研究中,研究人员专注于分析和修改由相对较少的自由度组成的系统的功能,例如小肽。
用于复杂度更高系统研究
在此,研究人员关注一个复杂度高得多的系统,关注其底层 FES 是否可以被随意操纵的问题。具体来说,研究考虑由大约 1000 个谐波(harmonic)键组成的弹性网络。鉴于弹性网络与蛋白质的功能相似性以及它们展现超材料特性的能力,近年来弹性网络已成为越来越受关注的主题。此外,弹性网络形成了一个自然框架,用于研究物理领域的网络结构和行为,可能为网络行为提供新的和普遍的观点。
具体而言,研究人员考虑一个由相同弹性模量的谐波键连接的相同珠子组成的二维无序网络。研究关注网络的两个属性。第一种是变构调节,类似于蛋白质中发现的变构调节,其中网络中靶位点(称为活性位点)的构象受到网络中不同的远端位点(称为变构位点)的构象的调节。第二种功能是网络的单轴机械行为。研究发现使用 CV-FEST,能够通过系统地剪裁与它们关联的 FES,以一种简单易处理的方式修改这两个网络特征。
研究人员研究了在有限温度和压力条件下针对变构调节和单轴应变波动系统地定制无序弹性网络的 FES 的能力。研究发现 CV-FEST 能够(i)识别网络中关于这些功能的重要键,以及(ii) 通过改变这些键的刚度,以一种可处理的方式调整系统的 FES 和相应的功能行为。
鉴于网络的复杂互连性质,CV-FEST 提供了作为一般复杂系统设计和分析工具的潜力,包括蛋白质、大分子和材料等系统。
考虑到 CV-FEST 仅依赖于运动学信息作为其输入,探索其直接适用于宏观力学实验系统将很有趣,因为这些信息相对容易获得。在微观系统的情况下,设想在大分子系统(如生物分子)和复杂材料(如聚合物网络)的结合实验模拟研究的背景下,使用 CV-FEST 取得成果。
论文链接:https://www.science.org/doi/10.1126/sciadv.adf7541