2021首期Nature封面:牛津大学ML算法实现10万高压非晶硅原子的模拟

自生物领域之后,材料领域也被人工智能攻陷了。

依靠算法推断能力和强大的算力,很多人都认为 AI 在材料设计、材料筛选和材料性能预测等领域拥有很大潜力。

为了对一般无序结构材料有更深的理解,人们广泛研究了非晶硅在高压条件下的富相行为。然而在和原子打交道的层面上,人们一直需要借助量子力学来理解材料的结构和键合,这仅限于尺度很小的模型系统,如果用机器学习算法从量子力学数据中「学习」会是怎么样?

在 2021 年的第一期《自然》杂志封面研究中,来自牛津大学的 Volker Deringer 等人展示了模拟加压非晶硅的原子机器学习模型,成功解决了这一挑战,并捕获了实验中遇到的所有结构变化。这种计算方法可以为实验条件极富挑战性的材料预测建模开启全新的方式。

这是 2020 年 12 月 DeepMind 人工智能解决生物学 50 年来重大挑战之后,人工智能在又一个新的领域展现强大能力。现在,人类已经能够实现 10 纳米尺度,十万个硅原子系统的模拟——使用常规方法的话,即使是超级计算机也需要耗费大量时间。

该研究的团队,除了牛津大学副教授、计算化学家 Volker Deringer 之外,还有来自美国、瑞士等国,剑桥大学、美国海军研究实验室、洛桑联邦理工学院、俄亥俄大学等研究机构的学者。

「这项工作是机器学习和计算化学在原子层面上提供对材料新见解的一个范例——- 描述结构复杂的相(非晶形、纳米晶等)及其转化。我很期待未来将会发生什么!」在论文发表后,Volker Deringer 说道。

牛津大学理论与计算无机化学副教授 Volker Deringer。

非晶硅结构转变的历史回顾

非晶硅又称无定形硅,是单质硅的一种形态,其不具有完整的金刚石晶胞,熔点、密度和硬度也明显低于晶体硅。这种介于固体和液体之间、无固定形式的过渡物质很难研究,而现在机器学习提供了对压力诱导的非晶硅变化的全新见解。

研究人员正在开发机器学习方法以精确模拟无序固体和液体的结构和化学键,建模充足数量的原子以便与实验数据进行直接比较。在这篇《Nature》封面论文中,Deringer 等人使用这种方法探索压缩下非晶硅的结构,此时这种元素从半导体态转变为金属态。研究表明,非晶态材料的结构转变比结晶相之间的转变要缓慢得多,且涉及纳米结构域的形成以及任何结晶态中都未发现的局部原子排列。

论文地址:https://www.nature.com/articles/s41586-020-03072-z

硅属于融化时密度上升的元素,这一不寻常现象还发生在冰上(冰的密度低于水,因而可以浮在水上)。这种出人意料的固液态密度反转与一种叫做多非晶型转变(polyamorphism),即物质以不同非晶相存在时,其结构和属性有显著区别。

液态硅在环境中是金属导体,而固态硅是半导体,这一事实支撑了它们在计算机芯片、太阳能电池板等技术领域中的应用。在室温条件下,固态硅可以呈现结晶或无序结构的非结晶形式。在这两种形式下,每个原子都以四面体排列键合到其他四个原子上。但在压缩条件下,结晶和非结晶固态硅转变为了更致密的结构,这一过程还伴随着向金属导电性能的转变。

20 世纪 70 年代,研究人员进行了量热实验,以研究加热和冷却过程中伴随非结晶和结晶硅形式转变的能量变化。结果表明,存在两种非结晶形式的硅,并且二者之间存在相变。之后的模拟实验表明,硅从低密度非结晶(LDA)相(其配位数,即每个硅原子周围的原子数为 4)转变为高密度非结晶(HDA)相,后者的结构类似于金属液态硅。在非结晶固态硅的快速加热过程以及环境温度下非结晶硅的压缩过程中都发现了这种 LDA-HDA 相变。

硅结晶相之间的结构转变可以通过衍射方法轻松地观察到,但非结晶态之间的结构转变却更难展开研究,这是因为随着密度的增加结构转变的次数越来越少。这时计算机模拟开始发挥作用:它们能够可视化不同相原子的排列,并对产生的特性进行预测和解释。这里的主要挑战是建模充足的原子以对模拟结果和真实样本的宏观数据进行比较,同时保持足够的精度以对原子的排列和键合进行描述。

在研究相变的过程中,计算机模拟还受自身时间尺度的限制。当前可用的计算资源常常将基于准确量子力学计算的模拟限制在包含数十至数百个原子的系统上,且时间尺度通常为飞秒(1 飞秒等于 10^-15 秒)。使用较少计算需求量建模策略的模拟则可以扩展至数百或数千个原子。但随着系统规模的增大或者模拟时长的增加,对研究材料结构和物理属性的预测准确率会有所下降。

机器学习算法模拟高压非晶硅原子

而 Deringer 等人最近提出的方法通过机器学习,对包含 10 万个硅原子的系统从冷却的液态到 20 万大气压(20GPa)压缩过程提供了前所未有的结构和键能信息。这表明,人们可以建模的原子数大大增加了,同时该方法的精度接近于使用量子力学计算从第一性原理进行的最佳模拟精度。

最重要的是,这一建模系统足够强大,可以揭示出原子无定形簇的亚稳态聚集。该模拟还发现了新的结晶现象,而此前使用较少原子数或精度较差模型来描述原子交互的那些模拟并未观察到这一现象。这些发现高拟真度地再现了实验中观察到的温度和压力,这些温度和压力涉及从宏观上观察到的硅熔化、其他相变以及金属行为的开始。

模拟表明,压缩时发生的结构变化要比人们以前意识到得更加复杂(如下图)。和硅在结晶相之间的转变一样,此时处于配位数为 4 的排列中的原子不会同时转变为配位数更高的相。取而代之的是,非晶结构逐渐演化以产生具有高配位数的高密度纳米尺度畴(nanoscale domain),它在原始的四面体 LDA 结构内发展得到。随着密度增加,HDA 域之间会形成连接,从而产生一种具有整体金属导电性的材料。通过在压缩硅上施加方向性应力,我们可以在现实世界中修改这种单质的金属导电性。

Deringer 等人研究中对于非晶硅的大规模模拟。

该研究的模拟还表明,随着系统进一步被压缩,它的体积可以快速坍塌约 25%,从而带来非常高密度的金属态。这在模拟的纳秒级即可快速实现结晶化,形成硅金属相的纳米畴。

液态硅的压缩过程。

这一结果可以帮助我们理解多非晶型形转变如何更普遍地出现在不同液相和玻璃态结构之间。Deringer 及其同事的机器学习方法可以在皮秒级时间内准确模拟非晶硅(1 皮秒等于 10^−12 秒),其温度和压力范围和液相与晶相、液态与玻璃态、两个非晶相之间的转变有关。因而这项研究发现为学习此前难以探索的大量非晶材料的转变提供了契机。

过冷液态硅的玻璃化。

该研究提出的方法还可用于探索非晶硅转换的可能性,或硅中包含少量其他元素的「混杂」材料,以生成包含金属和半导体的纳米结构。这类纳米结构可能为开发新技术,如电子通信、数据处理和能量收集,创造新的机会。

参考内容:

https://www.nature.com/articles/d41586-020-03574-w

理论
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

量子力学技术

量子力学(Quantum Mechanics),为物理学理论,是研究物质世界微观粒子运动规律的物理学分支,主要研究原子、分子、凝聚态物质,以及原子核和基本粒子的结构、性质的基础理论。

推荐文章
暂无评论
暂无评论~