Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI 回答物理学问题,MIT 开发自动绘制材料相图机器学习框架

图片

编辑 | X

当水结冰时,它会从液相转变为固相,密度和体积等特性会发生巨大变化。水中的相变很常见,但新型材料或复杂物理系统中的相变是一个重要的研究领域。

绘制相图通常需要大量的人类直觉和理解。如何量化未知系统中的相变通常是不清楚的,尤其是在数据稀缺的情况下。

麻省理工学院和瑞士巴塞尔大学的研究人员,将生成式人工智能模型应用于这个问题,开发了一种新的机器学习框架,可以自动绘制新的物理系统的相图,几乎不需要人类监督。

研究人员基于物理的机器学习方法,比依赖理论专业知识的费力的手动技术更有效。而且不需要大量的标记训练数据集。

例如,这样的框架可以帮助科学家研究新型材料的热力学性质,或检测量子系统中的纠缠。最终,这项技术可以使科学家自主发现物质的未知相成为可能。

计算机科学与人工智能实验室 (CSAIL) Julia 实验室的博士后、论文合著者 Frank Schäfer 表示:「这可能是自动科学发现新的、奇特的相特性的工具。」

该研究以「Mapping Out Phase Diagrams with Generative Classifiers」为题,于 5 月 16 日发表在《Physical Review Letters》上。

图片

论文链接:https://doi.org/10.1103/PhysRevLett.132.207301

物理学中的相变

虽然水转变为冰可能是相变最明显的例子之一,但更奇特的相变,例如材料从普通导体转变为超导体,引起了科学家的浓厚兴趣。

这些转变可以通过识别「序参数」(order parameter)来检测,「序参数」是一个重要、预计会发生变化的数量。例如,当温度低于 0°C 时,水会结冰并转变为固相(冰)。

图片

图示:标签 y ∈{1,2} 的二元分类问题的 (a) 判别方法和 (b) 生成方法中建模的概率分布示意图。(来源:论文)

过去,研究人员依靠物理专业知识手动构建相图,利用理论理解来了解哪些序参数很重要。这不仅对于复杂的系统来说是乏味的,对于具有新行为的未知系统来说也许是不可能的,而且还会将人类的偏见引入解决方案中。

AI 检测相变

最近,研究人员开始使用机器学习来构建判别性分类器,通过学习将测量统计数据分类为来自物理系统的特定阶段来解决这个任务,就像这些模型将图像分类为猫或狗一样。

麻省理工学院的研究人员展示了如何使用多体物理领域原生的生成模型来构建分类器,与判别分类器相比,该分类器可以更有效地解决相分类任务。

在数值研究中,人们通常可以直接使用生成模型来描述系统。生成方法可以使用此信息来创建分类器,绕过判别方法中的显式数据驱动构造。

其结果是一个强大而通用的框架,用于在具有多相的任意维参数空间中自动表征经典和量子相图。

知识更丰富的模型

生成模型通常通过估计某些数据的概率分布来工作,并使用这些数据生成适合分布的新数据点。然而,当使用经过验证的科学技术对物理系统进行模拟时,研究人员可以自由获得其概率分布模型。该分布描述了物理系统的测量统计数据。

麻省理工学院团队的见解是,这种概率分布还定义了一个可以构建分类器的生成模型。他们将生成模型插入标准统计公式中,以直接构建分类器,而不是像判别方法那样从样本中学习。

「这是一种非常好的方法,可以将您对物理系统的了解深入融入到机器学习方案中。它远远超出了对数据样本或简单的归纳偏差进行特征工程的范围。」Schäfer 说。

该生成分类器可以确定系统在给定某些参数(例如温度或压力)下处于哪个相。由于研究人员直接近似物理系统测量结果的概率分布,因此分类器具有系统知识。

图片

图示:方形晶格上各向异性 Ising 模型的结果。(来源:论文)

这使得他们的方法比其他机器学习技术表现得更好。而且由于它可以自动工作,无需进行大量训练,因此他们的方法显著提高了识别相变的计算效率。

最终,类似于人们要求 ChatGPT 解决数学问题的方式,研究人员可以向生成分类器询问诸如「这个样本属于 phase I 还是 phase II?」之类的问题。或「这个样本是在高温还是低温下生成的?」

科学家还可以使用这种方法来解决物理系统中不同的二元分类任务,可以检测量子系统中的纠缠(状态是否纠缠?)或确定理论 A 或 B 是否最适合解决特定问题。他们还可以使用这种方法,通过确定如何调整某些参数以便聊天机器人提供最佳输出,来更好地理解和改进 ChatGPT 等大型语言模型

未来,研究人员还希望研究理论保证,了解他们需要多少次测量才能有效检测相变,并估计所需的计算量。

参考内容:https://phys.org/news/2024-05-scientists-generative-ai-complex-physics.html#google_vignette

理论物理生成式AI人工智能
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

Julia技术

Julia 是MIT设计的一个面向科学计算的高性能动态高级程序设计语言,项目大约于2009年中开始,2018年8月JuliaCon2018 发布会上发布Julia 1.0。据介绍,Julia 目前下载量已经达到了 200 万次,且 Julia 社区开发了超过 1900 多个扩展包。这些扩展包包含各种各样的数学库、数学运算工具和用于通用计算的库。除此之外,Julia 语言还可以轻松使用 Python、R、C/C++ 和 Java 中的库,这极大地扩展了 Julia 语言的使用范围。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

概率分布技术

概率分布(probability distribution)或简称分布,是概率论的一个概念。广义地,它指称随机变量的概率性质--当我们说概率空间中的两个随机变量具有同样的分布(或同分布)时,我们是无法用概率来区别它们的。

特征工程技术

特征工程是利用数据所在领域的相关知识来构建特征,使得机器学习算法发挥其最佳的过程。它是机器学习中的一个基本应用,实现难度大且代价高。采用自动特征工程方法可以省去采用人工特征工程的需求。Andrew Ng 说“挖掘特征是困难、费时且需要专业知识的事,应用机器学习其实基本上是在做特征工程。”

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~