Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

效果超AlphaFold系列,量子计算方法用于蛋白质结构预测

图片

编辑 | 白菜叶

虽然 AlphaFold深度学习方法在计算机蛋白质结构预测领域取得了不错的成绩,但该领域的研究仍然是生物医学研究中一个具有挑战性的问题。

随着量子计算的快速发展,人们自然会问:量子计算机是否能为解决这一问题提供一些帮助。然而,确定适合量子优势的特定问题实例,以及评估所需的量子资源同样具有挑战性。

在这里,克利夫兰诊所(Cleveland Clinic)和 IBM Quantum 的研究人员分享了他们的观点,即如何创建一个框架来系统地选择适合量子优势的蛋白质结构预测问题,并在实用级量子计算机上估计此类问题的量子资源。

作为概念验证,研究人员通过在量子硬件上准确预测寨卡病毒 NS3 解旋酶的催化环的结构,来验证他们的问题选择框架。

该研究以「A Perspective on Protein Structure Prediction Using Quantum Computers」为题,于 2024 年 5 月 30 日发布在《Journal of Chemical Theory and Computation》。

图片

几十年来,研究人员一直利用计算方法来预测蛋白质结构。蛋白质折叠成一种结构,决定了它如何发挥作用以及如何与体内其他分子结合。这些结构对人类健康和疾病有深远影响。

通过准确预测蛋白质的结构,研究人员可以更好地了解疾病如何传播,从而开发有效的治疗方法。克利夫兰诊所博士后研究员 Bryan Raubenolt 博士和 IBM 研究员 Hakan Doga 博士带领团队探索量子计算如何改进当前方法。

近年来,机器学习技术在蛋白质结构预测方面取得了重大进展。这些方法依赖于训练数据(通过实验确定的蛋白质结构的数据库)进行预测。这意味着它们受到已识别的蛋白质数量的限制。当程序/算法遇到突变的蛋白质或与训练时差异很大的蛋白质时,准确率会降低,这种情况在遗传疾病中很常见。

另一种方法是模拟蛋白质折叠的物理原理。模拟可以让研究人员观察给定蛋白质的各种可能形状,并找到最稳定的形状。最稳定的形状对于药物设计至关重要。

图片

图示:蛋白质结构预测管线概述。(来源:论文)

挑战在于,如果蛋白质尺寸超过一定值,这些模拟在传统计算机上几乎不可能实现。从某种意义上说,增加目标蛋白质的尺寸就好比增加魔方的尺寸。Raubenolt 博士说,对于含有 100 个氨基酸的小蛋白质,传统计算机需要相当于宇宙年龄的时间来详尽地搜索所有可能的结果。

为了克服这些限制,研究团队采用了量子和经典计算方法的混合方法。该框架可以让量子算法解决最先进的经典计算所面临的挑战,包括蛋白质大小、内在无序性、突变和蛋白质折叠所涉及的物理学。

图片

图示:量子-经典混合框架工作流程示意图。(来源:论文)

与最先进的经典方法相比,该框架通过在量子计算机上准确预测寨卡病毒蛋白小片段的折叠得到了验证。

图片

图示:使用寨卡病毒相关蛋白进行验证。(来源:论文)

量子-经典混合框架的初步结果优于基于经典物理的方法和 AlphaFold2。尽管后者的设计最适合处理较大的蛋白质,但它仍然证明了该框架能够在不直接依赖大量训练数据的情况下创建精确模型的能力。

研究人员首先利用量子算法来模拟片段主链的最低能量构象,这通常是计算过程中计算量最大的步骤。然后使用经典方法转换从量子计算机获得的结果,重建蛋白质及其侧链,并使用经典分子力学力场对结构进行最终细化。

图片

图示:估算所需的量子资源。(来源:论文)

该项目展示了将问题分解成各个部分的方法之一,利用量子计算方法解决其中的一些部分,利用经典计算解决其他部分,以提高准确性。

「该项目最独特的一点是涉及的学科数量。」Raubenolt 博士说,「我们团队的专业知识范围广泛,从计算生物学和化学、结构生物学、软件和自动化工程到实验原子和核物理学、数学,当然还有量子计算和算法设计。它利用各个领域的知识来创建计算框架,可以模拟人类生命中最重要的过程之一。」

该团队将经典计算方法与量子计算方法相结合,对于增进科学家对蛋白质结构的理解以及它们如何影响我们治疗和预防疾病的能力是至关重要的一步。该团队计划继续开发和优化可以预测更大、更复杂蛋白质结构的量子算法。

Doga 博士表示:「这项研究是探索量子计算能力在蛋白质结构预测中的优势的重要一步。我们的目标是设计出能够尽可能真实地预测蛋白质结构的量子算法。」

论文链接:https://pubs.acs.org/doi/10.1021/acs.jctc.4c00067

相关报道:https://phys.org/news/2024-05-quantum-methods-protein.html

产业深度学习AlphaFold
相关数据
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

量子计算技术

量子计算结合了过去半个世纪以来两个最大的技术变革:信息技术和量子力学。如果我们使用量子力学的规则替换二进制逻辑来计算,某些难以攻克的计算任务将得到解决。追求通用量子计算机的一个重要目标是确定当前经典计算机无法承载的最小复杂度的计算任务。该交叉点被称为「量子霸权」边界,是在通向更强大和有用的计算技术的关键一步。

推荐文章
暂无评论
暂无评论~