Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AlphaFold 预测细菌生存所需的 1402 种蛋白互作,最完整的细菌必需相互作用图谱

革兰氏阴性必需相互作用组。(来源:eLife)

编辑 | 紫罗

细菌蛋白质组平均由约 4000-5000 个蛋白质组成,这意味着相互作用组可能多达 2000 万个相互作用。

据估计,大肠杆菌中大约有 12,000 种物理相互作用。然而,并非所有这些相互作用都对细菌的生存至关重要。

对生物体中蛋白质相互作用的研究,是理解生物过程和中心代谢途径的基础。然而,我们对细菌相互作用组的了解仍然有限。

近日,西班牙巴塞罗那自治大学(Universitat Autònoma de Barcelona,UAB)的研究人员使用人工智能工具 AlphaFold,预测并模拟了细菌中必需(essential)蛋白质之间的 1402 种相互作用。

研究人员绘制了最完整的细菌必需相互作用图谱,即蛋白质如何结合和相互作用以执行其生存所必需的功能。

这些结果揭示了这些机制以前未知的细节,并为开发新的抗生素提供了潜在的靶点。

该研究以《Structural assembly of the bacterial essential interactome》为题,于 2024 年 1 月 16 日发表在《eLife》杂志上。

图片

论文链接:https://elifesciences.org/articles/94919

并非所有相互作用都对细菌生存至关重要

细菌执行许多对其生存至关重要的功能,包括能量产生、DNA 复制、转录、翻译、细胞分裂和细胞壁合成等。所有这些过程都涉及到需要一组重要蛋白质协同作用的复合物:没有它们,这些过程就不会发生,细菌就会死亡。

因此,详细了解这些必需过程是如何调节的、涉及哪些蛋白质以及它们如何相互作用,对于了解细菌生长、繁殖和生存的机制至关重要。

迄今为止所采用的实验技术已经能够识别蛋白质之间的数百万种相互作用以及这些蛋白质的数千种结构,但这些都是原始数据,会产生大量误报;事实上,这些互作是没有价值的。

利用最近开发的人工智能模型,例如 AlphaFold2,已经可以以与实验方法相似的精度获得蛋白质结构,并区分真正的蛋白质-蛋白质相互作用和错误相互作用(假阳性)。

开发必需相互作用组(interactome)的完整图谱,是研究蛋白质功能组织和确定发现新抗生素的新靶点的有力策略。

AlphaFold 预测对细菌生存至关重要的 1402 种相互作用

巴塞罗那自治大学的生物化学和分子生物学系的研究人员使用 AlphaFold2 人工智能模型来预测对细菌生存至关重要的一组蛋白质-蛋白质相互作用,总共有 1402 种可能的相互作用,构成了所谓细菌必需相互作用组的最完整图谱。

「我们获得了细菌必需相互作用组的图谱,其中收集了细菌生存和繁殖所必需的所有相互作用。我们使用新的人工智能工具,特别是 AlphaFold,从结构上表征了这些相互作用,」UAB 讲师 Marc Torrent 解释道。「我们相信这些结构可以为新抗生素的开发提供参考,因为能够抑制这些相互作用的分子会像抗生素一样具有不寻常的作用机制。」

并非所有相互作用都对细菌的生存至关重要。为了区分必要的相互作用,研究人员只考虑了那些相互作用形成复合物的两种蛋白质存在于至少两种不同细菌物种中的蛋白质。

图片

图示:对 AF2 预测的必需二元复合物进行分析。(来源:论文)

研究人员使用革兰氏阴性和阳性蛋白质列表,研究了必需蛋白质相互作用网络。通过 AF2-Multimer 建模, 并使用 ipTM 分数对模型进行分类,发现从数据库中检索到的许多必需 PPI 可能是假阳性。ipTM 与 pDockQ2 相关性较强。验证表明模型与实验数据一致。pDockQ2 是一个非常准确但具有限制性的指标。因此,选择 ipTM 来评估预测的相互作用。

AlphaFold2 卓越的预测能力

为了测试 AlphaFold2 的可靠性,研究小组将其预测与事先通过实验获得的 140 个蛋白质-蛋白质相互作用进行了比较。AF2 准确预测了这些结构中的 81%(140 个中的 113 个)。

在生成的所有模型中,83%(140 个中的 116 个)在正确折叠方面几乎与原始结构相同。最有趣的是,72%(140 个中的 101 个)的预测结构在相互作用界面处的均方根偏差方面相似,并且 56%(140 个中的 79 个)的界面与真实结构几乎相同,凸显了 AF2 出色的预测能力。

研究人员认为,在实验数据库中发现的许多蛋白质-蛋白质相互作用复合物可能是假阳性

图片

图示:革兰氏阴性菌和革兰氏阳性菌的必需相互作用组。(来源:论文)

总之,研究人员为革兰氏阴性菌和革兰氏阳性菌组装了一个高精度的必需相互作用组,这将使我们能够识别蛋白质中心并研究这些相互作用的重要性。

新的、以前未知的必需蛋白质复合物

研究人员强调,使用这种方法发现了一组以前未知的蛋白质-蛋白质相互作用,这些相互作用在九个必需过程中发挥作用:细胞膜中的脂肪酸生物合成、外膜中的脂多糖合成、脂质转运、外膜中的蛋白质和脂蛋白转运、细胞分裂、杆菌中延长形状的维持、细菌繁殖的 DNA 复制和泛素合成。

对这些新发现的蛋白质复合物结构的详细了解为了解这些重要细菌过程中涉及的分子机制提供了新的见解,并为新抗生素的开发铺平了道路。

研究人员希望,随着使用更大数据集的深度学习模型的不断训练,将在不久的将来生成更准确、更自信的蛋白质复杂模型。

参考内容:https://phys.org/news/2024-02-ai-interactions-key-bacterial-survival.html

理论
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

假阳性技术

假阳性是指模型因为种种原因把不应该分类成特定情况的人/物错误地分类到了该分类的情况。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

暂无评论
暂无评论~