Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

DeepMind蛋白质设计新工具AlphaProteo,从头设计高亲和力蛋白结合剂,成功率最高88%

图片

编辑 | ScienceAI

像 AlphaFold 这样的蛋白质结构预测工具,已经帮助我们深入了解了蛋白质如何相互作用从而发挥其功能,但这些工具无法创建新的蛋白质来直接控制这些相互作用。

现在,Google DeepMind 团队推出了一种用于设计「与目标分子结合更紧密」的新型蛋白质的 AI 系统 AlphaProteo。

在测试的 7 种靶蛋白上,AlphaProteo 的实验成功率更高,在湿实验室中测试中,9% 到 88% 候选分子成功结合,这比其他方法高出 5 到 100 倍。而且,比现有最佳方法的结合亲和力高出 3 到 300 倍。

仅需一轮中等通量筛选且无需进一步优化,AlphaProteo 便可生成适用于多种应用的「即用型」结合剂。它可以帮助科学家更好地了解生物系统如何运作,节省研究时间,推进药物设计等等。

该团队于 2024 年 9 月 5 日上线了最新论文《De novo design of high-affinity protein binders with AlphaProteo》。

图片

论文链接:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf

从细胞生长到免疫反应,身体中的每个生物过程都依赖于称为蛋白质的分子之间的相互作用。好比钥匙开锁一样,一种蛋白质可以与另一种蛋白质结合,帮助调节关键的细胞过程。

蛋白质-蛋白质相互作用是蛋白质功能的一个基本方面,蛋白质结合蛋白是治疗、诊断和生物医学研究的基本组成部分。

传统上,抗体、纳米抗体和其他支架(如 DARPins)通过免疫或定向进化开发成针对各种靶标的结合物。不过,实验选择无法控制目标表位,而且对于常规研究应用来说往往过于费力。

不使用天然蛋白质作为起点,从头计算设计结合物可以靶向预先指定的表位,并生成比抗体更小、更热稳定且更易于表达的结合物。

AlphaProteo 蛋白质设计系统

近期,基于深度学习的模型在生物分子结构预测和蛋白质设计方面取得了重大进展。这推动了关键科学和社会挑战的进展,包括蛋白质-蛋白质相互作用的预测和设计。

现在无需高通量筛选即可获得针对某些靶标的计算设计结合物。在某些情况下,无需进行实验优化即可实现高结合亲和力,例如对于小肽或无序靶标。

然而,针对凸表位或极性表位的成功率仍然很低,初始设计的亲和力通常很差,许多靶标仍然难以处理。

在最新的论文中,DeepMind 团队介绍了 AlphaProteo 蛋白质设计系统,并表明它可以设计从头蛋白质结合蛋白,该系统具有以下优势:

1、高成功率:通过筛选数十种设计候选物可以获得稳定、高表达和特异性的结合物,从而无需使用高通量方法。

2、高亲和力:对于除一个目标之外的每个测试目标,最佳结合剂具有亚纳摩尔或低纳摩尔结合亲和力(KD),从而最大限度地减少了下游亲和力优化所需的劳动力。

3、整体优势:使用单一设计方法,无需复杂的人工干预,即可成功获得针对一系列具有不同结构和生化特性的靶标的结合剂。

图片

图示:AlphaProteo 概述。(来源:论文)

了解蛋白质相互结合的复杂方式

能够与靶蛋白紧密结合的蛋白质结合剂很难设计。传统方法耗时巨大,需要多轮大量的实验室工作。在创建结合剂后,它们还需要进行大量额外的实验从而优化结合亲和性。

AlphaProteo 经过蛋白质数据库 (PDB) 中的大量蛋白质数据和 AlphaFold 中的 1 亿多条预测结构的训练,已经了解了分子相互结合的无数方式。给定目标分子的结构和该分子上的一组首选结合位置,AlphaProteo 会生成一个候选蛋白质,该蛋白质在这些位置与目标结合。

视频链接:https://mp.weixin.qq.com/s/tfoqGsXiqOVXFJgNVQLczg

视频1:预测的蛋白质结合物结构与靶蛋白相互作用的图示。蓝色部分是 AlphaProteo 生成的预测蛋白质结合物结构,旨在与靶蛋白结合。黄色部分是靶蛋白,具体来说是 SARS-CoV-2 刺突受体结合域。(来源:DeepMind 官网)

在重要的蛋白质结合靶点上取得成功

为了测试 AlphaProteo,研究人员设计了针对各种靶蛋白的结合剂,包括两种与感染有关的病毒蛋白 BHRF1 和 SARS-CoV-2 刺突蛋白受体结合域 SC2RBD,以及五种与癌症、炎症和自身免疫性疾病有关的蛋白 IL-7Rɑ、PD-L1、TrkA、IL-17A 和 VEGF-A。

AlphaProteo 系统具有极具竞争力的结合成功率和一流的结合强度。对于七个靶点,AlphaProteo 在计算机模拟中生成候选蛋白,这些蛋白在实验测试时与目标蛋白紧密结合。

图片

图示:AlphaProteo 为其生成成功结合剂的七种靶蛋白的预测结构图。蓝色表示在湿实验室中测试的结合剂示例,黄色是蛋白质靶点,深黄色突出显示的是预期的结合区域。(来源:论文)

对于一个特定靶标,即病毒蛋白 BHRF1,在 Google DeepMind Wet Lab 中进行测试时,88% 候选分子成功结合。根据测试的靶标,AlphaProteo 结合剂的结合力平均比现有最佳设计方法强 10 倍。

对于另一个靶标 TrkA,新结合剂甚至比经过多轮实验优化的针对该靶标的最佳先前设计结合剂更强。

图片

图示:与其他设计方法相比,AlphaProteo 针对七种目标蛋白的实验体外成功率。成功率越高,意味着需要测试的设计越少,才能找到成功的结合体。(来源:论文)

图片

图示:与其他设计方法相比,AlphaProteo 的设计在未进行实验优化的情况下对七种目标蛋白的最佳亲和力。亲和力越低,意味着结合蛋白与目标蛋白的结合越紧密。(来源:论文)

对多种蛋白质的验证结果

研究人员除了在其湿实验室中进行计算机验证和测试 AlphaProteo 之外,还聘请了 Francis Crick 研究所的 Peter Cherepanov、Katie Bentley 和 David LV Bauer 研究小组来验证其蛋白质结合剂。

在不同的实验中,他们深入研究了一些更强的 SC2RBD 和 VEGF-A 结合剂。

研究小组证实,这些结合剂的结合相互作用确实与 AlphaProteo 所预测的相似。此外,研究小组还证实了这些结合剂具有有用的生物学功能。例如,一些 SC2RBD 结合剂被证明可以防止 SARS-CoV-2 及其某些变体感染细胞。

AlphaProteo 的性能表明,它可以大大减少涉及广泛应用的蛋白质结合剂的初始实验所需的时间。

然而,该人工智能系统有局限性,因为它无法针对第 8 个靶点 TNFɑ(一种与类风湿性关节炎等自身免疫性疾病相关的蛋白质)设计成功的结合物。研究人员选择 TNFɑ 来挑战 AlphaProteo,因为计算分析表明设计结合物非常困难。

接下来,该团队将继续改进和扩展 AlphaProteo 的功能,最终目标是解决这些具有挑战性的靶点。实现强结合通常只是设计可能对实际应用有用的蛋白质的第一步,在研发过程中还有更多的生物工程障碍需要克服。

开发更全面的蛋白质设计产品

蛋白质设计是一项快速发展的技术,在各个领域都具有巨大的科学进步潜力,从了解导致疾病的因素,到加速病毒爆发的诊断测试开发,支持更可持续的制造过程,甚至清除环境中的污染物。

未来,DeepMind 将与科学界合作,利用 AlphaProteo 解决有影响力的生物学问题并了解其局限性。他们还一直在 Isomorphic Labs 探索其药物设计应用,并对未来的发展感到兴奋。

该团队将不断提高 AlphaProteo 算法的成功率和亲和力,扩大它可以解决的设计问题范围,并与机器学习、结构生物学、生物化学和其他学科的研究人员合作,为社区开发负责任、更全面的蛋白质设计产品。

相信 AlphaProteo 将为许多生物应用开辟新的解决方案,例如控制细胞信号传导,成像蛋白质、细胞和组织,赋予各种效应系统目标特异性等等。

相关内容:

https://x.com/GoogleDeepMind/status/1831710991475777823

https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/?utm_source=x&utm_medium=&utm_campaign=gdm&utm_content=

理论人工智能抗体生物计算蛋白质AI for Science
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

推荐文章
暂无评论
暂无评论~