Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

华盛顿大学贝克团队,仅通过靶标结构从头设计蛋白质结合蛋白,助力生物制药及医疗诊断

编辑 | 萝卜皮

除了目标的三维结构之外,不使用其他信息设计与目标蛋白质表面上特定位点结合的蛋白质仍然是一个挑战。该问题的解决有助于攻克许多以蛋白受体为入侵途径的病毒所带来的疾病,比如新冠。

在这里,华盛顿大学贝克团队的研究人员描述了这个问题的一般解决方案,首先对蛋白质表面选定结构域的可能结合模式的广阔空间进行广泛探索,然后在最有希望的结合模式附近加强搜索。

研究人员通过从头设计将蛋白质与具有不同形状和表面特性的 12 种不同蛋白质靶标结合,证明了这种方法的广泛适用性。生物物理表征表明,所有小于 65 个氨基酸的结合剂是超稳定的,并且在实验优化后,以纳摩尔到皮摩尔的亲和力结合它们的靶标。

该团队成功地解决了五种粘合剂-目标配合物的晶体结构,并且所有五种都与相应的计算设计模型密切匹配。该方法,能够针对治疗和诊断应用的各种蛋白质上的各种位点,进行靶向设计粘合剂;从而开发诊断或治疗试剂。

该研究以「Design of protein-binding proteins from the target structure alone」为题,于 2022 年 3 月 24 日发布在《Nature》。

图片

蛋白质相互作用在生物学中起着至关重要的作用,而设计破坏或调节这些相互作用的蛋白质的一般方法将具有很大的实用性。从大抗体、设计的锚蛋白、重复蛋白或其他蛋白质支架文库开始的经验选择方法,可以生成蛋白质靶标的结合物。然而,一开始很难针对目标蛋白表面上的特定结构域,并对可能的结合模式的整个空间,进行采样。

计算方法可以针对特定的目标表面位置,并提供比随机库选择方法更有原则,且可能更快的方法来生成粘合剂,以及洞察蛋白质界面的基本特性(必须了解这些特性才能使设计成功)。用于设计与目标表面结合的蛋白质的大多数当前计算方法,利用源自天然复合物结构的关于特定侧链相互作用或最适合结合的蛋白质骨架位置的信息。

具有不同环几何形状的抗体支架的计算对接产生了粘合剂,但设计的结合模式很少用高分辨率结构进行验证。已经从几个计算识别的热点残基开始生成结合剂,然后将其用于指导天然存在的蛋白质支架的定位。然而,对于许多靶蛋白而言,蛋白质表面没有明显的口袋或裂缝,其中可以放置少量特权侧链,并且少量热点残基的引导限制了可能的相互作用模式的一小部分。

该团队寻求开发一种通用方法,来设计针对任意蛋白质靶标的高亲和力结合剂,以解决两个主要挑战。首先,通常没有明确的侧链相互作用或二级结构堆积排列可以介导与目标的强相互作用;相反,有大量单独的非常弱的可能相互作用信息。其次,选择将这些众多弱相互作用中的哪一种整合到单个结合蛋白中的方法数量非常多,并且任何给定的蛋白质骨架不太可能同时呈现可以包含这些相互作用的任何预选子集的侧链。

为了说明这种方法,研究人员进行了一个简单的类比:一个困难的攀岩墙,只有几个合适的立足点或把手彼此远离。以前基于热点的方法对应于关注涉及这些立足点和把手的路线,但这极大地限制了可能性,并且可能无法将它们连接成成功的路线。另一种方法是首先确定所有可能的抓手和立足点,无论多差;其次,让成千上万的登山者选择其中的一部分并尝试攀登墙壁;第三,确定那些最有希望的路线,第四,让第二组登山者详细探索它们。

按照这个类比,研究人员设计了以下方法:

  • 步骤(1),列举大量和全面的与目标表面的无实体侧链相互作用;
  • 步骤(2),从蛋白质骨架的大型计算机文库中鉴定那些可以承载许多这些侧链而不会与目标发生冲突的蛋白质骨架;
  • 步骤 (3),识别这些结构中的重复主干基序;
  • 步骤 (4),生成第二轮包含这些相互作用的基序的支架并将其放置在目标上。

步骤 (1) 和 (2) 广泛搜索空间,而步骤 (3) 和 (4) 加强了对最有希望的结构域的搜索。

图片

图示:从头蛋白质粘合剂设计流程概述。(来源:论文)

研究人员首先将无实体的氨基酸与靶蛋白对接,并将通常数十亿个氨基酸的骨架坐标和靶结合能存储在六维空间哈希表中,以进行有利的氢键或非极性相互作用,以便快速查找。这种旋转异构体相互作用场(RIF)能够快速逼近目标相互作用能量,该蛋白质支架可通过仅基于其骨架坐标与目标对接的蛋白质支架实现(无需耗时的侧链采样)。

对于每个停靠点,将哈希表中每个匹配氨基酸的目标相互作用能相加。一种相关的方法被用于小分子粘合剂的设计;由于蛋白质靶标要大得多,并且由于非极性相互作用是蛋白质-蛋白质相互作用的主要驱动力,该团队将 RIF 生成过程集中在蛋白质特定表面结构域的非极性位点上。

例如,对于抑制剂的设计,研究人员会更关注分子伴侣的相互作用位点。RIF 方法改进了之前的离散交互采样方法,将考虑的侧链-目标交互数量的算法复杂性从 O(N)或 O(N^2)降低到 O(1),从而允许考虑数十亿而不是数千个潜在接口。

为了与 RIF 对接,需要有大量的蛋白质支架选项,因为任何一个支架可以容纳许多相互作用的机会很小。这些脚手架的结构模型必须相当准确,才能正确定位。使用片段组装、分段片段组装和螺旋延伸,研究人员设计了一组长度从 50 到 65 个氨基酸不等的小蛋白,并且比以前的小蛋白支架文库包含更大的疏水核心。

这些特性使蛋白质更稳定,更能耐受设计结合表面的引入。共有 84,690 个支架跨越 5 种不同的拓扑结构,其结构指标可预测折叠,这些支架被编码在大型寡核苷酸阵列中,使用基于高通量蛋白水解的蛋白质稳定性测定发现其中 34,507 个支架是稳定的。

图片

图示:小蛋白结合剂的从头设计和表征。(来源:论文)

该团队尝试了几种方法将这些稳定的支架与目标结构 RIF 对接,平衡整体形状互补性和最大化特定的旋转异构体相互作用。最稳健的结果是使用直接低分辨率形状匹配,然后对 RIF (RIFDock) 中的刚体方向进行基于网格的细化获得的。

与单独使用 PatchDock 的形状匹配相比,这种方法在序列设计后产生更好的 Rosetta 结合能 (ddG) 值和包装,并且与没有 PatchDock 形状匹配的分层搜索相比,与目标的非极性交互更广泛。

由于用于构建 RIF 的散列中的分辨率损失,以及侧链(方法)之间相互作用的必然近似解释,研究人员发现,通过使用 Rosetta 力场的完全组合优化,RIF 解决方案的评估大大增强,这将允许目标侧链重新包装,支架骨架松弛。

图片

图示:通过设计的小蛋白从头设计和抑制天然信号通路。(来源:论文)

然而,完整的组合序列优化是 CPU 密集型的。为了能够有效筛选数百万个替代主干布局,该团队还开发了一种快速接口预筛选方法,使用 Rosetta 来识别有前景的 RIF 坞站。与标准 Rosetta 设计计算相比,限制疏水氨基酸并考虑较少数量的侧链旋转异构体,以及更快速的可计算能量函数将设计时间缩短了十倍以上,同时在全序列设计后保持与结果的强相关性 。这种预筛选(以下称为「预测器」)大大提高了最终设计的结合能和形状互补性,因为可以处理更多的 RIF 解决方案。

研究人员观察到,在某些情况下,将标准 Rosetta 设计应用于过滤码头集,会导致模型具有不满足的极性基团和其他次优特性。为了克服这些限制,他们开发了一种组合序列设计方案,可最大限度地提高与目标的形状和化学互补性,同时避免埋藏极性原子。使用基于结构的序列图谱,增加了与支架单体结构的序列兼容性,在基于蒙特卡罗的序列设计阶段,交叉界面相互作用被增重,以最大化粘合剂和目标之间的接触,并且包含埋藏的不满意极性原子的转子流量计在填充之前被消除,埋藏的不满意极性原子被成对分解的赝能项惩罚。与标准的 Rosetta 界面设计相比,该协议产生的氨基酸序列被更强烈地预测为折叠到设计的结构并结合目标。

在开发整体粘合剂设计流程的过程中,即使设计具有有利的罗塞塔结合自由能,结合后溶剂可及表面积(SASA)的巨大变化和高形状互补性(SC),通常缺乏涉及多个二级结构元素的紧密堆积和相互作用。

为此,研究人员开发了一种与视觉评估更接近的包装质量的定量测量方法——接触分子表面(方法)——它以明确惩罚不良包装的方式平衡界面互补性和尺寸。他们使用该指标来帮助在快速预测器阶段和全序列优化(方法)之后选择合适的设计。

图片

图示:与靶蛋白复合的小蛋白结合物的高分辨率结构与计算设计模型非常匹配。(来源:论文)

通过结构和序列空间的搜索所采样的空间是巨大的:数以万计的可能的蛋白质骨架 × 每个靶标有近 1 0 亿个可能的无实体侧链相互作用 × 每个支架放置 10^16 个界面序列。这种大小的空间采样必然是不完整的,并且此阶段的许多设计都包含埋藏的不满意的极性原子(只有在任何情况下都不能形成氢键的旋转异构体在包装阶段被排除在外)和空腔。

为了生成改进的设计,研究人员加强了围绕最佳设计界面的搜索。开发了一种重采样协议,该协议首先从第一个「广泛搜索」设计中提取与目标蛋白良好接触的所有二级结构基序。

接下来,它根据它们的主干坐标和刚体位置对这些基序进行聚类,然后在每个簇中选择具有最佳每个位置加权 Rosetta 结合能的结合基序。

使用这种方法,为每个目标选择了大约 2,000 个基序。这些在许多情况下类似于典型的二级结构包装模式的基序具有特权,因为它们与目标的有利侧链相互作用的密度比其他设计高得多。这些图案被用来指导另一轮对接和设计。

首先,将文库中的支架叠加在基序上,并将有利的相互作用基序残基转移到支架上。支架序列的其余部分经过优化以与靶标进一步相互作用,通过骨架扭转角最小化允许骨架柔韧性以增加与靶标的形状互补性。

重采样后的设计界面指标比广泛搜索阶段的指标有了显著改善。从广泛的搜索和重采样阶段选择具有最有利的蛋白质折叠和蛋白质界面指标的设计进行实验验证。

结语

图片

图示:设计的结合剂具有很高的目标特异性。(来源:论文)

使用设计的新方法,该团队在为 14 个靶位点设计纳摩尔亲和结合剂方面取得了成功。这表明,可以仅使用有关靶蛋白结构的信息从头设计结合蛋白,而无需事先了解与结合伙伴的复合物结构中的结合热点或片段的信息。

这一成功还表明,他们的设计流程为从头蛋白质界面设计问题提供了一个通用解决方案,远远超出了先前描述的方法。但是,仍有相当大的改进空间。只有一小部分设计结合,并且在几乎所有情况下,其中最好的设计需要额外的替换来实现高亲和力结合。

此外,设计高极性目标位点的结合剂仍然是一个相当大的挑战:这里的目标位点都包含至少四个疏水残基。这项工作中生成的数据集,包括关于结合物与非结合物的信息以及关于单个点突变体对结合的影响的反馈,应有助于指导开发直接从计算机设计高亲和力结合物的方法,而无需迭代实验优化。

更一般地说,从头粘合剂设计方法和此处生成的大型数据集为研究蛋白质-蛋白质相互作用的基本物理化学以及开发和评估蛋白质-蛋白质相互作用的计算模型提供了一个起点。

这项工作代表了向仅从结构信息开始的高亲和力粘合剂的直接计算设计的长期目标迈出的重要一步。研究人员预计,此处创建的结合剂以及随着该方法向前发展而创建的新结合剂,将广泛用作信号通路拮抗剂,作为单体蛋白和可调谐激动剂,当以多聚体形式严格搭建时,以及在病原体疾病的诊断和治疗中。

与抗体不同,设计的蛋白质在大肠杆菌中以高水平表达时是可溶的,并且是热稳定的,因此可以形成下一代低成本蛋白质疗法的基础。更一般地说,快速、稳健地设计任意蛋白质靶标的高亲和力结合剂的能力,可以改变依赖亲和力试剂的生物技术和医学的许多领域。

论文链接:https://www.nature.com/articles/s41586-022-04654-

产业蛋白质
相关数据
重采样技术

重采样是指根据一类象元的信息内插出另一类象元信息的过程。在遥感中,重采样是从高分辨率遥感影像中提取出低分辨率影像的过程。常用的重采样方法有最邻近内插法(nearest neighbor interpolation)、双线性内插法(bilinear interpolation)和三次卷积法内插(cubic convolution interpolation)。

分层搜索技术

分层搜索返回指定项目的所有父项目和后代项目。 分层搜索在一系列项目中查找,从给定项目级别开始并延伸到该项目的后代。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

暂无评论
暂无评论~