Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

中科大团队开发了一种名为 SCUBA 的从头开始设计蛋白质的方法

编辑 | 萝卜皮

如果存在大量自动折叠的氨基酸序列,则可以设计蛋白质骨架结构。有人提出,主链的可设计性主要受侧链无关或侧链类型不敏感的分子相互作用控制,这表明一种基于连续采样和优化主链中心能量表面来设计新主链的方法。然而,尚未为此目的建立足够全面和精确的能量函数。

在这里,中国科学技术大学的研究人员展示了一个名为 SCUBA(Side Chain-Unknown Backbone Arrangement)的统计模型满足了这一目标,该模型使用神经网络形式的能量项。这些术语是通过两步方法学习的,包括核密度估计和神经网络训练,并且可以分析地表示已知蛋白质结构中的多维、高阶相关性。

他们还展示了九种从头设计的蛋白质的晶体结构,其骨架使用 SCUBA 设计为高精度,其中四种具有新颖的、非天然的整体结构。通过避免使用现有蛋白质结构中的片段,SCUBA 驱动的结构设计促进了对可设计骨架空间的深远探索,从而扩展了适合从头设计的蛋白质的新颖性和多样性。

该研究以「A backbone-centred energy function of neural networks for protein design」为题,于 2022 年 2 月 9 日发布在《Nature》。

图片

计算蛋白质设计已经展现出巨大的潜力,突破性的研究证明了从头设计具有新结构和功能的蛋白质,其中大部分是使用最先进的 RosettaDesign 方法进行的。新的骨架要么通过参数改变现有结构模块(或模板)之间的相对几何形状来设计螺旋束或重复蛋白质,要么通过组装现有结构的肽片段来构建。尽管最近有所改进,但这些生成骨架的方法的模板依赖性仍然严重限制了可能的新结构的可用范围,可能会缩小可设计的功能活动的范围。

确定可设计性的假定的以骨干为中心的能量表面的明确表示,可以为无模板蛋白质设计工作流程提供基础;这将与现有的方法有根本的不同——并且可能会大大补充——现有的方法。建立这种表示的进展缓慢,可能是由于缺乏将相关分子相互作用表示到从头蛋白质设计任务所需的全面性和精确度水平的方法。

早期的研究已经探索了简化的骨干能量表面,但只是为了验证类似自然骨干的宽最小值的存在,也就是说,不是在尝试骨干设计的背景下。一个例外是基于 Cα 原子的统计潜力,它强调了对局部骨架构象的准确建模。该模型成功地产生了一个不使用任何天然片段作为模板设计的循环,表明以骨干为中心的方法的可行性。

图片

图示:以骨干为中心的能量的明确表示促进了无模板蛋白质设计。(来源:论文)

SCUBA 模型旨在表示对骨架可设计性至关重要的因素,包括肽骨架的局部构象偏好、氢键几何形状以及手性连接和紧密堆积的侧链所需的骨架间空间,这样做具有支持从头蛋白质设计的全面性和精确性。NC-NN解决了构造统计势的一个主要技术挑战,产生的势除了是连续的,并提供易于计算的函数值以用于结构采样和优化外,还可以表示复杂的高保真真实结构数据的高维和高度相关分布。

该团队将 SCUBA 驱动的随机动力学 (SD) 模拟,同数据驱动的固定骨架氨基酸序列选择程序 ABACUS2 一起应用,从而设计具有满足各种设计规范的、新颖的、从头开始设计拓扑结构的蛋白质。SCUBA 的可设计骨干空间,研究人员报告了九种从头设计蛋白质的 X 射线结构,每种蛋白质都具有独特设计的序列和结构。

使用 SCUBA 进行无模板蛋白质设计

研究人员分两批对给定拓扑结构设计的蛋白质进行了实验测试。这些架构包括一个 H2E4 草图、几个四螺旋束(H4)草图和一个 EXTD 草图,其中天然蛋白质结构域中的一个环被设计的四个螺旋片段取代。

第 1 批中的蛋白质是使用骨干优化协议设计的,没有循环重采样。44 个测试的 H2E4 或 H4 设计都没有成功结晶。对于八种 EXTD 设计(EXTD-3)中的一种,获得了已解决的晶体结构。

批次 1 中的蛋白质所揭示的实验结构和设计结构之间的这些差异,导致研究人员在骨干优化协议中添加了循环重采样和优化步骤。研究人员将此修订后的协议应用于 H2E4 和 H4 草图,并通过 Rosetta 偏置前向折叠过滤设计的序列。过滤后保留的38个序列组成了第2批的蛋白质。

其中,12个H2E4和4个H4蛋白作为单体纯化,并通过X射线晶体结构或核磁共振(NMR)异核单量子相干(HSQC)光谱显示折叠良好。尽管两种 H2E4 蛋白的不对称晶体单元含有二聚体,但尺寸排阻色谱证实这些蛋白质是溶液中的单体。

图片

图示:从头设计蛋白 EXTD-3 整合了预先存在的和新设计的部分,形成了一个尚未在自然界中观察到的单一刚性结构。(来源:论文)

SCUBA 设计的骨架与实验获得的具有原子精度的结构一致。在 X 射线和设计结构之间观察到的值为 0.96-1.85 Å。此外,设计结构中的 19 个回路中有 16 个与实验改进的具有亚埃精度的回路一致。值得注意的是,这两种 H2E4 蛋白没有相同的环构象,尽管它们的二级结构相似。

设计的 H2E4 和 H4 蛋白与具有相似结构的已知天然蛋白的序列同一性较低,与结构对齐的天然蛋白序列的同一性在 3.5-25% 范围内,远低于天然序列和为天然骨架选择的 ABACUS2 序列之间的平均序列同一性。如两个示例蛋白质的温度依赖性圆二色光谱数据所示,所设计的蛋白质与具有选择用于天然骨架的 ABACUS 序列的蛋白质具有相似的高热稳定性。

图片

图示:成功设计了两层α/β蛋白和四螺旋束蛋白。(来源:论文)

第 2 批中蛋白质的设计成功率约为 42%(38 种实验测试中的 16 种折叠良好的蛋白质)。这些结果支持这样一种观点,即除了最先进的 RosettaDesign 方法之外,SCUBA+ABACUS2 也是一种有效的从头蛋白质设计方法。

验证给定架构的设计

实验检测的第三批蛋白质具有新颖的、计算发现的架构。这些全螺旋结构是通过 SCUBA 驱动的 SASD 优化最初随机放置的螺旋骨架段,然后截断和排序这些段以及随后将这些段与 SCUBA 优化的环连接生成的。

图片

图示:成功设计的可折叠成新结构的从头蛋白质的结构。(来源:论文)

在第 3 批中的 13 种蛋白质中,有 3 种以单体形式纯化并被发现折叠良好。将这三种蛋白质(分别)融合到甘露糖结合蛋白(MBP)上,使蛋白质结晶:X 射线结构得到解决。

SCUBA 在设计这些蛋白质方面的成功表明, (1) 目前已知的 PDB 中的蛋白质结构是有限的,(2) SCUBA 驱动的设计不受用于训练模型的天然蛋白质结构的限制。

结语

多个属性将该方法与现有的蛋白质设计方法区分开来。使用 SCUBA 时,骨架结构会被连续采样和优化,并且具有完全的灵活性。此外,该团队以主干为中心的 SCUBA 模型消除了在主干设计阶段搜索序列空间的需要。总之,这两个属性支持轻松探索自然界中尚未观察到的全新骨干架构。

本研究中产生的新型结构的蛋白质清楚地证明了,SCUBA 方法在设计比在自然界中观察到的更广泛的蛋白质几何形状方面的效用。在设计功能性蛋白质时,可以轻松定制能量功能驱动的骨架采样和优化,以促进对结构空间的广泛探索(例如,通过应用增强的采样技术)和对设计结构的精确控制(例如,通过应用功能-相关限制)。这些方法能够显著扩展可用于从头蛋白质设计的结构多样性和功能。

论文链接:https://www.nature.com/articles/s41586-021-04383-5

相关报道:https://www.eurekalert.org/news-releases/943410

理论蛋白质
暂无评论
暂无评论~