Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

清华团队提出深度学习新模型,计算T细胞受体和表位之间的相互作用构象

编辑 | 萝卜皮

T 细胞受体(TCR)和表位之间相互作用的计算模型,对于免疫治疗和抗原发现非常重要。然而,目前的 TCR-表位相互作用预测工具仍处于相对原始的阶段,并且在破译潜在结合机制方面的能力有限;例如,表征 TCR 和表位之间的成对残基相互作用,便难以计算。

近日,清华大学的研究团队设计了一个新的基于深度学习的框架,用于建模 TCR-表位相互作用,称为残基水平的 TCR-表位相互作用建模(TEIM-Res),它将 TCR 和表位的序列作为输入,并预测了相互作用中涉及的成对残基距离和接触位点。该模型可以作为一个有用的工具来全面表征 TCR-表位相互作用和理解结合机制的分子基础。

该研究以「Characterizing the interaction conformation between T-cell receptors and epitopes with deep learning」为题,于 2023 年 3 月27 日发布在《Nature Machine Intelligence》。

T 细胞对表位的识别在适应性免疫反应中起着至关重要的作用。由主要组织相容性复合体(MHC)分子呈递的致病肽被 T 细胞受体(TCR)识别以刺激细胞介导的免疫,从而消除受感染的细胞并激活相应的免疫细胞。因此,了解TCR-肽-MHC复合物(TCR-pMHCs)的结合机制对于癌症免疫学、自身免疫抗原发现和疫苗设计具有重要意义。然而,由于这种识别机制的内在复杂性,TCR-pMHC 相互作用的实验检测和确定通常既费时又昂贵。为了缓解这些问题,已经开发了许多计算方法来模拟 TCR-pMHC 相互作用。

对于适应性免疫识别,多肽(这里也称为表位)由 MHC 分子呈递到细胞表面,然后被 TCR 识别。虽然 TCR 同时结合表位和相应的 MHC 分子伴侣,但复合物的核心结合区位于 TCR β 链(CDR3β)的互补决定区 3 和表位之间。有许多计算工具可以预测 CDR3β-表位对的结合,例如 pMTnet、TCRex、NetTCR、ERGO 和 ImRex。

这些工具利用不同的机器学习方法来预测给定的 CDR3-表位序列对是否可以相互结合,将其称为序列级结合分类任务。然而,它们无法揭示 TCR 和表位之间相互作用的详细潜在机制。预测残基与来自 TCR 和表位的接触残基对之间的结合距离,可以称之为残基水平结合预测任务,尚未得到充分探索。

存在一些预测 TCR-表位-MHC 复合体结构的相关工作,因此可用于分析它们的残基水平相互作用。不幸的是,它们中的大多数都需要同源序列的可用性才能进行准确的同源建模,这对于 CDR(TCR 最重要的区域)来说通常很难。虽然最近设计了一种称为 RACER 的基于能量的模型,可以从 TCR-表位结合数据中学习接触图,但它需要大量结合表位与查询 TCR 进行训练,不能直接用于任意 TCR。

由于 TCR-表位相互作用可被视为蛋白质-肽相互作用的特例,原则上可以利用现有的为蛋白质-肽相互作用建模而设计的工具来表征残基水平的 TCR-表位相互作用。其中包括蛋白质-肽对接工具和基于机器学习的蛋白质-肽接触预测模型。然而,它们在 TCR 表位预测方面的表现从未被评估过。此外,与一般的蛋白质-肽相互作用相比,TCR-表位相互作用具有几种独特且截然不同的结合模式,因此需要特定的建模方法。

图示:模型架构和性能评估。(来源:论文)

为了更好地理解 TCR-表位相互作用,清华大学的研究人员提出了一个基于深度学习的框架,称为残基水平的 TCR-表位相互作用建模(TEIM-Res),用于表征 CD8(白细胞分化抗原 8)TCR 和 MHC-I 呈递表位之间的相互作用构象。

图示:模型性能的详细分析。(来源:论文)

更具体地说,基于结合 TCR-表位对的序列,研究人与预测了 CDR3β 和表位之间所有成对残基的距离和接触概率。由于缺乏相应的结构数据,他们采用了少样本学习策略来利用先验知识。由于,TCR 和表位之间的整体结合实际上是由它们之间所有残基对的相互作用决定的。所以,在针对残基水平结合数据训练模型之前,该团队在丰富的高通量序列水平二元结合数据上对其进行了预训练,以使模型具备 TCR-表位相互作用的相关知识。有了这样的序列级绑定数据,该模型能够在预训练阶段隐式捕获残基级信息。

图示:TEIM-Res 可用于发现 TCR-表位相互作用的残基水平结合模式。(来源:论文)

研究人员展示了模型在突变效应预测、表位特异性 TCR 分析和相互作用模式发现中的应用。此外,预训练模型 TEIM-Seq 在序列级结合预测方面也取得了不错的性能。

模型的预训练阶段可以帮助模型从序列级结合数据中学习丰富的信息,从而为残基级相互作用预测提供适当的模型初始化。研究人员推测该策略可用于其他分子-分子相互作用建模任务,首先对模型进行预训练以预测粗粒度分子级相互作用,然后进行微调以进一步预测细粒度相互作用。

MHC 分子也参与 TCR-表位相互作用,将来有必要同时表征 TCR、表位和 MHC 之间的相互作用。此外,在未来的工作中推广 CD4 TCR 和 MHC-II 呈递表位之间相互作用的模型也很重要。

论文链接:https://www.nature.com/articles/s42256-023-00634-4

产业
暂无评论
暂无评论~