Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

已开源,多个国内团队使用人工智能揭示蛋白质相互作用

编辑 | 萝卜皮

目录

  • PhosIDN:一种集成的深度神经网络,用于通过结合序列和蛋白质-蛋白质相互作用信息来改善蛋白质磷酸化位点预测
  • 通过多尺度卷积神经层进行迁移学习,用于人-病毒-蛋白质相互作用预测
  • DeepTrio:使用掩码多个并行卷积神经网络的蛋白质-蛋白质相互作用的三元预测系统
  • pyconsFold:一种使用距离预测进行建模和对接的快速、简单的工具
  • 一种预测生物活性分子结合构象的几何深度学习方法,可预测配体与蛋白质靶标的结合构象
  • 使用纳米孔以单氨基酸分辨率多次重读单个蛋白质

PhosIDN:一种集成的深度神经网络,用于通过结合序列和蛋白质-蛋白质相互作用信息来改善蛋白质磷酸化位点预测

磷酸化是研究最多的翻译后修饰之一,在各种细胞过程中起着关键作用。研究蛋白质磷酸化可以增进对蛋白质互作的研究,对于医疗、疾病、制药等均有帮助。

最近,深度学习方法在预测磷酸化位点方面取得了巨大成功,但其中大多数基于卷积神经网络,可能无法捕获足够的关于蛋白质序列中残基之间的长程依赖关系的信息。

此外,现有的深度学习方法仅利用序列信息来预测磷酸化位点,因此非常需要开发一种深度学习架构,可以结合异质序列和蛋白质 - 蛋白质相互作用(PPI)信息来更准确地预测磷酸化位点。

中国科学技术大学的研究人员提出了一种名为 PhosIDN 的新型集成深度神经网络,通过提取和组合序列和 PPI 信息来预测磷酸化位点。

该研究以「PhosIDN: an integrated deep neural network for improving protein phosphorylation site prediction by combining sequence and protein–protein interaction information」为题,于 2021 年 12 月 15 日刊载于《Bioinformatics》。


在 PhosIDN 中,提出了一个序列特征编码子网络,不仅可以捕获局部模式,还可以捕获蛋白质序列的远程依赖性。同时,在 PhosIDN 中还通过采用多层深度神经网络的 PPI 特征编码子网络提取有用的 PPI 特征。

此外,为了有效地结合序列和 PPI 信息,引入了异构特征组合子网络,以充分利用序列和 PPI 特征之间的复杂关联,并将它们的组合特征用于最终预测。综合实验结果表明,所提出的 PhosIDN 显着提高了磷酸化位点的预测性能,并且优于现有的通用和激酶特异性磷酸化位点预测方法。

PhosIDN 链接:https://github.com/ustchangyuanyang/PhosIDN

论文链接:https://academic.oup.com/bioinformatics/article/37/24/4668/6329824

通过多尺度卷积神经层进行迁移学习,用于人-病毒-蛋白质相互作用预测

为了补充常规实验方法的数据,基于机器学习的计算方法在预测人-病毒的蛋白质-蛋白质相互作用(PPI)方面发挥着越来越重要的作用。此外,迁移学习可以有效地将从大型源数据集/任务中获得的先验知识应用于小型目标数据集/任务,从而提高预测性能。

为了预测人类和病毒蛋白质之间的相互作用,中国农业大学的研究团队将进化序列特征与连体卷积神经网络 (CNN) 架构和多层感知器相结合。该架构优于各种基于特征编码的机器学习和最先进的预测方法。

研究人员引入了两种转移学习方法(即「冻结」型和「微调」型),通过重新训练 CNN 层,基于源人类-病毒域中的训练,可靠地预测目标人类-病毒域中的相互作用。最后,研究人员利用「冻结」类型的转移学习方法来预测人类-SARS-CoV-2 PPI,结果表明该预测在拓扑和功能上与实验已知的相互作用相似。

该研究以「Transfer learning via multi-scale convolutional neural layers for human–virus protein–protein interaction prediction」为题,于 2021 年 12 月 15 日刊载于《Bioinformatics》。


源代码和数据集:https://github.com/XiaodiYangCAU/TransPPI/

论文链接:https://academic.oup.com/bioinformatics/article-abstract/37/24/4771/6323357?redirectedFrom=fulltext

DeepTrio:使用掩码多个并行卷积神经网络的蛋白质-蛋白质相互作用的三元预测系统

蛋白质-蛋白质相互作用(PPI)作为一种相对属性,由两个结合蛋白决定,这给设计具有无偏学习架构和优越泛化性能的专家模型带来了巨大挑战。此外,几乎没有努力允许 PPI 预测器区分相对属性和内在属性。

浙江大学的研究人员提出了一种基于序列的方法 DeepTrio,用于使用掩码多个并行卷积神经网络进行 PPI 预测。实验评估表明,就各种质量指标而言,DeepTrio 的性能优于几种当前最先进的方法。此外,DeepTrio 被扩展以提供关于每个输入神经元对预测结果的贡献的更多见解。

该研究以「DeepTrio: a ternary prediction system for protein–protein interaction using mask multiple parallel convolutional neural networks」为题,于 2021 年 10 月 25 日发布在《Bioinformatics》。


DeepTrio 在线申请:http://bis.zju.edu.cn/deeptrio

DeepTrio 模型和训练数据:https://github.com/huxiaoti/deeptrio.git

论文链接:https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab737/6409848?redirectedFrom=fulltext

pyconsFold:一种使用距离预测进行建模和对接的快速、简单的工具

蛋白质内的接触预测最近已成为准确预测蛋白质结构的可行方法。在许多情况下,使用预测距离分布已被证明优于仅使用二元接触注释。使用预测的蛋白质间距离也已被证明能够对接一些蛋白质二聚体。

在这里,瑞典斯德哥尔摩大学的研究人员介绍了一种使用距离预测进行建模和对接的工具 pyconsFold;它使用 CNS 作为其基本折叠机制和预测接触距离,该工具在 210 种蛋白质数据集上优于基于常规接触预测的建模。它的性能比最先进的 pyRosetta 折叠管道稍差,但平均每个模型快 20 倍。更重要的是,pyconsFold 还可以用作折叠和停靠协议,通过使用预测的蛋白间接触/距离同时折叠和停靠两条蛋白质链。

该研究以「pyconsFold: a fast and easy tool for modeling and docking using distance predictions」为题,于 2021 年 11 月 1 日刊载于《Bioinformatics》。


pyconsFold 是在 Python 3 中实现的,重点是使用尽可能少的依赖项以延长使用寿命。它既可以作为 Python 3 中的 pip 包使用,也可以作为 GitHub 上的源代码使用,并在 GPLv3 许可下发布。

数据和源代码:https://github.com/johnlamb/pyconsfold

论文链接:https://academic.oup.com/bioinformatics/article/37/21/3959/6317824

一种预测生物活性分子结合构象的几何深度学习方法,可预测配体与蛋白质靶标的结合构象

了解配体与其分子靶标之间形成的相互作用是指导分子优化的关键。目前,已有多种不同的实验和计算方法来揭示这些分子间相互作用。

在这里,Janssen Research & Development 的研究人员报告了一种基于几何深度学习的方法,该方法能够预测配体与蛋白质靶标的结合构象。

该模型根据距离似然学习统计潜力,这是为每个配体-目标对量身定制的。这种潜力可以与全局优化算法相结合,以重现配体的实验结合构象。

该团队表明,此处描述的基于距离似然的潜力在对接和筛选任务中的表现与完善的评分函数相似或更好。总的来说,这种方法代表了如何使用人工智能来改进基于结构的药物设计的一个例子。

该研究以「A geometric deep learning approach to predict binding conformations of bioactive molecules」为题,于 2021 年 12 月 2 日发布在《Nature Machine Intelligence》。


论文链接:https://www.nature.com/articles/s42256-021-00409-9

使用纳米孔以单氨基酸分辨率多次重读单个蛋白质

能够识别单个蛋白质的蛋白质组学工具对于细胞生物学研究和应用非常重要。

在这里,荷兰代尔夫特理工大学的研究人员展示了一种基于纳米孔的单分子肽阅读器,它对单个肽中的单氨基酸取代敏感。DNA-肽缀合物被DNA解旋酶Hel308拉过生物纳米孔MspA。通过纳米孔读取离子电流信号能够区分单次读取中的单氨基酸取代。

分子动力学模拟显示这些信号是由尺寸排阻和孔结合引起的。研究人员还展示了「倒带」肽段读数的能力,获得同一分子的大量独立读数,在单氨基酸变体鉴定中产生 <10^-6 的错误率。这些概念验证实验为开发单分子蛋白质指纹图谱和分析技术奠定了有希望的基础。

该研究以「Multiple rereads of single proteins at single–amino acid resolution using nanopores」为题,于 2021 年 11 月 4 日发布在《Science》。

论文链接:https://www.science.org/doi/10.1126/science.abl4381

相关报道:https://phys.org/news/2021-11-scanning-protein-amino-acid.html

https://techxplore.com/news/2021-11-individual-proteins-nanopores-supercomputers.html

工程
暂无评论
暂无评论~