Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

ScienceAI作者

线上分享 | 同源建模预测蛋白质结构,中科院计算所ProALIGN研究解读

图片

在蛋白质结构预测领域,活跃着很多华人学者,机器之心知识站特推出「蛋白质结构预测系列技术直播」,聚焦领域前沿成果的同时,回顾蛋白质结构预测技术发展历程。欢迎关注并加入社区交流讨论!

蛋白质结构预测,即从蛋白质的氨基酸序列出发,应用数学建模方法和计算机程序设计开发相应算法,然后通过所开发的算法构建蛋白质的空间三维结构模型。根据是否利用现有结构数据库中的结构作为模板信息,现有的蛋白质结构预测方法可大致分为两类:同源建模方法和从头预测方法。

在从头预测方面,中科院计算所卜东波团队日前在 Nature Communications 发文,介绍了一个新的神经网络架构 CopulaNet,并以其为核心开发了蛋白质结构从头预测算法和软件 ProFOLD。在业界权威蛋白质三维结构数据集 CASP13 的测试集上,ProFOLD 达到了 0.7 的预测精度,优于 DeepMind 早先开发的 AlphaFold(约为0.5),但离 AlphaFold2(约为0.92)尚有一定差距,目前正在努力赶超中。

除了从头预测算法 ProFOLD,卜东波团队还从同源建模方法入手,提出了基于模板的建模预测方法 ProALIGN,相关论文已被生物信息学顶会 RECOMB 2021接收。与传统的人工设计打分函数的方法不同,ProALIGN 采用神经网络直接学习联配,以减少人工设计引入的偏见。目前,团队正在将 ProFOLD 和 ProALIGN 结合,研发蛋白质结构预测服务器 FALCON2,为学术界提供蛋白质结构预测服务:http://protein.ict.ac.cn/FALCON2


图片

机器之心知识站蛋白质结构预测系列技术直播」最新一期,我们邀请 ProALIGN 论文一作、中科院计算所博士研究生孔鲁鹏为大家解读这项工作。

图片

主题:ProALIGN:同源建模预测蛋白质结构新进展

摘要:基于模板的建模(TBM)是一种广泛使用的蛋白质结构预测方法,它通过将要预测的蛋白序列与具有已解析结构的蛋白结构模板之间建立联配映射来预测蛋白质结构。TBM 的性能高度依赖于目标序列与模板之间的质量。与传统的人工设计打分函数的方法不同,ProALIGN 采用神经网络直接学习联配。

具体地,ProALIGN 将蛋白质联配表示为一种二进制矩阵的形式,使用深度卷积神经网络学习从目标蛋白和模板到最优联配的映射。利用训练好的模型,ProALIGN 直接预测目标序列与模板的联配似然分布,并采用最大似然思想求得最优的联配,进而构建目标蛋白的结构。对于 CASP13 数据上的TBM类目标,ProALIGN 比现有的同源建模和 threading 方法获得了更高质量的预测三维结构。

论文链接:

https://www.biorxiv.org/content/10.1101/2020.12.28.424539v2

直播间:https://jmq.h5.xeknow.com/s/2rijY

直播时间:6月3日(周四)19:00-20:00

加入机动组,一起看直播

「机动组」是机器之心发起的人工智能技术社区,将持续提供技术公开课、论文分享、热门主题解读等线上线下活动,同时「机动组」也将不定期组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

添加机器之心小助手(syncedai6),备注「蛋白质」加入本次直播群,后续线上分享也将在群中预告。

图片

如小助手添加异常,还可以添加 syncedai4 与 syncedai5,我们将邀请你入群。

理论线上分享蛋白质结构
相关数据
数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~