参与张倩 蛋酱 杜伟

AlphaFold抗疫,DeepMind公布六种新冠病毒蛋白质结构预测结果

最近,一款名为「Foldit」的游戏风靡全球。在这款游戏中,玩家可以在线帮助研究人员寻找具有对抗新型冠状病毒潜力的蛋白结构,其本质是充分利用所有可利用的人力、算力。说到算力,不少人提到,希望科技巨头 DeepMind 也参与到这场行动中。不负众望,DeepMind 其实早已开始行动,并于昨日公布了他们的最新成果。

在昨天发表的博客文章中,DeepMind 表示,他们用 AlohaFold 生成了六种可能与新冠病毒有关的蛋白质结构预测结果,而且已经开放下载。这一结果可能对新冠病毒疫苗研发等工作起到推动作用。
DeepMind 开放的新冠病毒蛋白质结构预测结果下载链接:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip

为什么要用深度学习预测新冠病毒蛋白结构?

蛋白质是维持生命所必需的大而复杂的分子。几乎渗透到我们身体的每一个功能——收缩肌肉,感知光线,或将食物转化为能量——都可以追溯到一种或多种蛋白质,以及它们是如何运动和变化的。

任何给定的蛋白质能做什么取决于它独特的 3D 结构。例如,构成我们免疫系统的抗体蛋白是「Y」形的。通过与病毒和细菌结合,抗体蛋白能够检测并标记致病微生物并进行消灭。

为了检测病毒,开发疫苗,科学家必须首先理解病毒的机制,尤其是蛋白质结构。

然而,用传统方法预测病毒蛋白质结构往往要花费数月时间,而且也不一定能获得满意的结果。对于来势汹汹的新冠病毒疫情,几个月的时间还是太长了。

深度学习系统的应用可以加快这一过程,其中最具代表性的要数 DeepMind 2018 年底推出的 AlphaFold 系统。

AlphaFold 为何被寄予厚望?

DeepMind 的人工智能 AlphaGo 在国际象棋、围棋等游戏项目中取得了令世人瞩目的表现,但却没有止步于此。该公司还不断地尝试将人工智能应用于最具挑战性的科学研究问题上,2018 年 12 月,DeepMind 推出了 Alphafold,它可以仅根据基因代码预测蛋白质的 3D 结构。

在过去很多年时间里,科学家已经能使用低温电子显微镜和核磁共振等实验技术确定蛋白质的形状,但是每一种方法都依赖大量的试验与误差反馈,每种结构可能需要花费数万美元、历时数年进行研究。因此生物学家转攻 AI 方法,以完成这一困难且单调的过程。

近年来,DeepMind 等科技公司越来越倾向于利用深度学习方法来解决基因组数据的预测问题,其中 Alphafold 就是成果之一。

在参加一年两次的蛋白质折叠奥运会 CASP 上,Alpafold 在预测蛋白质结构的物理性质上达到了高度的准确性,然后基于这些预测可以使用两种不同的方法预测构建完整的蛋白质结构。

第一种方法建立在结构生物学的常用技术上,用新的蛋白质片段反复替换蛋白质整体结构的某个部分。他们训练了一个生成神经网络来创造新的片段,这些片段被用来不断提高蛋白质结构的评分。

先通过神经网络预测氨基酸之间的距离和化学键角度,然后再根据两种物理属性对结构进行评分,最后通过梯度下降优化评分。


第二种方法是通过梯度下降来优化评分,得到的结构高度精确。梯度优化被用在整个蛋白质链,而不是组装前必须单独折叠的片段,这种做法降低了预测过程的复杂性。

Alphafold 通过梯度下降方法预测蛋白质结构的 3D 动画图示。


预测蛋白质折叠形状非常重要,对解决很多世纪难题有重大影响。DeepMind 一位发言人曾在接受采访时表示,「公司的长期任务是推进人工智能研究的发展,并促使它们产生积极的效益。我们相信人工智能在促进科学发现方面具有巨大的潜力,我们对公司在蛋白质折叠等领域产生的影响感到非常自豪。DeepMind 团队将继续取得巨大的进步,并将我们的专业技能和知识应用于现实世界的挑战之中」。

此次。DeepMind 使用 Alphafold 来预测新冠病毒的蛋白质结构可以解读为一种将技术「应用于现实世界」的体现。

预测结果仅供参考,还未通过实验验证

在最新的博客文章中,DeepMind 表示:「我们决定发布几种可能与新型冠状病毒有关的病毒蛋白质结构,这几种蛋白质结构还在进一步研究中。需要强调的是,这几种结构预测尚未通过科学实验的验证,其准确性不能完全确定。」

通常,DeepMind 会在研究成果经过同行评审并正式发表在期刊之后,再进行官方发布。这一次跳过常规步骤,先行公开结构预测结果,也是基于疫情的严峻形势和时间敏感性做出的决定。

DeepMind 表示,这一结构预测系统仍在开发过程中。可以确定的是,最新系统比之前的 CASP 13 系统更准确。此次发布的结果有助于科研界增进对病毒机制的了解,可为新冠肺炎的治疗方案开发工作提供一个假设生成平台。

参考链接:https://deepmind.com/research/open-source/computational-predictions-of-protein-structures-associated-with-COVID-19
产业新型冠状病毒AlphaFoldDeepMind
相关数据
梯度下降技术

梯度下降是用于查找函数最小值的一阶迭代优化算法。 要使用梯度下降找到函数的局部最小值,可以采用与当前点的函数梯度(或近似梯度)的负值成比例的步骤。 如果采取的步骤与梯度的正值成比例,则接近该函数的局部最大值,被称为梯度上升。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

围棋技术

围棋是一种策略性棋类,使用格状棋盘及黑白二色棋子进行对弈。起源于中国,中国古时有“弈”、“碁”、“手谈”等多种称谓,属琴棋书画四艺之一。西方称之为“Go”,是源自日语“碁”的发音。

推荐文章
暂无评论
暂无评论~