Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

张倩机器之心编译

悲剧 or 春天?AlphaFold究竟给结构生物学家带来了什么?

有人说,AlphaFold 的出现是结构生物学家的悲剧,因为他们在做的事情似乎已经被 AI 代劳了。但也有人说,AlphaFold 让结构生物学家迎来了春天。 曾在多家大型制药公司从事药物研发工作的杜克大学有机化学博士 Derek Lowe 似乎更倾向于第二种看法。他认为,AlphaFold 只是为结构生物学家完成了一些比较繁重的工作,从而将他们推向更高层次的问题,这些问题目前还没有办法用计算或自动化的方式去解决。

AlphaFold 在 2020 年的蛋白质折叠挑战赛中表现非常出色,也吸引了很多注意力。最近,研究团队又宣布即将公开他们所预测的 35 万种蛋白质的结构,而且未来还要挑战 1 亿种蛋白质。与此同时,华盛顿大学的一个研究小组也发表了类似的研究——RosettaFold,还开源了代码。

显然,与几年前相比,计算蛋白结构预测领域已经发生了很大变化。但我之前已经公开表示:我为此类进展感到高兴,但我认为它对药物发现所产生的影响并不像很多报道所描述得那么夸张。如今,AlphaFold 又取得了新的进展,我的想法是否发生了变化?这一切意味着什么?我和我的同事探讨了这个问题,也了解了一些业内人士的看法,遂将思路整理如下。

首先,这些进展意味着,学术界的很多人都将不得不重写自己的研究经费申请。如果你自己就是研究计算蛋白质折叠的,你可能已经被最近的这些进展冲击得不知所措,需要重新思考研究方向。但这并不意味着你已经无事可做,除非你的研究和 DeepMind 高度撞车。

另一件我们必须接受的事实是:几十年来,每当预测结构和实验结果不吻合时,我们都倾向于认为计算错误是最可能的错误来源,这是非常正确的;但如今,情况似乎发生了反转,如果二者不吻合,实验出错的可能性反而更大,因为折叠预测结果已经变得非常可靠。

再来说说实验数据的协同作用。对于很多非晶体学研究者来说,X 射线数据似乎天然地镀着一层金。但其实,蛋白质 X 射线结构也依赖于模型构建。你要试着找出哪种结构最符合实验电子密度数据。这些数据通常可以用不同的方式来解释,尤其是当涉及到构造的微妙细节时。

注意,这里所说的「微妙」并非微不足道,有时候一些微小的东西可以对蛋白质功能产生重大影响,比如脯氨酰异构酶,它的任务是使脯氨酸残基在整个链中以顺式或反式的构象存在。有了这类经过良好验证的结构模型之后,X 射线数据的处理方式也发生了变化,而且是好的变化。此外,不同方法测定的蛋白质的结构也有差异,计算得到的预测结果有助于解决这些问题。

AI 和机器学习(ML)方法给化学和药物挖掘所带来的影响可见一斑。它们重新定义了什么是繁重的工作,然后用机器去代替人来完成这些工作,而且速度更快、准确度更高且永不疲劳。这对我们人类有什么影响呢?答案是:它将我们推向更高层次的问题,这些问题目前还没有办法用计算或自动化的方式去解决。

具体到蛋白质折叠问题,这意味着我们将把更多的时间花在更加困难的问题上,比如蛋白复合物、蛋白质表面的分类和功能、各种翻译后修饰(PTM)所产生的影响、蛋白质构象在真实细胞生物学时间中的动态变化等。

总而言之,新的蛋白质计算工具的出现并没有解决所有问题,甚至可以说还差得很远。它们清除了很多障碍,让我们能够更容易、更高效地解决上述问题,但核心问题还要靠人类自己。比如说,一位结构生物学家指出,如果你向 AlphaFold 询问各种关键激酶的结构,它会给你一个非常准确的我们已经知道的蛋白质非活性形式。激酶有几个区域,这些区域会翻转并快速进入不同的、容易接近的构象状态,AlphaFold 的结构预测结果不一定能够捕获所有这些信息,而且它们肯定不会告诉你哪些结果与活性酶有关,哪些与蛋白质在体内的不同功能更相关。

考虑一下刚才提到的那些脯氨酸:AlphaFold 可能会给你一种蛋白质结构中的顺式脯氨酸,也可能给你一个蛋白质某个残基上的反式脯氨酸,但它不能告诉你这两种物质都是在活细胞中发现的,它们在另一种酶的作用下相互转化,二者具有完全不同的功能。与此同时,同一蛋白质中的其他脯氨酸永远不会相互转换,这点它也不会告诉你。这些细节需要人类去探索。类似的,很多酶需要与相应的辅助因子分子结合才能发挥作用,AlphaFold 预测出的结构也没有办法考虑这些,不在其考虑范围之内的还有锌离子、钙离子等对蛋白质结构和功能有深远影响的物质。

这就是我为什么用这种方式谈论蛋白质结构预测及其对药物发现的影响。药物发现就是有关这些生物效应的一门科学,上述问题都是比单纯的蛋白质结构更高阶的东西。请记住,我们的失败率总体上在 90% 左右。这些失败都不是由于缺乏良好的蛋白质结构造成的,而是面临着更加困难的问题,比如:这些蛋白质在活细胞中有什么功能?这些功能在健康和患病状态下有何不同?它们在不同类型的病人之间和一般人之间有什么区别?候选药物可能击中的其他蛋白质靶点是什么?

因此,AlphaFold 等新工具的出现极大地促进了结构生物学的发展,但结构生物学本身并没有被取代或变得无关紧要。相反,它比以往任何时候都更加重要,而且我们可以向更大的问题迈进了。

原文链接:
https://blogs.sciencemag.org/pipeline/about-derek-lowe
理论结构生物学AlphaFold
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

药物发现技术

在医学,生物技术和药理学领域,药物发现是发现新候选药物的过程。

推荐文章
暂无评论
暂无评论~