Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

文龙编译

Nature社论:AlphaFold为生命科学带来了什么?开源的技术和未来的方向

「我没有想到在有生之年我们能够走到这一步。」
这是结构生物学领域的一位专家对上周发表在《Nature》杂志上的研究做出的回应。
图片
7 月 22 日,DeepMind 与欧洲生物信息研究所(EMBL-EBI)合作发布了 AlphaFold DB,并公开了数据集(参见https://alphafold.ebi.ac.uk)。该团队利用 AlphaFold 确定了 98.5% 的人类蛋白质的结构,以及包括大肠杆菌、果蝇、大豆在内 20 种模式生物产生的几乎所有已知蛋白质的结构。
再上一周,一天之内,两大 AI 预测蛋白质结构算法开源,分别登上《Nature》《Science》DeepMind 公布了 AlphaFold2 的源代码并详细说明了它是如何构建的;来自西雅图华盛顿大学的研究人员公布了受其启发的另一个蛋白质结构预测程序 RoseTTAFold 的细节。
如果只公开预测结构的数据库而不公开数据和方法,那就不能算是一个好消息。但现在,结构生物学家和其他研究人员可以并且已经开始使用 AlphaFold 和 RoseTTAFold 为那些通过实验的方法难以表征的蛋白质获得更准确的结构模型。

加速结构预测

自 1953 年发现 DNA 结构以来,预测蛋白质折叠的 3D 形状一直是生物学未解决的「重大挑战」之一。在引入人工智能之前,通过序列预测结构是一个非常耗时的过程,而且几乎不能保证获得准确的结果,仍需要实验验证。
过去,确定一种蛋白质的结构需要几个月或几年的时间。但相比之下,人工智能可以在几分钟到几小时内准确预测蛋白质结构。这开辟了应用的可能性,例如,在分解微塑料等环境污染物的酶工程中。
上周的突破不仅取决于开放数据的共享,还取决于基础科学和技术的进步。
自 1960 年代以来,结构生物学家一直致力于研究理解蛋白质折叠的方法。一种是通过理解可能的力来拼凑蛋白质的结构;另一种尝试使用生物的进化史,通过与密切相关的蛋白质进行比较来预测形状。再有就是从 X 射线晶体衍射到现在的低温电子显微镜这些成像技术的重要作用。
但是,还有一些关键问题有待解决。尽管人工智能擅长产生准确的结果,但目前为止它还没有解释这些结果是如何产生的。要解开关于蛋白质折叠方式的原因,还有很多工作要做。

私有还是公开

就重要性而言,一些人正在将最新进展与 20 年前的人类基因组序列初稿进行比较。的确,人类基因组计划和人类蛋白质结构预测目录都为各自的领域配备了一种旨在显著加速发现的工具。
今天的研究团队需要开放数据访问。在向所有人公开数据和方法方面,DeepMind 现在设定了一个基准,这将使该领域的其他公司(例如 Facebook 和微软)更难继续主张专有数据。
那么,未来呢?过去一周,《Nature》杂志采访了该领域的近十几名研究人员。他们的共识是,现在准确预测人工智能应用在生命科学中会产生什么影响还为时过早,但任何的影响都将是变革性的。
尽管结构生物学中的大量新数据使 AI 能够准确预测出结果,但准确预测人工智能将如何改变生物学所需的训练数据我们还没有。对于今天和未来的研究人员来说,还有很多工作要做。
理论
1
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

推荐文章
暂无评论
暂无评论~