Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

药明康德AI作者

生物界「AlphaGo」来了!DeepMind 推出蛋白质结构预测算法,大胜人类传统模型!

重大突破!

在过去的几年里,DeepMind公司开发的人工智能AlphaGo已经在国际象棋和围棋比赛中取得了超越人类的表现。而如今,DeepMind又向推动和加速新科学发现上迈出了重要的一步。今日,DeepMind宣布推出全新的AlphaFold系统,能够预测并生成蛋白质的3D结构。这一系统在周日进行的国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手。

我们都知道,蛋白质是维持我们生命所必需的庞大而复杂的物质。我们身体的几乎所有功能,例如收缩肌肉、感知光线或将食物转化成能量等,都需要一种或多种蛋白质来完成。而蛋白质具体能做什么就要取决于它独特的3D结构了。

然而,纯粹从其基因序列中找出蛋白质的3D结构是一项非常具有挑战性的复杂任务。由于我们的DNA通常只包含蛋白质中氨基酸残基的序列信息,而这些氨基酸残基形成的长链将会折叠成错综复杂的3D结构。这就是所谓的“蛋白质折叠”问题。而蛋白质越大,需要考虑的氨基酸之间相互作用就越多,对其结构的建模过程就会更加复杂和困难。

▲每一个蛋白质都拥有错综复杂的3D结构(图片来源:DeepMind blog

错误折叠的蛋白质有可能引发阿兹海默病、帕金森病、亨廷顿舞蹈病和囊性纤维化等疾病的发生。因此,准确预测蛋白质的结构,对于理解其在人体内的作用,以及对上述疾病进行诊断和治疗是非常重要的。

在过去的五十年中,科学家们已经能够利用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验技术在实验室中确定蛋白质的形状,但每种方法都依赖于大量的试错,这可能需要花上好几年时间,而预测每个结构也要花费数万美元。幸运的是,得益于基因测序成本的快速降低,基因组学领域的数据变得丰富。因此,科学家们开始利用AI技术开发深度学习算法,在基因组学数据的基础上对蛋白质结构进行预测。在此基础上,AlphaFold诞生了。和以往方法不一样的是,AlphaFold并未使用已经明确结构的蛋白质3D模型作为模板,而是从头开始探索预测方法。

DeepMind团队使用的方法都以深度神经网络为基础,来从基因序列中预测蛋白质的两种物理性质:氨基酸对之间的距离及连接这些氨基酸的化学键之间的角度。首先,研究小组训练了一个深度神经网络,来预测蛋白质中每对氨基酸残基之间距离的分布情况。然后,研究人员将这些数值转化为评分,来对蛋白质结构的精确程度进行评估。同时,研究人员还另外训练了一个神经网络,利用这些距离数值来评估预测结构与真实结构的接近程度。

▲AlphaFold的模型示意图(图片来源:DeepMind blog)如果你以为这就是AlphaFold能做的全部事情,那可就大错特错了。事实上,DeepMind的研究人员在这些评分函数的基础上,还使用了两种全新的方式来优化蛋白质结构评分:他们使用了一个生成神经网络,不断生成新的蛋白质片段来反复替换一段旧的蛋白质结构,这样一来,蛋白质结构的评分就被不断提高了。另外,研究人员还使用了一种名为梯度下降的方式来让AlphaFold预测的结构变得高度精确。梯度下降是一种机器学习中常用的数学技术,用来实现渐进式的细微改进。研究人员将这项技术用于整个蛋白质链,而不是结构中组装前必须分开折叠的片段,降低了预测过程的复杂性。

▲图中绿色为蛋白质的真实结构,蓝色为AlphaFold预测得出的结构(图片来源:DeepMind blog)AlphaFold的实际表现也非常强劲:在比赛中,AlphaFold 在 98 名参赛者中名列榜首,预测了 43 种蛋白质中 的25 种最准确结构,而同一类别的第二名参赛队伍只预测出了43 种中的 3 种。 

研究人员表示,AlphaFold的成功表明了机器学习系统能够整合多种信息来源,从而帮助科学家们快速为复杂问题提出创造性的解决方案。他们在博客中写道:“正如AI通过AlphaGo和AlphaZero这样的系统,能够帮助人们掌握复杂的游戏一样,我们同样希望有一天,AI取得的突破也能帮助我们掌握基本的科学问题。”

研究人员还表示,这项研究能够帮助科学家们更有效地设计出治疗疾病的新方法,能够在药物发现的过程中开发出新的潜力,同时也降低了实验相关的成本,有望改善全世界数百万患者的生活质量。

参考资料:

[1] AlphaFold: Using AI for scientific discovery. Retrieved December 3, 2018, from https://deepmind.com/blog/alphafold/

[2] Google's DeepMind predicts 3D shapes of proteins. Retrieved December 3, 2018, from https://www.theguardian.com/science/2018/dec/02/google-deepminds-ai-program-alphafold-predicts-3d-shapes-of-proteins

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业Deepmind蛋白质AlphaFold深度学习深度神经网络梯度下降
1
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

阿尔法围棋技术

阿尔法围棋是于2014年开始由英国伦敦Google DeepMind公司开发的人工智能围棋程序。AlphaGo是第一个打败人类职业棋手的计算机程序,也是第一个打败围棋世界冠军的计算机程序,可以说是历史上最强的棋手。 技术上来说,AlphaGo的算法结合了机器学习(machine learning)和树搜索(tree search)技术,并使用了大量的人类、电脑的对弈来进行训练。AlphaGo使用蒙特卡洛树搜索(MCTS:Monte-Carlo Tree Search),以价值网络(value network)和策略网络(policy network)为指导,其中价值网络用于预测游戏的胜利者,策略网络用于选择下一步行动。价值网络和策略网络都是使用深度神经网络技术实现的,神经网络的输入是经过预处理的围棋面板的描述(description of Go board)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

梯度下降技术

梯度下降是用于查找函数最小值的一阶迭代优化算法。 要使用梯度下降找到函数的局部最小值,可以采用与当前点的函数梯度(或近似梯度)的负值成比例的步骤。 如果采取的步骤与梯度的正值成比例,则接近该函数的局部最大值,被称为梯度上升。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~