《自然》子刊:AI助力从靶点到候选分子仅需3周!药明康德协助研究

从选择一个靶点,到形成潜在的新药候选分子,这个过程需要多长的时间?过去的回答可能是数月,乃至数年。但在今日,来自Insilico Medicine、药明康德、以及多伦多大学的科学家们在《自然》子刊Nature Biotechnology上给出了不同的答案。利用人工智能技术,他们将这一数字缩短到了短短21天!

这一技术有望为早期药物发现带来变革。众所周知,新药研发之路并非坦途。在高达近9成的失败率面前,每一款上市新药的背后,都是平均10多年的漫长道路,以及20多亿美元的高昂开支。其中,光是早期药物发现,就占去了将近一半的成本。

为了突破这一瓶颈,业内诸多创新者在近年来不断尝试各种技术,而人工智能就是他们的选择之一:通过快速寻找到具有成药潜力的分子,人工智能有望加速新药发现的进程,并减少所需的成本。但美好的愿景之下,我们也不得不承认,由人工智能进行设计,且能够在实验中证实自身潜力的分子,还非常少见。

药明康德AI相关阅读:人工智能遇上新药研发,它能给医药行业带来什么?这正是本篇论文的一大亮点所在。在研究中,科学家们首先将DDR1设为目标靶点。这是一种在上皮细胞中表达的酪氨酸激酶,参与到了组织纤维化(fibrosis)的进程之中。为了寻找到潜在的DDR1抑制剂,研究人员们开发了一种机器学习算法,用于设计新药分子。

▲本研究的算法示意图(图片来源:参考资料[1])

具体来看,这个算法的训练用到了多个不同的数据库。其中最大的一个数据库里包含海量的分子结构,其他的数据库则分别为已知的DDR1抑制剂及其3D结构、具有激酶抑制剂活性的常见分子(作为正对照)、无法靶向激酶结构的分子(作为负对照)、以及已被医药企业申请专利的分子。

在对数据库进行优化之后,研究人员们使用了强化学习的方法,初步得到了大约3万个不同的结构。随后,他们又根据反应基团与化学空间等指标,对所得到的结构做了进一步的筛选。完成这些潜在新药分子的筛选时,距离最初确认DDR1为目标靶点,仅仅过去了21天!

接下来,就是实际检验这些分子的成药潜力了。从筛选结果中,研究人员们随机挑选出了40个结构,其中39个具有新颖性。从中,科学家们根据合成的难易程度,挑选出了6个分子,用作后续的体外与体内实验。

▲对候选分子进行药代动力学分析和作用机理探索(图片来源:参考资料[1])体外实验结果表明,其中的2个化合物对于DDR1具有很高的抑制性。在细胞系中,这两个化合物同样展现了可喜的DDR1抑制能力,且能有效降低与纤维化进程有关的标志物。最后,研究人员们选择1号化合物进行动物实验。结果表明,无论是通过静脉注射,还是通过口服,它的药代动力学特性均令人满意。

值得一提的是,在人工智能技术与研发人员的协同下,在选定靶点的46天后,新筛选出的分子就完成了初步的生物学验证。此外,科学家们也决定公开该算法的源代码,供产业更多研发人员使用。

▲选定靶点的46天后,新筛选出的分子就完成了初步的生物学验证(图片来源:参考资料[1])在论文的最后,研究人员们也指出,在迈入临床试验之前,由人工智能设计出的分子还有进一步优化的空间。但考虑到新药研发周期之漫长,能在早期新药发现过程中缩短时间,已是一个喜人的进步。我们也期待在人工智能的助力下,未来能够更多新药的研发得到加速,最终造福全球病患!

本文题图来自Pixabay。

参考资料:

[1] Alex Zhavoronkov et al., (2019), Deep learning enables rapid identification of potent DDR1 kinase inhibitors, Nature Biotechnology, DOI: https://doi.org/10.1038/s41587-019-0224-x

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业新药研发
2
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~