Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

用于分子设计和优化的AI平台Chemistry42,快速设计新的分子结构

编辑 | 绿萝

Insilico Medicine(英矽智能)是一家由人工智能驱动的端到端创新药物研发公司。

Insilico 是最早发布一种使用深度对抗模型生成新化合物的方法的小组之一。2020 年,Insilico 推出用于从头设计和优化小分子的软件平台 Chemistry42,将最先进的生成 AI 算法与药物和计算化学方法连接起来,来生成具有优化特性的新型分子结构。

近日,Insilico 的科学家在《Journal of Chemical Information and Modeling》上发表了关于使用 Chemistry42 平台快速设计新的分子结构,这些结构针对在疾病进展中发挥重要作用的蛋白质。

「Chemistry42 是一个主动学习系统,它依赖于 42 种经过预训练的生成算法来设计类药物分子结构。他们利用各种分子表示、基础算法和策略来彻底探索化学空间,」Insilico Medicine 人工智能平台负责人 Petrina Kamya 博士说。「该系统受益于与制药公司的持续合作,这些公司的反馈随着时间的推移加强并验证了其性能和结果。」

论文链接:https://pubs.acs.org/doi/10.1021/acs.jcim.2c01191

Chemistry42 平台的生成能力概述

Chemistry42 是一个将最先进的生成 AI 算法与医学和计算化学专业知识以及最佳工程实践联系起来的平台。它于 2020 年推出,已被 20 多家制药公司、超过 15 个外部程序和 30 多个内部程序使用。

该平台的主要目标是加速具有用户定义属性的新型分子的设计。Chemistry42 的一般工作流程如下图所示。

图 1:使用 Chemistry42 平台进行从头生成实验的三步工作流程示意图。(来源:论文)

生成实验是使用 Chemistry42 用户友好的基于 Web 的界面创建的,并且可以根据所选目标的可用信息使用基于配体或结构的药物设计工作流程开始。基于配体的药物设计 (Ligand-Based Drug Design,LBDD) 方法需要 2D 或 3D 配体结构作为 .sdf 文件、SMILES 字符串的输入,或者可以使用方便的草绘器面板直接在平台上绘制分子草图。还可以根据需要添加药效团假设,并使用小部件手动创建或在平台内自动创建。

在基于结构的药物设计 (Structure-Based Drug Design,SBDD) 方法中,蛋白质靶标的结构,无论是 apo 格式还是与配体的复合物,都必须作为准备好的 .pdb 文件上传到平台。可以选择配体周围的 pocket(配体结合位点)或从 Pocket Scanner Module 模块指示的一组替代 pocket 中选择一个。与 LBDD 的情况一样,也可以根据需要添加药效团假设。

图 2:用于配置 SBDD 生成实验的 Chemistry42 界面。(来源:论文)

下图为生成管道的早期版本(在 Chemistry42 推出之前)用于展示生成算法设计经过实验验证的类药物分子结构的能力。

图 3:案例研究 1 中的 GENTRL 模型于 2018 年生成了 DDR1 抑制剂。(来源:论文)

对 Chemistry42 中的生成模型进行基准测试

本文着重于两个具体案例研究。第一个于 2019 年发表在 Nature Biotechnology 上,它依赖于 Chemistry42 的最早化身,即 GENTRL 模型。在 ZINC 数据集上进行训练,然后进一步关注 DDR1 抑制剂和公开可用的激酶抑制剂数据集,该系统产生了 40 个结构。其中,选择了六个用于合成和实验验证。35 天后,这些化合物被合成并在体外测试以抑制 DDR1 活性,发现有四种具有活性。

论文链接:https://www.nature.com/articles/s41587-019-0224-x

「随着生成式人工智能生成有趣的文本和图像成为头条新闻,我们团队在 2015 年首次提出的一些生成式化学工具,在 2016 年发表了第一批理论论文,在 2018 年发表了实验论文,现在已经达到了工业实力和深入的市场渗透。」 Insilico Medicine 创始人兼首席执行官 Alex Zhavoronkov 博士说。「许多生成引擎现在已经通过集成在 Chemistry42 中的 40 多种生成算法进行了验证。此外,我们还借助该平台生成了临床阶段的治疗方案。我很高兴看到应用论文,它概述了我们从理论到实践的路径,现在许多使用 Chemistry42 的科学家在发表他们的人工智能生成的分子时都可以引用它。」

第二个案例研究来自 Insilico 最近将 AlphaFold2 预测的蛋白质结构应用于 Chemistry42 平台,以生成一种新型 CDK20 抑制剂,CDK20 是一种有前途的肝细胞癌药物靶点。总共设计了 8,918 个分子,并优先考虑了 54 个具有独特支架和不同铰链粘合剂配置文件的分子。确定了一个命中分子,并且两种化合物在第二轮中显示出对预期目标的强大效力。该研究是与多伦多大学加速联盟的人工智能专家合作完成的,并发表在《Chemical Science》杂志上。这些发现证明了 AI 系统如何协同工作以在结构数据有限的情况下产生新的疗法。

论文链接:https://pubs.rsc.org/en/content/articlelanding/2023/SC/D2SC05709C

Chemistry42 互操作性

Chemistry42 可通过构建在具有可扩展云架构的分布式云平台之上的 Web 界面访问。该实施集成了旨在优化性能的各种功能,包括使用 Kubernetes 进行集群管理、多个灵活的工作流以及集成监控和日志记录。Chemistry42 平台的结构和互操作性允许其部署在 AWS 或 Azure 云上或作为 SaaS 解决方案。对于任一部署场景,该平台都可以集成到已经建立的工作流程中。

Chemistry42 可以连接到 Insilico Medicine 的生物信息学网络服务 PandaOmics (https://pandaomics.com)。PandaOmics 是一个用于分析组学数据的综合计算套件,可提供对从疾病特征到预期目标和现有药物的各种信息的访问。

图 4:PandaOmics 和 Chemistry42 平台集成到你的药物发现管道中。这些平台的互操作性允许目标识别和 de novo 小分子生成之间的有效交互。(来源:论文)

Chemistry42 平台是一个可定制的工作环境,提供为从头分子设计开发的最先进的 AI 技术。灵活、用户友好的界面使 Chemistry42 可供药物和计算化学家、AI 专家以及在药物发现领域工作的其他科学家使用。Chemistry42 的协作性质促进并促进了不同科学界之间的关系,并促进了决策过程——这一过程在药物设计领域要求极高。

Chemistry42 平台地址:https://chemistry42.com

Insilico Medicine 公司官网:https://insilico.com/

参考内容:https://www.eurekalert.org/news-releases/978920

产业
暂无评论
暂无评论~