Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

高效且准确,郑州大学团队开发新AI工具识别药物-靶标相互作用

图片

编辑 | 枯叶蝶

准确识别药物-靶标相互作用(DTI)是药物发现和药物重新定位过程中的关键步骤之一。目前,已经提出了许多基于计算的模型来预测 DTI,并取得了一些显著的进步。

然而,这些方法很少关注如何以适当的方式融合与药物和靶标相关的多视角相似性网络。此外,如何充分结合已知的相互作用关系来准确表示药物和靶标尚未得到很好的研究。因此,仍然需要提高 DTI 预测模型的准确性。

在最新的研究中,郑州大学、电子科技大学团队提出了一种新方法 MIDTI,该方法采用多视图相似性网络融合策略和深度交互式注意机制来预测药物-靶标相互作用。

结果表明,MIDTI 在 DTI 预测任务上的表现明显优于其他基线方法。消融实验的结果也证实了多视角相似网络融合策略中注意力机制和深度交互注意力机制的有效性。

该研究以「Drug–target interaction predictions with multi-view similarity network fusion strategy and deep interactive attention mechanism」为题,于 2024 年 6 月 6 日发布在《Bioinformatics》。

图片

药物靶点交互(DTI)预测在新药研发与再利用过程中占据核心地位,传统湿实验方法成本高昂、耗时长久,促使研究者转向计算辅助的药物筛选方法来加速进程。

计算型 DTI 预测主要分为基于结构的方法、基于配体的方法和基于机器学习的方法三类。基于结构的方法依赖药物分子与靶点结构及结合位点,但受限于某些靶点如膜蛋白结构信息的缺乏;基于配体的方法则基于已知活性小分子建立模型,但在靶点结合配体数量有限时效果不佳。

近年来,机器学习方法广泛应用,通过提取药物化学结构和靶点基因序列特征进行二元分类,预测潜在 DTI。然而,目前的方法仅基于药物和靶点自身结构学习表征,忽视了 DTI 对之间的相互作用。

除化学和基因组特征外,生物实体间关系蕴含丰富语义信息,构建融合异构信息的网络有助于系统理解 DTI。但是已有的方法难以一致利用异构网络中的复杂关系。

受多视角相似性网络融合策略和深度交互式注意力机制的启发,郑州大学团队提出了一种称为 MIDTI 的预测 DTI 的新方法。

图片

图示:MIDTI的整体框架。(来源:论文)

MIDTI 的整体框架主要包含四个步骤:

首先,MIDTI 根据药物相关关联信息构建不同的药物相似性网络,并采用多视角相似性网络融合策略获得集成的药物相似性网络。MIDTI 也类似地建立了集成目标相似性网络。

其次,MIDTI 采用 GCN 作为编码器,分别从综合药物相似性网络、综合目标相似性网络、药物-目标二分网络以及药物-目标异构网络中学习药物和目标嵌入。

第三,MIDTI 利用深度交互式注意机制,根据已知的 DTI 关系学习判别嵌入。

最后,研究人员将学习到的药物-靶标对表征输入到多层感知器(MLP)中,以预测 DTI。

图片

图示:多视角药物相似性网络融合策略的四个步骤。(来源:论文)

为了评估MIDTI的性能,研究者采用了多种评估指标,包括准确率(ACC)、曲线下面积(AUC)、精确-召回曲线下面积(AUPR)、F1 分数和马修斯相关系数(MCC)。研究人员将 MIDTI 与其他十种竞争性方法进行了比较,这些方法包括随机森林图卷积网络、图注意力网络、MMGCN、GraphCDA 和 DTINet 等。

MIDTI 在 ACC、AUC 和 AUPR 指标上分别获得了 0.9340、0.9787和 0.9701 的分数,比 MMGCN 和 GraphCDA 的最高分数高出 2.55%、2.31% 和 2.30%。这表明 MIDTI 在预测药物-靶点相互作用方面是最具竞争力的方法之一。在不同正负样本比例的实验中,MIDTI 也表现出了优秀的性能。

图片

图示:对 MIDTI 在不同时期学习到的药物目标嵌入进行可视化。(来源:论文)

研究还展示了 MIDTI 学习到的药物-靶点嵌入的可视化结果,使用 t-SNE 工具将嵌入映射到二维空间。随着训练轮数的增加,正例和反例逐渐被区分开来,这证明了 MIDTI 所学习的嵌入具有良好的区分力和解释性,从而提高了 DTI 预测的准确性。

MIDTI 的核心贡献在于:它提出了一种新的多视角相似网络融合策略,可以在无监督的方式下整合不同相似网络;使用深度交互注意力机制,根据已知的 DTI 信息学习药物和靶点的判别性表示;大量实验证明 MIDTI 在 DTI 预测任务上优于其他先进的方法。

总之,MIDTI 是一种高效且准确的药物-靶点相互作用预测方法,其创新点在于利用多视角信息和深度注意力机制来增强预测能力。

研究人员表示,接下来将从以下两个方面开展工作。首先,利用药物和靶标的其他相关数据源进行嵌入学习。其次,MIDTI 可以应用于其他链接预测问题,例如 miRNA 与疾病关联预测。

相关报道:https://academic.oup.com/bioinformatics/article/40/6/btae346/7688335


理论智慧医疗人工智能药物-靶点相互作用郑州大学
相关数据
结构学习技术

结构化预测是监督学习,分类和回归的标准范式的一种推广。 所有这些可以被认为是找到一个能最大限度减少训练集损失的函数。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

随机森林技术

在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

图卷积网络技术

假设有一张图,要做分类,传统方法需要手动提取一些特征,比如纹理啊,颜色啊,或者一些更高级的特征。然后再把这些特征放到像随机森林等分类器,给到一个输出标签,告诉它是哪个类别。而深度学习是输入一张图,经过神经网络,直接输出一个标签。特征提取和分类一步到位,避免了手工提取特征或者人工规则,从原始数据中自动化地去提取特征,是一种端到端(end-to-end)的学习。相较于传统的方法,深度学习能够学习到更高效的特征与模式。

药物发现技术

在医学,生物技术和药理学领域,药物发现是发现新候选药物的过程。

推荐文章
暂无评论
暂无评论~