Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

使用深度神经网络整合药物与疾病关联数据进行药物再利用

编辑 | 萝卜皮

药物再利用是指识别 FDA 批准的用于治疗特定疾病的新药物靶点。由于新药发现失败的高风险,药物再利用被视为药物研发重要途径。

伊朗大不里士大学(University of Tabriz)的研究人员提出了一个模型,使用深度神经网络整合药物与疾病关联数据进行药物再利用。

该模型被称为 IDDI-DNN,主要构建药物相关属性(三个矩阵)、疾病相关属性(两个矩阵)和药物与疾病关联(一个矩阵)的相似性矩阵。然后,受益于相似性网络融合方法,通过两步过程将这些矩阵整合成一个唯一的矩阵。该模型使用构建的矩阵通过卷积神经网络预测新型和未知的药物与疾病的关联。

该研究以「A novel efficient drug repurposing framework through drug-disease association data integration using convolutional neural networks」为题,于 2023 年 11 月 22 日发布在《BMC Bioinformatics》。


药物再利用是指药物除原始和批准用途之外的新用途。近年来,与传统药物生产方法相比,药物再利用因其降低成本和低失败率而引起了大多数制药公司的关注。药物再利用有助于为已完成临床前安全性研究的疾病确定新的、低成本和短时间的治疗方法。

传统的治疗方法研发产生新的治疗方案需要近17年的时间,其成功率还不到10%。因此,迫切需要生产新的药物来治疗那些药物会给患者带来副作用的疾病。最近的研究报告显示,约有七千种罕见疾病尚无有效治疗方法,影响着全球 4 亿多人。

近年来,研究人员开展了药物再利用的研究。这些研究主要是对药物再利用方法及其成功案例的分析和描述。此类研究的主要挑战是在间接影响研究结果的数十万个额外基因中鉴定某种药物的真正靶分子。经典的统计模型和方法无法有效地在数千个基因中发现和区分某种药物的靶分子。

近年来,研究人员的努力转向了机器学习(ML)等预测模型,这些模型用于在药物生产过程中或在药物进入市场之前发现药物与疾病的关联。用于此目的的两种主要机器学习方法是基于网络的和基于相似性的。最近引入了基于网络的机器学习方法来预测药物与疾病的关联。因为它们能够提取和整合多种信息源的知识,例如化学、生物、靶标、基因组和药物来源。

为了提高药物与疾病关联的预测性能,大不里士大学的研究团队提出了一种利用分子特征以及与药物和疾病相关的多重相似性的计算方法。这种称为 IDDI-DNN(通过深度神经网络进行药物再利用的药物-疾病关联整合)的方法整合了药物和疾病之间的多种相似性,并利用深度神经网络来捕获它们之间的相似性。


图:IDDI-DNN 方法概述。(来源:论文)

该方法首先通过三个步骤将与药物、疾病以及药物与疾病关联相关的多个数据整合到一个独特的相似性矩阵中,然后使用构建的矩阵来训练卷积神经网络(CNN)。

引入的模型 IDDN-DNN 集成了从药物和疾病的不同资源中提取的多个数据,以准确地重新调整药物用于疾病的用途。除了药物与疾病的关联信息外,这些数据还包括每种药物的化学结构、副作用和目标蛋白,以及每种疾病的人类表型和目标蛋白。该数据被集成到单个矩阵 F 中,并接受基于 CNN 的深度网络来训练模型。训练后,该模型用于重新调整药物治疗目标疾病的用途。

该模型用于建议针对目标疾病的合适药物。此外,还评估了该方法的稳健性和可靠性,并与之前引入的方法的性能进行了比较。IDDI-DNN 通过使用基准数据集在接收器操作特性 (ROC) 和精确召回 (PR) 性能指标方面优于多种最先进的方法。

预测新的药物与疾病之间的关联关系到已知关联关系的改善是最困难的挑战之一。IDDI-DNN已经证明了其优越性,在该领域取得了丰硕的成果。

论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-023-05572-x

产业卷积神经网络神经网络
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

统计模型技术

统计模型[stochasticmodel;statisticmodel;probabilitymodel]指以概率论为基础,采用数学统计方法建立的模型。有些过程无法用理论分析方法导出其模型,但可通过试验测定数据,经过数理统计法求得各变量之间的函数关系,称为统计模型。常用的数理统计分析方法有最大事后概率估算法、最大似然率辨识法等。常用的统计模型有一般线性模型、广义线性模型和混合模型。统计模型的意义在对大量随机事件的规律性做推断时仍然具有统计性,因而称为统计推断。常用的统计模型软件有SPSS、SAS、Stata、SPLM、Epi-Info、Statistica等。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

关联数据技术

关联数据是一组用来描述用户任务运行环境以及在区域中连接用户任务方式的信息。用户任务是与用户定义的事务相关的任务,或与 CICS® 提供的事务相关的任务。CEMT 是通常由操作员启动的用户启动任务示例,CSMI 是由系统代表用户启动事务启动的任务示例。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~