Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

对小鼠有效的药物在人身上总是失败?看看AI对此有何高招!

我们对疾病的了解大多来自使用小鼠进行的研究,而这些小鼠都是专门培育的,具有被研究疾病的特征。而我们每研发一种新药,都必须首先在小鼠身上进行试验,直到有了一定程度的安全性和有效性为止。但是小鼠毕竟不是人类。这两个物种之间存在的差异,有可能会成为将实验室研究转化为对患者和临床医生有意义成果过程中的绊脚石。 

到目前为止,对物种差异的认识还没有系统地纳入到动物模型的解释中。为了克服这个巨大的问题,一群来自美国和以色列的科学家开发了一个名为“Found In Translation”(下文简称FIT)的机器学习模型,能够将小鼠模型的研究数据转化为人类疾病的数据,从而对于基于小鼠的研究结果进行更准确和更有效的推断。该研究论文发表在了《Nature Methods》上。

▲小鼠和人类之间存在的差异,有可能成为将实验室研究转化为对患者和临床医生有意义成果过程中的障碍(图片来源:CytoReason / Technion)

该研究的核心是将人类和小鼠模型数据集分别与一个人类疾病的对照条件数据集进行配对,以产生跨物种组合。对于每个跨物种组合来说,需要计算出疾病和对照样本之间的差异。这些结果将用于研究在相似的条件下,不同的人和小鼠基因是如何表达的,同时将这些结果输入到FIT模型中。 

根据研究论文内容,要将小鼠模型数据转化为人体模型数据,FIT模型需要遵循三个步骤: 

  • 首先,需要计算出每个数据集中的每个人类基因效应的数值;

  • 然后,通过对数据进行建模和重新采样,来学习小鼠与人之间关系的基因级统计模型

  • 最后,通过计算重新采样产生的效应估值的平均值,来预测人类的基因效应数值。

▲左图:现在使用的将小鼠数据转化到人体的方法示意图,这种方式并不能体现物种之间的差异;右图:FIT模型的转化方式示意图,通过学习小鼠和人类的基因表达方式来转化数据(图片来源:CytoReason / Technion

研究人员在28种针对不同人类疾病的小鼠研究模型上对FIT进行了测试。测试结果显示,FIT模型的表现优于从小鼠模型结果直接进行跨物种推导得到的结果。在预先识别的疾病条件下,差异表达基因的重叠率增加了20%-50%。同时,FIT发现了新的疾病相关基因,识别出了那些本来可能被遗漏的信号,并减少了错误的信息,而无需花费额外的实验成本。

“这是一个真正的突破。许多似乎对小鼠有效的药物都在临床研发中失败了。而这项研究将有助于弥合临床前结果与临床结果之间的差距”,论文的通讯作者、CytoReason 首席科学家 Shai Shen-Orr教授表示:“它展示了我们一直不断增长和丰富着的数据集的力量,为我们专有的机器学习技术和独特的方法论提供了动力,从而改善整体药物开发和临床结果。”

参考资料:

[1] AI turns mice to men (and women) bridging drug development translation barrier. Retrieved November 27, 2018, from https://www.eurekalert.org/pub_releases/2018-11/c-atm112618.php

[2] Normand, et al., (2018). Found In Translation: a machine learning model for mouse-to-human inference. Nature Methods, doi: https://doi.org/10.1038/s41592-018-0214-9

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业机器学习药物研发数据集
1
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

统计模型技术

统计模型[stochasticmodel;statisticmodel;probabilitymodel]指以概率论为基础,采用数学统计方法建立的模型。有些过程无法用理论分析方法导出其模型,但可通过试验测定数据,经过数理统计法求得各变量之间的函数关系,称为统计模型。常用的数理统计分析方法有最大事后概率估算法、最大似然率辨识法等。常用的统计模型有一般线性模型、广义线性模型和混合模型。统计模型的意义在对大量随机事件的规律性做推断时仍然具有统计性,因而称为统计推断。常用的统计模型软件有SPSS、SAS、Stata、SPLM、Epi-Info、Statistica等。

推荐文章
暂无评论
暂无评论~