我们对疾病的了解大多来自使用小鼠进行的研究,而这些小鼠都是专门培育的,具有被研究疾病的特征。而我们每研发一种新药,都必须首先在小鼠身上进行试验,直到有了一定程度的安全性和有效性为止。但是小鼠毕竟不是人类。这两个物种之间存在的差异,有可能会成为将实验室研究转化为对患者和临床医生有意义成果过程中的绊脚石。
到目前为止,对物种差异的认识还没有系统地纳入到动物模型的解释中。为了克服这个巨大的问题,一群来自美国和以色列的科学家开发了一个名为“Found In Translation”(下文简称FIT)的机器学习模型,能够将小鼠模型的研究数据转化为人类疾病的数据,从而对于基于小鼠的研究结果进行更准确和更有效的推断。该研究论文发表在了《Nature Methods》上。
▲小鼠和人类之间存在的差异,有可能成为将实验室研究转化为对患者和临床医生有意义成果过程中的障碍(图片来源:CytoReason / Technion)
该研究的核心是将人类和小鼠模型数据集分别与一个人类疾病的对照条件数据集进行配对,以产生跨物种组合。对于每个跨物种组合来说,需要计算出疾病和对照样本之间的差异。这些结果将用于研究在相似的条件下,不同的人和小鼠基因是如何表达的,同时将这些结果输入到FIT模型中。
根据研究论文内容,要将小鼠模型数据转化为人体模型数据,FIT模型需要遵循三个步骤:
首先,需要计算出每个数据集中的每个人类基因效应的数值;
然后,通过对数据进行建模和重新采样,来学习小鼠与人之间关系的基因级统计模型;
最后,通过计算重新采样产生的效应估值的平均值,来预测人类的基因效应数值。
▲左图:现在使用的将小鼠数据转化到人体的方法示意图,这种方式并不能体现物种之间的差异;右图:FIT模型的转化方式示意图,通过学习小鼠和人类的基因表达方式来转化数据(图片来源:CytoReason / Technion)
研究人员在28种针对不同人类疾病的小鼠研究模型上对FIT进行了测试。测试结果显示,FIT模型的表现优于从小鼠模型结果直接进行跨物种推导得到的结果。在预先识别的疾病条件下,差异表达基因的重叠率增加了20%-50%。同时,FIT发现了新的疾病相关基因,识别出了那些本来可能被遗漏的信号,并减少了错误的信息,而无需花费额外的实验成本。
“这是一个真正的突破。许多似乎对小鼠有效的药物都在临床研发中失败了。而这项研究将有助于弥合临床前结果与临床结果之间的差距”,论文的通讯作者、CytoReason 首席科学家 Shai Shen-Orr教授表示:“它展示了我们一直不断增长和丰富着的数据集的力量,为我们专有的机器学习技术和独特的方法论提供了动力,从而改善整体药物开发和临床结果。”
参考资料:
[1] AI turns mice to men (and women) bridging drug development translation barrier. Retrieved November 27, 2018, from https://www.eurekalert.org/pub_releases/2018-11/c-atm112618.php
[2] Normand, et al., (2018). Found In Translation: a machine learning model for mouse-to-human inference. Nature Methods, doi: https://doi.org/10.1038/s41592-018-0214-9