编辑 | 萝卜皮
目录
- 郑州大学团队:使用基因表达和深度学习与 KL 发散基因选择预测肺癌
- 北航团队:基于部分互信息的基因共表达网络用于基因间关系和基因-癌症相关性分析
- 北航团队:应用机器学习,从根本上减少了用于疾病诊断的细胞计数工作量
- 人工智能引导的签名揭示了 MIS-C 和川崎病的共同宿主免疫反应
- 使用人工智能预测狗狗体内危及生命的细菌性疾病
郑州大学团队:使用基因表达和深度学习与 KL 发散基因选择预测肺癌
肺癌是中国死亡率最高的癌症之一。近年来,随着高通量测序技术的快速发展以及深度学习方法的研究和应用,基于基因表达的深度神经网络已成为近年来肺癌诊断的热门研究方向,为肺癌的早期诊断提供了有效途径。
因此,构建深度神经网络模型对于肺癌的早期诊断具有重要意义。然而,挖掘基因表达数据集的主要挑战是维度灾难和数据不平衡。一些研究人员提出的现有方法,无法解决高维和数据不平衡的问题,因为测量的变量(基因)数量过多而样本数量很少,导致肺癌早期诊断效果不佳。
针对基因表达数据集数据集小、维度高、数据不平衡的缺点,郑州大学的研究人员提出了一种基于KL散度的基因选择方法,选择一些 KL 散度较高的基因作为模型特征。然后使用 Focal Loss 作为损失函数构建深度神经网络模型,同时使用 k-fold 交叉验证方法来验证和选择最佳模型。
结果表明,该研究提出的基于 KL 散度基因选择的深度学习模型方法在验证集上的 AUC 为 0.99。模型的泛化性能很高。说明基于 KL 发散基因选择的深度神经网络模型,是一种准确有效的肺癌预测方法。
该研究以「Prediction of lung cancer using gene expression and deep learning with KL divergence gene selection」为题,于 2022 年 5 月12 日发布在《BMC Bioinformatics》。
论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-022-04689-9
北航团队:基于部分互信息的基因共表达网络用于基因间关系和基因-癌症相关性分析
寻找相关模式是分析生物数据的一个重要目标。目前可用的相关分析方法主要使用非直接关联,如 Pearson 相关系数,侧重于模块级别的网络解释。对于基因等生物对象,它们的集体功能取决于成对的基因间相互作用。然而,来自模块级方法的大量冗余结果通常需要进一步详细分析基因相互作用。测量变量之间直接关联的新方法,例如部分互信息(PMI),可以帮助我们更好地解释变量对级别的生物数据的相关模式。
北京航空航天大学的研究人员使用 PMI 来计算癌症 mRNA 转录组数据的基因共表达网络。结果表明,具有较少边缘的基于 PMI 的网络可以代表相关模式并且在生物条件下是稳健的。与基于 Pearson 相关系数 (PCC) 的网络相比,基于 PMI 的网络可以回忆起组学定义的基因对关系中更重要的部分。根据来自 PMI 回忆的拷贝数变异或 DNA 甲基化基因对的评分,可以将癌症患者分为在疾病特异性存活率上有显着差异的组。
PMI,测量变量之间的直接关联,在基因对水平上提取比传统的间接关联测量更重要的生物学关系。它可用于从其他相关方法中细化模块级结果。特别是,PMI 有利于分析复杂系统的生物学数据,例如癌症转录组数据。
该研究以「Gene co-expression network based on part mutual information for gene-to-gene relationship and gene-cancer correlation analysis」为题,于 2022 年 5 月 24 日发布在《BMC Bioinformatics》。
论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-022-04732-9
北航团队:应用机器学习,从根本上减少了用于疾病诊断的细胞计数工作量
细胞分割和计数在医学领域发挥着非常重要的作用。许多疾病的诊断很大程度上依赖于血液中细胞的种类和数量。卷积神经网络在图像分割上取得了令人鼓舞的结果。然而,这种数据驱动的方法需要大量的注释,并且可能是一个耗时且昂贵的过程,容易出现人为错误。
在这项研究中,北京航空航天大学的研究人员提出了一种新的框架来分割和计数细胞,而无需太多手动注释的细胞图像。
在训练之前,他们使用传统算法在单一细胞图像上生成细胞图像标签。然后使用这些图像形成带有标签的训练集。由不同种类的细胞图像组成的不同训练集被呈现给分割模型以更新其参数。最后,使用手动标记的混合细胞图像的小数据集转移预训练的 U-Net 模型以分割混合细胞图像。
为了更好地评估所提出方法的有效性,该团队设计并训练了一个新的自动细胞分割和计数框架。测试结果和分析表明,该方法训练的框架的分割和计数性能与大量带注释的混合细胞图像训练的模型相当。
该研究以「Auto-CSC: A Transfer Learning Based Automatic Cell Segmentation and Count Framework」为题,于 2022 年 4 月 9 日发布在《Cyborg and Bionic Systems》。
论文链接:https://spj.sciencemag.org/journals/cbsystems/2022/9842349/
相关报道:https://techxplore.com/news/2022-05-machine-radically-workload-cell-disease.html
人工智能引导的签名揭示了 MIS-C 和川崎病的共同宿主免疫反应
儿童多系统炎症综合征 (MIS-C) 是一种在 COVID-19 大流行期间出现的疾病,但与川崎病 (KD) 大流行前综合征具有许多临床特征。
在这里,加州大学圣地亚哥分校的研究人员使用在 SARS-CoV-2 感染背景下开发的两个基因特征的计算工具箱来比较这两种综合征,即病毒大流行(ViP)和严重的 ViP 特征,以及之前证明可诊断 KD 的 13 个转录物特征,并验证了他们在全血 RNA 序列、血清细胞因子和福尔马林固定心脏组织中的发现。结果表明,KD 和 MIS-C 与 2019 冠状病毒疾病处于相同的宿主免疫应答连续体中。
这两种儿科综合征都集中在以 IL15/IL15RA 为中心的细胞因子风暴上,这表明免疫发病机制的共同近端途径;然而,它们在其他实验室参数和心脏表型方面存在差异。ViP 特征揭示了 MIS-C 中独特的靶向细胞因子途径,与 KD 相比,MIS-C 在严重程度谱中的位置更靠前,并确定了可用于监测严重程度的关键临床(心功能降低)和实验室(血小板减少和嗜酸性粒细胞减少)参数。
该研究以「An Artificial Intelligence-guided signature reveals the shared host immune response in MIS-C and Kawasaki disease」为题,于 2022 年 5 月 16 日发布在《Nature Communications》。
论文链接:https://www.nature.com/articles/s41467-022-30357-w
使用人工智能预测狗狗体内危及生命的细菌性疾病
钩端螺旋体病是一种狗可以从被钩端螺旋体细菌污染的饮用水中感染的疾病,可导致肾功能衰竭、肝病和严重的肺部出血。早期发现这种疾病至关重要,可能意味着生与死之间的差异。
加州大学戴维斯分校兽医学院的兽医和研究人员发现了一种通过使用人工智能来预测狗的钩端螺旋体病的技术。在对各种模型进行了数月的测试后,该团队开发了一种优于传统测试方法的模型,并提供了对该疾病的准确早期检测。
该研究以「Use of machine-learning algorithms to aid in the early detection of leptospirosis in dogs」为题,于 2022 年 5 月 21 日发布在《Journal of Veterinary Diagnostic Investigation》。
论文链接:https://journals.sagepub.com/doi/10.1177/10406387221096781
相关报道:https://phys.org/news/2022-05-artificial-intelligence-life-threatening-bacterial-disease.html