Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

比原始分辨率高36倍,北航、清华团队用AI在多空间组学平台上高分辨率表征组织,登Nature子刊

编辑 | 萝卜皮

空间组学的最新进展已将分子类别分析的范围扩展到转录组学之外。然而,许多此类技术都受到空间分辨率的限制,阻碍了科学家深入表征复杂组织结构的能力。现有的计算方法主要侧重于转录组学数据的分辨率增强,缺乏针对各种组学类型的新兴空间组学技术的适应性。

在这里,北京航空航天大学和清华大学的研究人员提出了 soScope,这是一个统一的生成框架,旨在提高从各种空间组学技术获得的分子谱的数据质量和空间分辨率。

soScope 可以汇总来自组学、空间关系和图像的多模态组织信息,并通过分布先验与组学特定建模联合推断出具有增强分辨率的组学谱。

通过对 Visium、Xenium、spatial-CUT&Tag、slide-DNA/RNA-seq 等多种空间组学平台的综合评估,soScope 提高了识别具有生物学意义的肠道和肾脏结构的性能,揭示了无法以原始分辨率解决的胚胎心脏结构,并纠正了测序和样本处理中出现的样本和技术偏差。

此外,soScope 扩展到空间多组学技术 spatial-CITE-seq 和空间 ATAC-RNA-seq,利用跨组学参考同时进行多组学增强。soScope 提供了一种多功能工具来提高不断扩展的空间组学技术和资源的利用率。

该研究以「Tissue characterization at an enhanced resolution across spatial omics platforms with deep generative model」为题,于 2024 年 8 月 2 日发布在《Nature Communications》。

图片

组织是由具有不同分子状态和空间组织的细胞构成的。空间组学技术近年来取得了显著进展,可以在保持空间背景的同时,对各种分子类别进行空间分析。

这些技术在多种生物领域中提供了重要见解,虽然取得了早期成功,但仍面临两个主要挑战:冷冻或福尔马林固定的组织可能影响分子状态,降低测序准确性;同时,大多数技术的空间分辨率有限,难以揭示组织结构的细微异质性。

虽然计算技术能够改善空间组学数据的分辨率,但目前的方法大多仅针对单一组织模态,难以充分利用多模态信息。

在这里,北航和清华的研究团队引入了空间组学范围(soScope),这是一个完全生成的框架,它模拟来自不同空间组学技术的点级概况的生成过程,旨在提高它们的空间分辨率和数据质量。

为了实现这一目标,soScope 将每个点视为增强空间分辨率的“子点”的集合,其组学特征与空间位置和形态模式相关。

然后,soScope 使用多模态深度学习框架整合斑点组学概况、空间关系和高分辨率形态学图像,并联合推断子斑点分辨率下的组学概况。通过选择组学特定分布,soScope 可以对不同的空间组学数据进行精确建模和减少变异。

图片

图示:soScope 及其应用的概述。(来源:论文)

soScope 提供了一种统一的工具,该工具结合了多模态组织图谱,以增强具有不同分子类别的组学图谱。soScope 可以有效提高空间分辨率,减少不必要的变化,并能够表征无法在原始分辨率下检测到的复杂组织结构。

图片

图示:对来自多种组织和平台的空间转录组学数据集上的 soScope 进行评估。(来源:论文)

该团队广泛评估了 soScope 对通过多种空间技术分析的多种分子类型的有效性和普遍性,包括 Visium、Xenium、spatial-CUT&Tag、slide-DNA-seq、slide-RNA-seq、spatial-CITE-seq 和 spatial ATAC-RNA-seq。

在健康和患病组织中,soScope 改进了组织域识别,提高了已知标记的可区分性,并纠正了数据和技术偏差。该方法能够揭示比原始分辨率高出 36 倍的更精细的组织结构。它可以有效地适应空间多组学数据,以同时增强多组学概况。

研究人员注意到,有几种基于成像的空间组学技术,例如 seqFISH、STARmap 和 MERFISH,它们可以直接实现单细胞分辨率的空间分析,但代价是组学通量较低和组织区域较小。虽然 soScope 为预先指定的亚点或细胞位置提供了增强的配置文件,但它可能无法达到亚细胞分辨率。

图片

图示:使用空间 CITE-seq 将多组学 soScope 应用于来自人体皮肤组织的空间蛋白质 + 转录数据集。(来源:论文)

为了进一步提高分辨率,可以修改 soScope 以包含来自同一组织的配对单细胞组学数据,以更高分辨率为亚点推断提供信息。此外,soScope 还整合了 H&E 图像作为输入,在某些临床研究中,人类专家可以轻松对其进行注释。研究人员可以修改 soScope,以整合人类标签并以半监督方式指导后验推理,以改进潜在表征和概况学习。

对于包含来自同一器官的多个连续切片的较大数据集,soScope 可以在部分数据上进行训练并应用于其余组织切片,以降低计算成本。

随着可用空间组学数据资源的不断扩展和新空间技术的出现,研究人员相信 soScope 有潜力成为一种多功能工具,充分利用空间组学数据并增强科学家对复杂组织结构和生物过程的理解。

论文链接:https://www.nature.com/articles/s41467-024-50837-5

理论多模态学习空间组学清华大学北航蛋白质
相关数据
清华大学机构

清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。

http://www.tsinghua.edu.cn/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

推荐文章
暂无评论
暂无评论~