伯克利发布最新研究,提出单细胞转录组学的深度生成模型
机器之心获悉,伯克利人工智能实验室今日发表最新研究,表示基因实验产生的整个转录组的mRNA计数(即约d = 20,000个蛋白质编码基因)和大量细胞n的近似测量值,可以从数万到数百万个细胞变化。解释这些数据的早期计算方法依赖于线性模型和经验贝叶斯收缩方法,因为最初样本量极小。虽然目前的研究侧重于为该基因表达数据提供更准确的模型,但大多数后续算法要么表现出过高的可扩展性问题,要么仅限于独特的下游分析任务。因此,该领域的常见做法仍然依赖于临时预处理流水线和特定的算法程序,这限制了捕获底层数据生成过程的能力。
该伯克利研究团队建议在贝叶斯近似推理中增加样本大小和最新发展,以提高建模复杂性和算法可扩展性。该团队介绍了其最近关于单细胞转录组学的深度生成模型的工作,该模型通过将生物学问题形式化为针对单细胞RNA测序(scRNA-seq)数据集的独特图形模型的统计查询来解决所有上述限制。由此产生的算法推理过程,被称之为单细胞变异推断(scVI),是开源的,可扩展到超过一百万个细胞。