Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

维度、陈萍编辑

在识别细胞结构上,AI做到了人类不能做的事情

借助深度学习算法,AI 能够成功地识别出细胞中难以识别的各种不同结构,这点人类有时都做不到。

利用人工智能(AI)标记和识别细胞的 3D 结构是一个非常有趣的研究课题,需要用到生物学中的荧光显微镜技术和深度学习等 AI 技术。艾伦细胞科学研究所(Allen Institute for Cell Science)专注于相关领域的研究,并取得了一些成果。

细胞的 3D 动态影像。

Susanne Rafelski 是该研究所的定量细胞生物学家和副主任,她和她的同事希望为细胞中各种不同的结构打上相应的标签,并做成 3D 动态影像。不过,这个愿望实现起来并不容易。

Susanne Rafelski。

荧光显微技术(fluorescence microscopy)虽然很常用,但在这里遇到了麻烦。首先,可供使用的颜色很少,无法完整地标记细胞结构;其次,试剂成本很高且使用起来麻烦;最后,染色剂以及成像过程对活细胞有害。

在这种情况下,投射白光(明视野显微镜技术)就派上了用场,利用该技术的细胞成像不依赖标记,也就不会遇到荧光显微技术带来的一些问题。

据介绍,Rafelski 团队将荧光显微技术和投射白光技术结合了起来,从而利用人工智能(AI)在明视野图像上预测荧光标记的形状。该团队的研究已经持续了数年。

深度学习发挥重要作用

在识别细胞结构的过程中,深度学习发挥了重要作用。2017 年,该团队提出利用深度学习来识别未标记细胞明视野图像中难以发现的结构,并证实了这种方法的可行性。

具体而言,通过在未标记细胞实验中使用一种深度学习算法,团队创建了一个展示细胞核中 DNA 和子结构、细胞膜和线粒体的 3D 影像。

基于不同细胞类型的透射光显微镜(明视野)图像输入的 3D 荧光图像预测。图源:https://www.nature.com/articles/s41592-018-0111-2#Sec19

分别使用全 3D 和 2D 模型时,基于透射光(明视野)图像的 3D DNA 预测。图源:https://www.nature.com/articles/s41592-018-0111-2

这种直接从透射图像中预测 3D 荧光的无标记方法可以用于生成多结构、组合式图像,也能根据电子显微(EM)输入来预测免疫荧光(IF),从而扩展了潜在的应用范围。

更多研究细节可以参考论文《Label-free prediction of three-dimensional fluorescence images from transmitted-light microscopy》。

论文链接:https://www.biorxiv.org/content/10.1101/289504v4

AI 识别细胞的发展历程

在过去的几年里,从事人工智能研究的科学家们设计了几个系统来识别这些模式。使用来自相同细胞的成对图像训练模型、图像分为一个明视野和一个荧光标记。但这些模型在细节上有所不同:有些用于 2D 图像、有些用于 3D 图像、有些是用于近似细胞结构,而另一些则是用来制作可能被误认为是真实显微照片的图像。

来自加州大学旧金山分校和旧金山格莱斯顿研究所的神经科学家 Steven Finkbeiner 使用机器人显微镜跟踪细胞长达一年。在研究中 Finkbeiner 发现,使用深度学习可以发现看不见的细胞特征。

Finkbeiner 团队用训练系统来识别 2D 图像中的神经元,然后挑出细胞核,确定给定的细胞是否活着。他表示说,自己研究的主要目的是向科学家表明,图像数据中的信息可能比人类意识到的还要多。该小组称其技术为「in silico labeling(ISL)」。ISL 能直接从未标记的固定样本或活体样本的透射光影像中预测多种荧光标记。

图源:https://ai.googleblog.com/2018/04/seeing-more-with-in-silico-labeling-of.html

然而,这种方法无法识别运动神经元。这些预测只有在 AI 能够使用一些可见线索的情况下才会起作用。

Collman、Johnson 以及在艾伦研究所的同事使用了一种不同的神经网络来解决 Rafelski 的问题,建立了一个叫做 U-Net 的系统,这个系统为生物图像而开发。与 Finkbeiner 的方法不同,Allen 模型可处理 3D 显微照片,研究人员可以常规使用该技术,例如,在染色质组织研究中识别核标记。

透射光显微镜三维荧光图像的无标记预测。图源:https://github.com/AllenCellModeling/pytorch_fnet/tree/release_1

来自伊利诺伊大学厄巴纳-尚佩恩分校的物理学家 Gabriel Popescu 正在利用深度学习来回答一个最基本的显微镜问题:细胞是活的还是死的?这是比较难的,因为测试需要有毒的化学物质。并表示说:这就像用刀测量病人的脉搏。

Gabriel Popescu。

Popescu 和同事将他们的方法称为 PICS:具有计算特异性的相位成像。Popescu 在活细胞中使用该技术来识别细胞核和细胞质,然后计算它们在数天内的质量。并表明,这些信号准确地表明了细胞的生长和生存能力。

PICS 包含了基于 U-Net 软件和显微镜硬件技术,因此,PICS 不是先获取图像并训练机器,之后在进行进一步的处理,PICS 是无缝地进行。一旦用户捕捉到白光图像,模型只需 65 毫秒就能传递出预测的荧光对应物。

除此以外,还有其他研究小组使用机器学习来识别细胞。例如,华盛顿特区美国天主教大学的一个研究小组使用了一种称为 GAN 的神经网络来识别相衬光学显微镜图像中的细胞核。

参考链接:
https://www.nature.com/articles/s41592-018-0111-2
https://www.nature.com/articles/d41586-021-00812-7#ref-CR1

工程生物学
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经科学技术

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

神经元技术

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

暂无评论
暂无评论~