李泽南 张倩 王淑婷参与

谷歌AI脑神经元绘制法登上Nature子刊:速度提升一个数量级

人类对于生物大脑的探索是永无止境的,模仿生物的人工智能是否可以帮助我们进行研究?最近,来自谷歌的研究人员提出了一种新的循环神经网络,它可以快速构建生物大脑的 3D 神经模型。谷歌称,新的方法可以「将连接组学提升一个数量级」。目前,该研究的论文已经发表在 Nature 子刊《Nature Methods》上。

连接组学旨在综合描绘在神经系统中发现的神经网络结构,以更好地理解大脑的运作模式。这一过程需要对大脑组织进行纳米级的 3D 成像(通常使用电子显微镜),然后分析成像数据结果以追踪大脑的神经突触并识别单个突触连接。由于成像分辨率高,即使是一立方毫米的大脑组织也能产生 1000 多 TB 的数据!这些图像中的结构相当复杂、精细,因此大脑成像的主要瓶颈在于数据的自动解读,而非获取。

如今,谷歌与马克斯-普朗克神经生物学研究所的研究人员合作,在《Nature Methods》杂志上发表了一篇名为《High-Precision Automated Reconstruction of Neurons with Flood-Filling Networks》的论文。该论文介绍了一种新型的循环神经网络,该网络在自动解读连接组学数据的准确性方面比以往的深度学习技术提高了一个数量级。

论文获取链接:https://www.biorxiv.org/content/early/2017/10/09/200675.full.pdf+html

基于泛洪算法网络的 3D 图像分割

追踪大量电子显微镜数据中的神经突触是图像分割问题的一个实例。传统的算法将该过程至少分为两步:利用边缘检测器或机器学习分类器找到神经突触之间的边界,然后使用分水岭或图像分割等算法将未被边界分隔的图像像素组合在一起。2015 年,我们开始尝试一种基于循环神经网络的替代方法,将这两个步骤统一起来。该算法被嵌在特定的像素位置,然后使用循环卷积神经网络迭代地「填充」某一区域,该循环卷积神经网络用来预测哪些像素属于与种子相同的对象。自 2015 年以来,我们一直致力于将这种新方法应用于大规模的连接组学数据集,并严格量化其准确率

在 2D 图像中分割物体的泛洪算法网络。黄点是当前焦点区域的中心;该算法在迭代检查更多图像区域的同时扩展分割区域(蓝色)。

通过预期运行长度测量准确率

我们与马克思·普朗克研究所的研究人员合作,设计了一种被称之为「预期运行长度」(ERL)的度量标准,它测量以下内容:给定大脑 3D 图像中随机神经元内的随机点,在出错前,我们能追踪神经元多远?这是一个典型的「平均故障间隔时间」问题,只不过在这里我们测量的是故障间隔的空间量而不是时间量。对于工程师来说,ERL 的吸引力在于它将线性物理路径长度与算法产生的个别错误的频率关联起来,并且可以直接计算。对于生物学家来说,吸引力在于 ERL 的特定数值与生物相关的量相关,例如神经系统不同部分中神经元的平均路径长度。

预期运行长度(蓝线)的进展带来了今天在《Nature Methods》上共享的结果。红线表示「合并率」的进展,合并率测量两个分离的神经突被错误地追踪为单个目标的频率;达到非常低的合并率对于实现手动识别和校正重建中剩余误差的有效策略至关重要。

图像分割过程

鸣禽连接组学

我们用 ERL 测量了一百万立方微米斑胸草雀大脑中一组基本真实神经元的进展,斑胸草雀大脑通过我们的合作伙伴使用肖特基场发射扫描电子显微镜而成像。实验结果发现我们的方法优于之前应用于同一数据集的其他深度学习方法。

谷歌提出的算法在鸣禽大脑中追踪单个神经突的 3D 过程。

研究人员使用新的泛洪网络算法对斑胸草雀大脑一小部分的每个神经元进行了分割绘图,如下视频所示:

重建斑胸草雀大脑的一部分。在图像分割中,不同颜色对应不同对象,这些都是由泛洪网络自动生成的。金色球是使用以前发布的方法自动识别突出位置。

谷歌研究人员正和马克思·普朗克研究所的同僚们通过这种自动化方法,辅以少量人力协助以解决一些疑难问题。他们现在正致力于研究鸣禽连接组以寻求新理解,如研究斑胸草雀如何唱歌,以及它们如何学会唱歌。

展望

谷歌研究人员表示,他们在未来将继续改进连接组重构技术,目标是实现突触级分辨率连接组的全自动化,并为马克思·普朗克研究所及其他机构的连接组项目作出贡献。为了帮助支持更大的研究团队开发连接组技术,他们开源了泛洪算法网络方法的 TensorFlow 代码(https://github.com/google/ffn/)以及用于 3D 数据集的 WebGL 可视化软件,以帮助人们理解和改进目前的方法。

论文:High-precision automated reconstruction of neurons with flood-filling networks

论文链接:https://www.nature.com/articles/s41592-018-0049-4

摘要:从大量的电子显微镜数据中重建神经回路需要追踪完整的细胞,包括其所有的神经突触。虽然人们已开发出自动化方法用于跟踪,但此方法错误率高,如果没有人工检查就无法产生可靠的连接图。在此背景下,我们提出了一种自动分割方法——泛洪算法网络,该方法与之前大多数研究类似,使用的是卷积神经网络,但还包含一个允许迭代优化和单个神经元拓展的循环路径。我们使用泛洪网络跟踪数据集中的神经元,数据是使用肖特基场发射扫描电子显微镜观察斑胸草雀大脑获得。通过该方法我们实现了 1.1 毫米的平均无误差神经突触路径长度,并且在路径长度为 97 毫米的测试集中仅观察到四个合并。尽管计算成本大幅增加,但泛洪网络的性能比以往用于该数据集的方法提高了一个数量级。

原文链接:https://ai.googleblog.com/2018/07/improving-connectomics-by-order-of.html

理论谷歌神经元Nature
1
相关数据
神经网络技术
Neural Network

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

边缘检测技术
Edge detection

边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。这些包括(i)深度上的不连续、(ii)表面方向不连续、(iii)物质属性变化和(iv)场景照明变化。 边缘检测是图像处理和计算机视觉中,尤其是特征检测中的一个研究领域。

卷积神经网络技术
Convolutional neural network

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

机器学习技术
Machine Learning

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

神经元技术
neurons

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

重构技术
Refactoring

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

TensorFlow技术
TensorFlow

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

准确率技术
Accuracy

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

机器之心
机器之心

机器之心编辑

推荐文章
返回顶部