Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Peter作者某基因科技公司生物信息工程师单位生物信息研究方向

Nature论文解读 | 基于深度学习和心脏影像预测生存概率


实验设计

1. 采集 302 位病人的心脏三维 MRI 影响数据,并对其由认证医师标注出其血管流量等和诊断有关的特征和区域,同时对其进行了 12 年的跟踪并记录其医疗相关的事件;

2. 对比手动标记的图像分割和自动的标记和运动追踪;

3. 对手动的模型使用常规参数,对自动化标记的数据通过深度学习模型及超参数优化分别进行模型内部的验证;

4. 比较不同的模型在预测患者死亡率上的表现。

从上述流程可以看出,这篇文章的要点有三个,一是怎么去做图像分割,二是做预测模型,三是如何评价模型的表现

图像分割

对于图像分割,首先是训练一个能够在单个影像中确定血流量的和图像分隔的模型,之后通过不同截面下的高分辨率数据,去训练一个更加平滑的分隔模型。

通过将血液流量和图像分割变成一个多任务的预测问题,通过全卷积网络,先分别提取单张图片的特征,之后再将不同截面的图片的特征整合(即上图的左半部分),而通过不同尺度的反卷积,可以将特征返还成图像,最终将预测的标签和实际标签的差作为损失函数,最终完成了图像的分割。通过不同时间段的数据,还可以对心脏的运动情况进行跟踪。

预测死亡率的模型

不同的病人各自有自己做过的 N 次心脏 MRI,通过二层的降噪自编码器,能够训练出一个能够鲁棒的用低维数据表达心脏 MRI 数据的模型。

该文的创新点在于将要预测的死亡风险也加入了待优化的损失函数,这里的重构误差是不同 n 次数据间 MSE 的平均值,而死亡风险使用了 Cox’s proportional hazards regression model。

这里等式的左边是该个体存活的概率与群体存活概率的比值,右侧是 DAE 提取的特征的加权之和,通过将损失函数定义为重构误差和包含待预测指标的形式,DAE 需要学到既能够再现原始的 3D 结构,又和待预测目标有关的特征。

对于每一个待优化的权重 beta 来说,求导数后得出下面的等式:

考虑到数据是不同时间段的,而一个人只会死一次,因此对不同的时间进行了加权,最终得出要优化的与死亡率有关的损失函数

而在超参数的优化中,使用了 PSO(粒子群算法),待优化的参数如下表所列:

模型的效果

相比人工标记的数据 + 传统的预测模型,全卷积网络做的图像分割 + DAE做的预测,效果如何了?

在该问题中,对每个患者的存活率的预测是一个连续值,而是否存活是一个 0 或1的问题。为此,按照预估存活率在人群的前 50% 或后 50%,将人群分成了高风险与低风险,下图的 A 是人工标记数据的模型,b 是全部用深度学习做的模型,蓝色的代表低风险,红色代表高风险,线旁边的框代表了 95% 的置信区间

图中展示的是医学中常用的 Kaplan–Meier 曲线,反映的是病人在患病不同年份之间的死亡率,其中的 P 值代表了统计上红色和蓝色的差距。B 图相比 A 图,不止 P 值更低,而且在不同的年份间始终预测的更准,而手动的模型至少在最初几年,效果是差一些的。

模型的可解释性

医学与深度学习的结合,模型的可解释性始终会受到格外的关注。不止是由于医学样本的样本量小,人们对涉及生死的事情,需要最终能归结到生物本身的机理上。

该模型对 4D 的数据用 Laplacian eigenmaps 降维到 2D 后,按照存活的年份,进行了聚类,可以看到颜色相近的点也在一起,而 b 图暂时了游离壁和间隔对模型预测的显著性,从而给出了模型的预测的可视化解释。

总结

该文的亮点在于首先做到了 4D 影像数据的全自动处理(之后的新数据不需要人工标注),以及改变自编码器的损失函数做回归问题。由于该文只用了一家医疗机构的 302 位患者的数据,因此只对该模型利用 70% 训练集,30% 验证集的方式进行了内部的调优,最后在全部 302 名患者中得出了对比图,因此该模型有过拟合的可能性。

并且该模型预测的存活率,难以指导医疗,如果能够根据更大规模的数据,结合生活习惯的问卷,预测不同的生活习惯,例如持续的运动,低盐低脂的饮食,是否对不同的人患者有不同的存活率影响,即对于坚持运动的人和不坚持运动的人(低盐低脂饮食与否),分别做一个模型来预测,再去看对于一个即不运动,也不健康的患者,上述模型能够告诉患者指导过改变那一种生活习惯,能够更好的提高自己的长期存活率,从而助力精准医学。

PaperWeekly
PaperWeekly

推荐、解读、讨论和报道人工智能前沿论文成果的学术平台。

理论深度学习预测医疗影像图像分割
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

图像分割技术

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

全卷积网络技术

全卷积网络最开始在论文 Fully Convolutional Networks for Semantic Segmentation(2015)中提出,它将传统卷积神经网络最后几个全连接层替换为卷积层。引入全卷积的意义在于它能实现密集型的预测,即在二维卷积下对图像实现像素级的分类,在一维卷积下对序列实现元素级的预测。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

超参数优化技术

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

导数技术

导数(Derivative)是微积分中的重要基础概念。当函数y=f(x)的自变量x在一点x_0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x_0) 或 df(x_0)/dx。

验证集技术

验证数据集是用于调整分类器超参数(即模型结构)的一组数据集,它有时也被称为开发集(dev set)。

置信区间技术

在统计学中,一个概率样本的置信区间(Confidence interval),是对这个样本的某个总体参数的区间估计(Interval Estimation)。置信区间展现的是,这个总体参数的真实值有一定概率落在与该测量结果有关的某对应区间。置信区间给出的是,声称总体参数的真实值在测量值的区间所具有的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%, 60%),那么他的真实支持率落在50%和60%之区间的机率为95%,因此他的真实支持率不足50%的可能性小于2.5%(假设分布是对称的)。

过拟合技术

过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是分类器设计中的一个核心任务。通常采用增大数据量和测试样本集的方法对分类器性能进行评价。

降维技术

降维算法是将 p+1 个系数的问题简化为 M+1 个系数的问题,其中 M<p。算法执行包括计算变量的 M 个不同线性组合或投射(projection)。然后这 M 个投射作为预测器通过最小二乘法拟合一个线性回归模型。两个主要的方法是主成分回归(principal component regression)和偏最小二乘法(partial least squares)。

降噪自编码器技术

当采用无监督的方法分层预训练深度网络的权值时,为了学习到较鲁棒的特征,可以在网络的可视层(即数据的输入层)引入随机噪声,这种方法称为Denoise Autoencoder(简称dAE)

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

推荐文章
暂无评论
暂无评论~