赵泓维作者

深度学习判别新冠肺炎准确率达九成,《Radiology》已收录相关研究成果

从武汉封城记起,仅仅一周后,各家企业针对新冠肺炎开发的肺部人工智能辅助算法便陆续研发完毕,并登陆了包含武汉市中心医院、武汉协和医院在内的最前线医院。

但从功能上来说,在疫情之中,许多AI的职能更多在于帮助医生审阅来自患者的CT影像,捕获其肺部的异常区域,但难以进一步区分肺炎患者究竟是患的哪一类肺炎。

这是一个非常有趣的问题,它关乎到影像学能以怎样的能力为人类发现如新冠这样的传染病。过去已有研究人员将深度学习用于处理小儿胸部X光片,其结果正是这项技术可用于检测和区分感染细菌性和病毒性肺炎的儿童。而在CT领域,尚无学者对相关问题拿出大样本有效性研究的试验结果和高质量论文。

从这个问题出发,许多学者开始了自己的研究,有的尝试从肺段入手,借助不同肺炎的肺段参数差异判断肺炎的种类;有的尝试联合病原学,将病原学结果与影像结果一一对应……近日,一篇完全基于肺部CT影像的深度学习判别新冠肺炎的论文《Artificial Intelligence Distinguishes COVID-19 from Community Acquired Pneumonia on Chest CT》被国际顶级放射学期刊《Radiology》所接收,这篇文章使用的算法似乎在寻觅新冠肺炎的CT影像学特征方面找到了窍门。 

简单地说,这一研究是一次针对于新冠肺炎患者CT影像的回顾性研究,研究人员构建了一种特定的3D检测神经网络,并将其用于检测4356例CT数据。结果显示,该算法对新冠肺炎的鉴别灵敏度和特异性分别高达89.76%和95.77%,受试者工作特征(ROC)曲线下面积(AUC)为0.96。 

这篇论文由医疗AI影像企业科亚医疗携手国内六家医院共同研究发表。科亚医疗是国内首个人工智能三类医疗器械注册证获证企业,一直专注于大数据和人工智能技术在医疗领域的落地应用,其获证产品“深脉分数”更是获得了国家药监局“具有重大的经济效益和社会价值“的定调评价。与国内外同类CTFFR产品相比,“深脉分数”各项指标均处于国际领先水平。 

科亚医疗告诉动脉网:“本篇论文的意义在于首次使用基于深度学习的技术,对胸部CT影像进行新冠肺炎(COVID-19),社区获得性肺炎(CAP),及非肺炎(Non-pneumonnia)的三分类研究,并获得了令人兴奋的结果。在这之前,有学者进行了在二维X-ray胸片上肺炎分类的研究,而在三维CT肺部图像上肺炎的分类还是空白。而此次在全国乃至全球抗击新冠肺炎时期,我们科亚医疗构建的深度学习神经网络COVNet,从肺部CT中提取各类影像特征用于鉴别新冠肺炎,并且通过热力图的方式对模型做出决策的重要区域进行可视化,来说明模型识别的关键病变区域。

通过多中心医院的数据验证,COVNet网络模型对COVID-19,CAP和非肺炎的检测都有较高的灵敏度和特异性。而对COVID-19的检测,ROC下曲线面积高达0.96. 本论文开启了基于深度学习技术的肺部CT影像肺炎多种类分类的研究,对像COVID-19,SARS,MERS等传染性肺炎,提供了一种快速AI影像筛查方式的思路,希望能为全球抗击新冠肺炎抛砖引玉。”

实验设计与模型建立

本次研究采集了来自六家医院3506位患者,总计4536次三维胸部CT检查影像。在排除造影CT检查与单张切片厚度大于3mm的检查后,研究构建了一个包含3322名患者,总计4356项三维胸部CT检查影像的数据集。这些患者的平均年龄为49±15岁,其中男性1838名,女性1484名。在这个数据集中,感染COVID-19的患者影像有1296例(30%,均通过RT-PCR检查确认为阳性);感染社区获得性肺炎(CAP)的患者影像1735例(40%);非肺炎的患者影像1325例(30%)。 

所有检查数据均按9:1的比例随机分为患者的训练集和独立测试集。然后将训练数据集进一步按9:1的比例拆分用以训练模型和内部验证。独立测试集未用于训练和内部验证。 

为了减少实验出现偏差的可能性,这些数据分属于六家不同的医院,同时将收录时间控制于2016年8月16日至2020年2月17日,其中COVID-19部分仅使用采集于2019年12月31日至2020年2月17日间的数据。 

由于不同医院使用的CT设备厂家存在差异,所以本次实验所用的影像均从DICOM文件导出,所有CT切片厚度控制在0.5mm至3mm之间,图像矩阵大小为512*512,图像分辨率大小在0.29*0.29mm2到0.98*0.98mm2之间。 

Fig.1:算法流程图

Fig.1是本论文算法的整体流程图,主要包含四个步骤:

第一步,模型训练和测试数据库的构建。按照上述数据介绍进行处理。

第二步,是数据集的预处理,包含数据增广和肺部区域的分割。本论文采用基于U-Net架构的网络进行肺部区域的分割,以便去除非肺区域对后续检测算法的影响。

第三步,将预处理后的数据集输入到COVNet网络进行深度学习算法的训练。

第四步,对独立测试集进行预处理(肺部区域提取),输入到第三步中训练好的COVNet模型中进行预测分类。 

科亚医疗将这个用于检测COVID-19的3D深度学习框架命名为COVNet。这一卷积神经网络以Resnet50为主干,能够从输入CT影像中同时提取2D局部和3D全局代表性特征图(如Fig.2)。COVNet使用最大池化层和全连接层来综合分析这些特征图,最终产生每种类型(COVID-19,CAP和非肺炎)的概率评分。 

Fig.2:新冠肺炎检测神经网络COVNet框架图

COVID-19:新冠肺炎;CAP:社区获得性肺炎;Non-Pneumonia:其他非肺炎

统计与结果

统计数据显示,将COVNet应用在工作站(GPU NVIDIA Quadro M4000 8GB,RAM 16GB和Intel Xeon Processor E5-1620 v4 @ 3.5GHz)上,每次CT检查肺炎预测所耗费的平均时间为4.51秒,远远快于医生单个CT影像组阅片速度。

而在检测准确度方面,算法对于COVID-19检测的灵敏度和特异性为90%与96%;对于CAP检测的灵敏度和特异性为87%与92%;而对于非肺炎影像,算法的灵敏度和特异性为94%与96%。检测结果详见Table1。

Table1:深度学习框架COVNet在独立测试集上的性能

为了提高模型的可解释性,科亚医疗采用梯度加权类激活映射(Grad-CAM)方法,实现推动深度学习模型决策重要区域的可视化。以下三张图片(Fig.3a,Fig.3b,Fig.3c)分别以区域热图的方式展示了COVID-19、CAP与非肺炎三种情况之下,引导深度学习算法作出决策的区域。

通过这种方式,我们能够很轻易地了解深度学习关注的影像特征,而这些影像特征给研究人员具体研究COVID-19影像特性指出了明确的方向。

Fig.3a COVID-19预测输出热图,红色突出显示与预测类别相关的激活区域

Fig.3b CAP预测输出热图,红色突出显示与预测类别相关的激活区域

 Fig.3c 非肺炎预测输出热图

局限性与发展方向

肺部许多疾病的影像特征存在大量重叠,这些疾病取决于患者年龄、药物反应性、免疫状态、潜在疾病合并症等宿主因素,仅凭胸部CT的影像学表现,很难区分所有肺部疾病。

另外,本研究目前仅对COVID-19进行了分类预测,尚未对感染程度进行分类。科亚医疗表示:“接下来我们将尝试将试验进一步细化,在预测COVID-19存在的同时,去预测患者感染的严重程度,以帮助医生进一步监测、治疗、管理患者。”

科亚医疗的研究具备足够的创新性,其临床应用将在提高基于CT图像诊断新冠肺炎准确度的同时,帮助临床医生及早确诊感染患者,大幅提升一线医生诊断效率,优化新冠肺炎筛查流程,实现高效精准筛查、降低医生工作强度,合理分配医疗资源的作用。 

正如一位医生所说:“影像科的医生偏好于给予‘占位性病变’的判断,而很少诊断为肺炎。但对于患者而言,占位性病变的内容太过宽泛,他们需要更为精确的判断,这种判断现在很少来源于影像科。如今,很多人工智能都在处理数据做定量分析,但这些工作并非人工智能的专长——常规数据处理软件也能收集挖掘数据。所以,AI要想发挥出真正的价值,需要借助于定量的数据给出定性的判断结果。” 

科亚医疗在探索未知的AI潜力中走出了珍贵的一步,影像科到底能够发挥怎样的作用,还需AI公司进一步用深度学习探索像素之中的未知,答案或许便隐藏在点与点之中。

动脉网
动脉网

专注医疗产业服务平台

产业准确率深度学习智慧医疗
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

最大池化技术

最大池化(max-pooling)即取局部接受域中值最大的点。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

合合信息机构
推荐文章
暂无评论
暂无评论~