深度学习加全息成像诊断疟疾:识别感染细胞准确度接近完美

杜克大学研究者已经发明了一种具有临床意义的使用计算机自动快速诊断疟疾的方法——诊断是成功治疗疟疾和防止其传播的一个至关重要的步骤。


光是在 2015 年,全世界就有 2.14 亿人感染疟疾,大约有 438,000 人因此死亡。


尽管西医技术已经可以几近完美地诊断疟疾,但在资源有限的区域(同时感染率也更高)也难以有所作为。


疟疾的症状和许多其它疾病的症状很像,但实际上训练有素的现场工作人员和可以检测这种寄生虫的显微镜的数量非常不够。尽管快速诊断测试确实存在,但它需要不断购买新的测试用品,因而价格不菲。而且快速测试还不能通过清点感染细胞的数量来确定感染的严重程度,而了解患病程度对治疗而言显然是至关重要的。


在一项新研究中,杜克大学的工程师报告了一种使用计算机深度学习和基于光的全息扫描来从血液样本中检测受感染细胞的方法,这种方法不需要人类的任何帮助。这一创新可能会成为一种新型快速可靠的测试方法的基础,并能向任何地方的任何人提供。这将为全球每年投入 27 亿美元的疟疾战争提供宝贵的武器。


这一结果于当地时间  9 月 16 日发表于 PLOS ONE 期刊上。


「使用这项技术,我们能够每分钟处理数千个细胞。」杜克大学生物医学工程教授 Adam Wax 说,「相较于目前的需要 40 分钟来人工染色、准备和读取的方法,这项技术是一个巨大的改进。」


Synced (192).jpg


这项技术基于所谓的「定量相位光谱(quantitative phase spectroscopy)」技术。当一束激光通过可见光谱的光进行扫描时,传感器可以捕获到每一个分离的光频率和血液样本的相互作用。得到的结果是带有有价值的信息的全息图像,这些信息能够指示是否感染了疟疾以及感染的程度。


「我们确定了对识别疟疾在统计上非常重要的 23 个参数。」Wax 实验室的一位博士生兼本论文的第一作者 Han Sang Park 说。比如说,随着患者病情的发展,血液中的红细胞的大小会变小、血红蛋白会减少、并且会随着其中寄生虫的生长而发生变形。这会影响到细胞体积、周长、形状和质量中心等特征。


「但是,在 90% 的情况下,单独看这些参数都是不可靠的,所以我们决定同时使用所有这些参数。」Park 说。


「要得到应用,任何新的诊断设备都必须和使用显微镜的专业的该领域工作人员一样可靠。」Wax 说,「否则,即使有 90% 的成功率,你每年仍旧会错过 2000 多万例病例。」


为了达到更高的准确度,Wax 和 Park 使用了深度学习——一种可让计算机自己学习不同目标之间的差异的技术。通过向计算机馈送了 1000 多例健康和患病的细胞的数据之后,深度学习程序可以确定哪些测量指标在哪种阈值范围内可以将健康细胞和患病细胞明显区分开。


他们将所得到的结果算法在数百个细胞上进行了测试,发现它能够正确识别出 97%-100% 的疟疾——一些研究者相信如果训练所使用细胞更多,准确度还会更高。


因为该技术将数据丰富的全息图分解成了仅仅 23 个数字,所以测试可以很容易地批量进行,这对于没有可靠快速的互联网连接的地区而言是非常重要的,这也可以让一些地区不再需要自己的处理计算机。


jqzx (143).png


Wax 和 Park 正在通过一家名叫 M2 Photonics Innovations 的创业公司来将这种技术发展成一种诊断设备。他们希望基于他们的技术的设备可以达到理想的准确度和成本效益,从而在这一领域内得到实际的应用。Wax 还获得了另一笔资助以探索将该技术用于识别血液样本中的癌细胞。


这项成果得到了美国国家科学基金(IIP-1346349)、美国国立卫生研究院(R01-CA167421)、世界反兴奋剂组织和宝来惠康基金的支持。以下是论文(DOI: 10.1371/journal.pone.0163045)摘要。





摘要:通过染色的血液涂片的显微检查进行的疟疾检测是一种严重依赖于专业显微镜工作者的诊断难题。本论文提出了一种用于检测和确认红细胞受感染程度的方法:被疟疾寄生虫恶性疟原虫(Plasmodium falciparum)感染的红细胞处于滋养体(trophozoite)还是裂殖体(schizont)阶段。和该领域之前的成果不同,这项研究使用了未染色的细胞的定量相位图像(quantitative phase images)。红细胞(erythrocytes)被光学相位阈值(thresholds of optical phase)自动分割并重新调整以进行相位图像的定量比较。重新调整过的图像被分析后提取出 23 个基于相位信息的形态描述(morphological descriptors)。尽管所有的单个形态描述在统计学上的感染和未感染细胞之间细胞的差异是非常不同的,但每种描述都能在具有临床意义的程度上将这些细胞区分开。为了提升诊断能力,我们应用了多种机器学习技术,其中包括线性判别分类(LDC)、逻辑回归(LR)和 k-最近邻分类(NNC),从而得到了结合了所有这些计算出的物理参数的算法,其能更高效地区分细胞。结果表明:LDC 在检测区分裂殖体阶段感染细胞和未感染的红细胞上实现了最高可达 99.7% 的准确度。NNC 在区分滋养体晚期细胞和未感染的红细胞上的准确度(99.5%)比 LDC (99.0%)和 LR(99.1%)都稍微好一点。但是对于滋养体早期细胞,LDC 所得到的准确度最高,可达 98%。对感染阶段(infection stage)的细胞的识别的准确度会低一点:特定度(specificity)高达 99.8% 但敏感度(sensitivity)只有 45.0%-66.8%——其常常将滋养体早期与滋养体晚期或裂殖体阶段混淆,而滋养体晚期和裂殖体阶段也常常彼此混淆。整体而言,这种方法说明了无需染色和专家分析,使用定量相位成像(quantitative phase imaging)检测和确定疟疾感染阶段的临床应用的显著潜力。

产业生物医学深度学习医疗健康计算机视觉产业
暂无评论
暂无评论~