MIT CSAIL开发机器学习系统,帮助医生诊断儿童交流障碍

Synced (113).jpg

对有语音和语言障碍的儿童来说,早期干预对儿童以后在学业和社交上的成功有巨大的影响。但很多有语言障碍的儿童(一项研究估计大约为 60%)在上幼儿园,甚至更大之前都不能确诊。

MIT 计算机科学与人工智能实验室(CSAIL)和马萨诸塞州综合医院卫生职业研究所的研究人员改变了这一现象,他们开发了一个计算机系统能自动筛查语音和语言障碍的儿童,甚至有潜力提供更精准的诊断。

本周,在语言处理 Interspeech 大会上,研究人员报告了该系统的初始设置实验,实验产生了好的结果。电子工程教授、该论文的作者 John Guttag 说,「这是一个初步研究,但我认为它在可行性上相当令人信服。」

该系统分析了儿童在一项标准 storytelling 测试上的录音,该测试是向儿童展示一系列的图像以及叙述,然后要求孩子重新讲述该故事。

Guttag 说,「真正令人激动的是它能够使用简化的工具以全自动的方式做筛查。你可以想象完全用平板或手机完成 storytelling 任务。我认为这开启了对大量儿童进行低成本筛选的可能性。而且我想如果我们能做到这一点,这对社会来说是一项巨大的福利。」

微妙的信号

研究人员使用一种被称为曲线下面积( area under the curve)的标准测量方法评估系统的表现,描述了在有障碍人群与数量有限的假正例人权之间的权衡。(修正该系统限制假正例通常会导致对真正例的限制。)在医学文献中,诊断测试的曲线下面积大约是 0.7 就可以被认为足够准确;在 3 个独立的临床任务中,该系统的得分在 0.74 与 0.86 之间。

为了建立新系统,Guttag 和电子工程硕士(也是该论文的第一作者) Jen Gong 使用到了机器学习。机器学习是计算机搜索大量数据中的模型,从而进行特定的分类。应用到此案例时,是用来诊断语言和语音障碍。

训练数据是由 MGH 卫生职业研究所的研究员 Jordan Green、Tiffany Hogan 积累,他们对开发更客观的评估 storytelling 测试结果的方法很感兴趣。身为语音-语言病理医生的 Green 说,「我们需要更好的诊断工具帮助医生做评估。评估儿童的语音非常具有挑战性,因为在发育中的儿童有很大的变化。你让 5 个医生做判断可能和得到 5 个答案。」

不像由腭裂等解剖学特征引发的语音障碍,语言和语音障碍都有神经科学的基础。但 Green 解释说,它们影响不同的神经通道:语音障碍影响运动通道(motor pathway),而语言障碍影响认知和语言学通道。

发音停顿指示器

Green 和 Hogan 假设儿童发音的停顿是有帮助的诊断数据,因为他们难以找到 motor 控制发音所需要的词或语句。所以,这也是 Gong 和 Guttag 集中精力要做的事。他们确定了 儿童发音的 13 个声学特征,他们的机器学习系统能够搜索、寻找与特定诊断相关的模式。发音长短停顿的数量、停顿的平均长度、停顿长度的变化性、在不间断话语上的相似统计都是他们确定的特征。

经 storytelling 任务测试的儿童的录音数据被分类为正常发育、有语言障碍或有语音障碍。机器学习系统在 3 个不同的任务上进行训练:识别是否有障碍,是语言障碍还是语音障碍;识别语言障碍;识别语音障碍。

研究人员面临的一个障碍是数据集中正常发育的儿童的年龄范围要比有障碍儿童的年龄范围要窄:因为障碍儿童相对较少,研究人员不得不扩大目标年龄范围来收集数据。

Gong 使用被称为残差分析的统计技术解决这一问题。首先,她识别目标年龄与性别和他们发音的声学特征之间的关联。然后,她对每一个特征都纠正之间的关联,然后再将数据输入到机器学习算法。

德克萨斯州立大学行为与大脑科学系教授、该大学 Callier 交流障碍研究中心的执行主任 Thomas Campbell 说,「很早之前教育者就讨论过对筛查高风险语言和语音障碍儿童的可靠性测量工具的需要。该项研究的自动筛查方法给出了令人激动的技术发展,可以认为是在语言和语音筛查美国众多儿童是否有障碍上的一项重大突破。」

入门MIT医疗
暂无评论
暂无评论~