实践证明,一种训练医学人工智能(AI)系统的新方法在诊断疾病方面,比以前的工作表现得更加精确。
近日,由伦敦大学学院(University College London)和英国医疗服务提供商巴比伦健康公司(Babylon Health)的研究人员开发的人工智能系统研究成果,刊登在《自然》子刊 Nature Communications 上。
传统的人工智能系统根据患者出现的症状来识别最可能出现的疾病,而与传统的人工智能系统不同,因果人工智能(causive machine learning)系统的判断方式更加接近医生诊断病症的方式:通过使用反事实问题(counterfactual questions)的方法来缩小可能出现的疾病范围。
这种人工智能系统可以帮助医生进行诊断,尤其是对于复杂病例来讲。并比现有的人工智能系统更加精确,甚至在一个较小规模的对照试验中的表现也优于现实生活中的医生。
在医学上,相关性和因果关系之间的差异很重要。与医生诊断不同,现有的症状检查仅根据相关性提供建议,而不是根据因果关系来的。
举例来讲,病人可能因为呼吸急促而到医院就诊。基于相关性的人工智能可能会将呼吸急促与超重(overweight)联系在一起,进一步把超重与患有 2 型糖尿病联系起来,并建议使用胰岛素。
但基于因果关系的人工智能系统可能会把重点放在呼吸急促和哮喘之间的联系上,从而探索其他治疗方法。
这种被称为因果机器学习的新人工智能方法在网络中获得越来越多的关注,它可以产生一种“想象”,当患者的疾病与原有模版中的疾病不同时,人工智能可能对此症状进行自动联想,从而做出正确的诊断。
论文作者、伦敦大学学院(University College London)Ciarán Gilligan-Lee 说:“我们着手将因果关系放到人工智能中,这样我们才能找到患者真正的疾病,并据此为他们提供帮助。”
对比试验结果使人振奋
另一组 44 名巴比伦全科医生分别被分配了至少 50 个书面病例进行评估。医生列出了他们认为最有可能的疾病(每次诊断平均返回 2.58 种潜在疾病)。治疗的准确性是由他们在诊断中根据真实疾病的比例来衡量的。
然后,人工智能系统也进行了相同的测试,并使用了一种基于相关性的旧算法(专门为此研究创建,而不是从最新的产品中获得)和较新的因果算法。对于每项测试,人工智能只能报告与医生相同数量的答案。
测试结果显示,医生的平均分数为 71.40%(±3.01%);较旧的相关算法执行的效果与普通医生相同,达到 72.52%(±2.97%);而新的因果算法得分为 77.26%(±2.79%),得分高于 32 位医生、与 1 位医生分数相同、仅比 11 位医生的得分低。
而且,当涉及非霍奇金淋巴瘤等罕见疾病的时候,新的人工智能系统准确率仍胜过医生。对于这些情况,它比旧的人工智能系统大约准确率高 30%。
对于这种情况,巴比伦公司科学家、研究论文主要作者 Jonathan Richens 博士介绍说:“我们采用了一种具有强大算法的人工智能系统,赋予它想象不同现实的能力,并考虑如果是另一种疾病会不会出现这种症状。在这些书面病例测试中,人工智能系统可以准确检测患者产生疾病的潜在原因,并获得比 70% 医生都高的评分。”
巴比伦首席执行官兼创始人 Ali Parsa 博士表示:“目前,世界上一半的人几乎都无法获得医疗保健服务,因此,我们需要做得更好。而人工智能系统在测试案例中得到的结果令人振奋。”
他继续补充道:“这不应被当作机器取代医生而耸人听闻,因为真正鼓舞人心的是,我们终于得到了能够提高现有医疗系统的覆盖范围和生产力的工具。人工智能系统将是一个重要的工具,帮助我们结束医疗保健资源分配不均的不公正现象,并使地球上的每个人都能更容易负担得起。”
巴比伦医学部副主任兼全科医生 Tejal Patel 博士说:“我很高兴有一天,这种 AI 可以帮助我和其他医生减少误诊,并腾出时间帮助我们专注于最需要护理的患者身上。我期待这类工具成为标准工具,提高我们现有的工作水平。”
巴比伦首席科学家 Saurabh Johri 博士补充道:“有趣的是,我们发现人工智能和医生相辅相成,在较困难的情况下,人工智能的得分比医生更高,反之亦然。此外,该算法对更容易误诊、更严重的罕见疾病尤其有效。”
然而,Gilligan Lee 也认为,医生可能更擅长于发现更常见的问题。他计划为该系统寻求监管部门的批准和临床验证,目的是将其放入一个应用程序中,患者可以从中获取有关症状的信息和治疗的建议。
英国伯明翰国民健康保险基金会信托基金会(University Hospitals Birmingham NHS Foundation Trust)的 Xiaoxuan Liu 表示:“他们在很大程度上描述了一种新的解决问题的技术途径。论文中的方法论非常好,而且这项技术确实显示出一些希望。”
Liu 认为,该系统在罕见病诊断方面的表现优于医生这一事实令人振奋,尽管她警告说,该系统仍处于早期阶段,病例数量相对较少。“我们需要看看它现实世界的病例中是如何起作用的,在这些病例中,病史并不是十分清楚的,有时可能是多种疾病相互作用的结果,这些病例对于该系统来讲将是一项挑战。”
编审:王新凯
参考资料:
https://www.newscientist.com/article/2251492-ai-mimics-the-way-doctors-think-to-make-better-medical-diagnoses/#ixzz6VBRI2suu
https://www.eurekalert.org/pub_releases/2020-08/b-aw081020.php