小舟、杜伟报道

为什么信不过AI看病?数据集小、可靠性差,AI医疗任重道远

近年来,AI 在医疗诊断中的应用受到了越来越多的关注,也出现了一些实际的应用场景,如药物筛选、AI 诊断。但似乎正确的 AI 医疗诊断难以实现,这是哪些原因造成的呢?本文探讨并汇总了人们对 AI 医疗诊断的一些独到见解。

近年来,AI 在医疗诊断中的应用受到了越来越多的关注,也出现了一些实际的应用场景,如药物筛选、AI 诊断。但似乎正确的 AI 医疗诊断难以实现,这是哪些原因造成的呢?本文探讨并汇总了人们对 AI 医疗诊断的一些独到见解。

AI 与医疗融合作为近年来兴起的一种新领域,具有巨大的发展潜力。用于医疗的 AI 算法正在不断涌现,在看到领域前景的同时,我们也发现了一些问题。

例如,为了协助医生筛查潜在新冠患者,AI 领域的研究者们研发了多种机器学习算法,以根据胸部 X 光片和 CT 图像快速准确地检测和预测新冠肺炎。然而,剑桥大学的一项研究发现:这些算法存在严重的算法缺陷和偏见,无法用于实际的临床应用。

实际上,致力于 AI 与医疗融合的研究者并不在少数,也有很多项目为此投资,但该领域仍然存在一些实际问题。近日,Reddit 上的一篇帖子将 AI 医疗与 AlphaZero 进行了对比,引发了关于 AI 医疗问题的诸多讨论。

数据集小、需要认证、容错成本高……

有网友从数据集大小、人机交互、认证和容错成本四个方面与 DeepMindAlphaZero 进行了全方位的对比,指出了现有 AI 医疗诊断系统存在的一些基本问题。

首先,医疗数据集一般不太大,这是医生注释成本高昂造成的。此外,医疗过程也非常缓慢。例如,一台核磁共振机器每小时最多只能进行两次扫描,每天至多 48 次,每年不到 20000 次。如果存在 20 种疾病,分摊下来每种疾病只能得到 1000 张扫描图像。如果想要从多家医院收集数据,每家医院走流程都可能花费数月时间,并且研究人员也没有大把的时间来填写不同的表格。相比之下,AlphaZero 的数据收集就容易多了,只需要进行游戏,每小时就能生成数百万个数据。

关于这一点,有其他用户深表赞同。ta 曾见过一个 MRI 数据集,首先由 3 个医生进行标注,然后由领域专家重新检查,这一过程就需要大量的时间。

其次是人机交互方面,至少在可预见的未来,医疗诊断系统需要人类医生的参与。所以,除了进行预测之外,医疗诊断系统还应该输出置信度、其他可能的结果以及任何有用的辅助信息。在很大程度上,如何正确处理这些仍是一个未解决的问题。而 AlphaZero 只需要输出单一动作就行了。

再次,认证。你需要向决策者或医疗许可委员会「证明」医疗诊断系统有效。目前,解释神经网络仍是一个悬而未决的问题,一些人甚至质疑是否存在解释的可能。AlphaZero 不需要任何批准认可,只需在游戏服务器上部署或者找人类玩家测试就行了。

最后,容错成本。如果医疗诊断系统出错了,研发者可能会面临数百万美元的索赔。因此,你必须保证系统运行正确。AlphaZero 在围棋游戏中输了,那真是太糟糕了,仅此而已。

医疗诊断不是「一锤子买卖」

除了数据集大小、医疗认证、容错成本等这些宏观的问题,有网友还提到了另一个问题。不同情况的病患可能在诊断图像上呈现出完全相同的症状,因此医疗诊断系统有时可能会做出误判。

此外,不同机器或不同成像装置生成图像的分布有时大不相同,在一台机器上正常运行的算法可能完全不适用于另一台机器。可解释性也是一个问题。即使你的算法给出了正确的医疗结果,医生也往往会询问算法如何给出结论的。

的确,诊断是一个极其困难的 AI 或 ML 问题。病患的情况远不止一种,也会出现不同的症状。因此,除了医疗诊断系统的初次诊断之外,还需要为进一步诊断、治疗方案、预后以及康健日程等提供智能支持。

作为与健康安全息息相关的领域,AI 医疗的可靠性是最重要的一个问题,但却经常被忽略。即使是病理样本分析,也常常存在一定程度的不确定性。仅对图像加标签会引入各种偏见。即使经过多位专家达成共识,结果也会是如此,并且这还会导致成本的成倍增加。

医疗保健方面的问题非常复杂,AI 目前更适用于日常生活,而不是提供医疗上的最终诊断和预测。有位医生网友表示:「在 AI 医疗领域发表的大部分论文是完全没有用的,但这些研究提供了很多可能性。未来几年,这一领域中炒作宣传的泡沫将会破裂,并且将会由相关法规提高临床实践中引入 AI 工具的门槛。目前,已经有一些产品获得了 EU 或 FDA 支持,但尚不存在临床支持。」

看来,将 AI 真正用于医疗还有很长的路要走。

参考链接:
https://www.reddit.com/r/MachineLearning/comments/mkol81/why_are_correct_ai_medical_diagnoses_seemingly_so/
产业医疗诊断AI
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
AlphaZero技术

DeepMind 提出的 AlphaZero 不仅征服了围棋,也在将棋、国际象棋等复杂游戏中实现了超越人类的表现。DeepMind 推出的 AlphaGo 曾在围棋项目中取得了超越人类的表现,其研究曾经两次登上 Nature。2018 年 12 月,AlphaGo 的「完全自我博弈加强版」AlphaZero 的论文又登上另一大顶级期刊 Science 的封面。在论文中,AlphaZero 不仅征服了围棋,也在将棋、国际象棋等复杂游戏中实现了超越人类的表现。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

推荐文章
暂无评论
暂无评论~