强化学习如何提升ICU抢救效率?普林斯顿大学给出答案

ICU是重症监护室(Intensive Care Unit)的简称,是医院用于抢救危重病人的病房,也是一个医院中医疗资源高度集中的地方。在抢救和监护重症病人的时候,医生常常会陷入一个两难境地:血液化验指标可以提供抢救病人的关键信息,但过于频繁的化验有加重病情的危险,也会增加治疗的费用

图片来源:Pixabay

机器学习为解决这个困难提供了一个思路,来自普林斯顿大学的一个研究团队设计了一个机器学习系统,可以在减少化验频率的同时优化关键治疗的开展时间。

这个机器学习系统目前关注的重点是血液中的乳酸,肌酸,尿素氮和白细胞指标,这四个指标常用于诊断肾衰竭和感染导致的败血症

研究团队使用了MIMIC III的重症患者数据库,这个数据库供收录了于波士顿贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)就诊过的5.8万条ICU病例。最后,有6060例病历记录被用于训练机器学习算法,这些病例都曾在ICU中接受过生命综合体征和血液检测。

强化学习(reinforcement learning)算法在这个机器学习系统中发挥了关键性的作用。算法中的“奖励机制”鼓励系统优先挑选可以提供更多关键信息的验血项目。具体来说,如果算法挑选了更能体现出病人疾病状态变化的、能预示开展临床干治疗(如抗生素、呼吸机治疗)的检验项目,会得到加分。对应的,如果算法挑选的检验项目会提高治疗费用或患者风险,则会被减分。

图片来源:Pexels

在ICU中,医生面临的其实是一个连续性决策问题。上述强化学习算法可以提高机器学习甄选临床检验项目的能力,通过优化临床检验的次序来得到最多的奖励。并且,当事后回顾化验和治疗过程时,能发现经优化的临床检验次序最有利于患者的长期看护和治疗。

这个强化学习算法听起来并不复杂,却需要强大的计算能力。为此,研究团队特意使用了普林斯顿计算机科学和工程研究院(PICSciE)的设备来对数据进行处理。

和医疗中心现有的诊断指南相比,机器学习系统可以给出更有效率的化验策略,并且为重症监护和治疗提供更多的有效信息。以白细胞化验为例,机器学习给出的策略可以提升44%的化验效率。相比现在的治疗节点,医生可以在病情恶化数小时前就开展治疗。

普林斯顿大学计算机科学副教授Barbara Engelhardt博士表示:“新的化验策略可以使医生更早获得足够的信息来决定患者所需的治疗。平均来讲,治疗的时间节点可以比现在实际开展治疗的节点早4小时。”

医疗大数据人工智能的合作,正在为医疗流程提供更深刻的洞见。这项研究有望在化验策略方面为临床治疗提供新的指导,研究团队接下来会和宾夕法尼亚大学医疗系统的预防医疗团队合作,进行临床方面的运用。这将会减轻医务工作者的工作负担和患者的经济负担,并进一步提升医疗效果。

题图来源:Pixabay

参考资料:

Machine learning could reduce testing, improve treatment for intensive care patients. Retrieved Jan 24, 2019 from https://www.eurekalert.org/pub_releases/2019-01/pues-mlc011519.php

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业医疗普林斯顿大学机器学习ICU强化学习
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~