这种每年导致几十万人死亡的疾病,AI已经找到了预测方法!

急性冠状动脉综合征(ACS)指以冠状动脉粥样硬化斑块破裂或侵袭,继发完全或不完全闭塞性血栓形成为病理基础的一组临床综合征。ACS是一种常见的严重心血管疾病,是冠心病的一种严重类型。如果不及时治疗,可能会导致心脏病发作,甚至对生命安全造成威胁。数据显示仅在美国,每年就有超过 61 万人死于心脏病。因此,这种疾病的及时治疗和预防是非常重要的。

图片来源:Pixabay

针对这一情况,来自IBM和阿斯利康的科学家们研发出了一个机器学习模型,能够检测出早期的ACS迹象并提出预警。这篇论文目前已经发表在了Arxiv.org上。

该团队使用了一个数据集进行研究,该数据集由中国 38 家城市及农村医院的 26986 名成年住院患者组成,记录了他们的年龄、性别、病史、习惯、实验室检查结果、治疗步骤、ACS类型和近40个其他特征。研究人员将这些特征反馈给他们研发出的神经网络,来同时对四个因素进行预测:患者在患上ACS之前是否出现过主要不良心血管事件 (MACE);他们是否接受过抗血小板药物治疗,以防止形成冠状动脉内血栓;他们是否接受过用来降低血压的β受体阻滞剂治疗;他们是否接受过他汀类药物治疗(这种药物有助于降低胆固醇水平,进而预防心脏病发作和中风)。

▲该研究的示意图(图片来源:arxiv.org)

接下来,研究人员采用了k均值聚类算法,这是一种统计方法,按照数据点的相似性,将它们分配到集合中。研究人员根据从神经网络中获得的分类数据,将患者划分成了7个不同的群组。从这些群组的研究中,他们获得了很多有用的结论:在MACE出现率高但患病率低的人群中,糖尿病是ACS的预测因素之一;而在另一个包含“严重”疾病患者的群组中,年龄和收缩压在ACS进展中发挥了很大的作用。 

研究人员提醒说,尽管这些指标对疾病预后有影响,但它是否能(或应该)为临床实践提供所需的信息,这一点尚未明朗。同时他们还指出,如果没有进行进一步研究的话,这些可能导致ACS的因素就无法直接转化为临床干预。尽管如此,他们的工作表明,由AI驱动的聚类分析对于ACS患者的风险预测来说,是一种很有前景的方法。 

参考资料:

[1] AI predicts precursors to heart attacks. Retrieved March 15, 2019, from https://venturebeat.com/2019/03/05/ai-predicts-precursors-to-heart-attacks/

[2] Xia, et al., (2019). Outcome-Driven Clustering of Acute Coronary Syndrome Patients using Multi-Task Neural Network with Attention. Arxiv.org, arXiv:1903.00197

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业
相关数据
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

分类数据技术

一种特征,拥有一组离散的可能值。以某个名为 house style 的分类特征为例,该特征拥有一组离散的可能值(共三个),即 Tudor, ranch, colonial。通过将 house style 表示成分类数据,相应模型可以学习 Tudor、ranch 和 colonial 分别对房价的影响。 有时,离散集中的值是互斥的,只能将其中一个值应用于指定样本。例如,car maker 分类特征可能只允许一个样本有一个值 (Toyota)。在其他情况下,则可以应用多个值。一辆车可能会被喷涂多种不同的颜色,因此,car color 分类特征可能会允许单个样本具有多个值(例如 red 和 white)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

聚类分析技术

聚类分析(CA)是一种典型的无监督学习方法,这种方法是根据对象的特点将它们分成不同的组。K-均值是应用最广泛的聚类方法,其它方法还包括 k-Medoids、分层聚类和 DBSCAN。期望最大化法(EM)也是聚类分析的一种解决方案。聚类分析在数据挖掘、市场调研、异常值检测等许多领域都有应用。另外,降维技术也是一类类似于聚类分析的无监督学习方法,其典型的代表有主成分分析(PCA)、线性判别分析和 Isomap。

k均值聚类技术

k 均值聚类算法是原型聚类(prototype-based clustering)和划分聚类算法(Partitional Algorithms)中最常见的算法。k 均值算法的目标是最小化聚类所得簇划分的平方差。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

推荐文章
暂无评论
暂无评论~