迄今最准确方法诞生!AI预测过早死亡风险,准确率高达76%

人工智能已经在很多领域都取得了突破,为我们的生活也带来了很大的便利。然而,今天我们要介绍的这项研究成果,可能会让正在阅读这篇文章的你感到有一些不安:近日,来自英国诺丁汉大学的研究人员开发了一种算法,可以预测人们过早死亡的几率,其准确率达到了76%,高于目前现有的所有预测模型结果。研究成果发表在了《PLOS ONE》上。

图片来源:123RF

为了更好的对过早死亡风险进行预测,研究人员使用了两种不同类型的人工智能模型进行测试。其中一种模型是深度学习(deep learning)模型,通过分层信息处理网络帮助计算机从示例中学习。而另外一种是随机森林”(random forest)模型,可以结合多种树状模型来考虑可能的结果。研究人员将这两种模型与人类医生研发的传统预测死亡时间的“Cox模型”进行了对比和验证。

在实际算法验证中,研究人员使用了来自UK Biobank 2006年至2010年间50多万人的健康数据,这些人的年龄都在40至69岁之间,对他们的随访一直持续到2016年。在2006年至2010年间,所有研究参与者中有将近14500人死亡,其主要死亡原因是癌症及其他疾病。结果显示,深度学习模型预测人们过早死亡的准确率最高,为76%;其次是随机森林模型,预测准确率为64%;而传统预测方式Cox模型的准确率只有44%,在三种模型中最低。

研究人员研究的基本变量包括参与者的性别、年龄、吸烟状况等。除此之外,不同的预测模型侧重的因素也各有不同。Cox模型在很大程度上倾向种族和身体活动等因素,而擅长机器学习人工智能模型并不看重这些。随机森林模型更强调体脂、血压、人们所吃水果和蔬菜的数量以及肤色,而深度学习模型最看重与工作相关的危害、空气污染、酒精摄入以及特定药物使用情况等因素。

▲不同算法预测死亡风险的频率分布(图片来源:《PLOS ONE》)

“在与严重疾病的斗争中,预防性医疗的重要性正在日益增加。因此,多年来我们一直在努力提高计算机评估普通人群健康风险的准确性,”该研究的第一作者、诺丁汉大学流行病学和数据科学助理教授 Stephen Weng 博士表示:“我们在这一领域迈出了一大步,利用计算机建立全新的风险预测模型,通过人口统计学、生物统计学、临床和生活方式等因素,使用机器学习来评估一个人过早死亡的风险。”

研究人员表示,未来的人工智能将在研发提供个性化药物的方式上发挥重要作用,为个体患者量身定制一系列的风险管理措施。目前,研究人员正在更多的人群中验证他们开发的AI算法,并进一步探索将这一系统应用到日常医疗中的方法。

虽然计算机只能给出一个冷冰冰的数字,来表明一个人的过早死亡风险,但这个数字无疑可以为我们敲响警钟,让我们通过改变自身生活习惯等方式,来提高自身的健康水平,享受更加丰富的人生。

参考资料:

[1] Weng, et al., (2019). Prediction of premature all-cause mortality: A prospective general population cohort study comparing machine-learning and standard epidemiological approaches. PLOS ONE, doi: 10.1371/journal.pone.0214365

[2] Artificial intelligence can predict premature death, study finds. Retrieved April 3, 2019, from https://www.eurekalert.org/pub_releases/2019-03/uon-aic032519.php

[3] Can a computer tell you when you're going to die? Retrieved April 3, 2019, from https://www.foxnews.com/tech/can-a-computer-tell-you-when-youre-going-to-die

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业机器学习随机森林深度学习
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

随机森林技术

在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

推荐文章
暂无评论
暂无评论~