最新R0值3.11,疫情何时高峰难预测,这是你该知道的最新进展

也许对抗新型冠状病毒还需要更长的时间和更多的努力,但我们终将胜利。近日,在国内外多个团队的传播预测研究中,代表疫情传染速率及峰值等因素的 R0 值,也正在发生着变化。

据卫健委最新数据,1 月 28 日 0-24 时,全国范围内的 31 个省(区、市)报告新增确诊病例 1459 例,新增疑似病例 3248 例。

截至 1 月 28 日 24 时,国内 31 个省(区、市)累计报告确诊病例 5974 例。现有疑似病例 9239 例。

随着全国乃至世界范围内确诊人数的持续增长,人们最担心的问题不外乎几个:

1、疫情会在很长一段时间仍处于快速蔓延的状态吗?何时能达到峰值?

2、无症状感染该如何预防?

3、新型冠状病毒何时能有疫苗?

昨日,钟南山院士接受媒体采访时表示:「疫情什么时候达到高峰,很难绝对地估计。不过我想应该在一周或者十天左右达到高峰,不会大规模地增加了。」

与此同时,在昨晚的《新闻 1+1》栏目主持人白岩松与李兰娟院士的对话中,我们也得知,浙江的国家重点实验室分离出了 3 株新型冠状病毒的病毒株,已经开始制备疫苗。

值得肯定的是,随着限制措施的进一步加强和对新型冠状病毒的研究逐渐深入,我们会找到抗击疫情更有效的方法。

近日, 机器之心曾在文章中介绍了国内外高校研究团队关于本次疫情传染速率及峰值等预测的传播动力学模型 。通过建模去评估、预测病毒的传播路径、速率,对于了解并控制疫情的发展具有重要意义,而通常用来反映传染病爆发的潜力和严重程度的 R0 值(数值越高表示疫情越严重),近几天来也经历了一个变化。

英美团队研究者再次更新 R0 值:3.11

来自英国兰开斯特大学等高校的团队在最初预测版本中得出的 R0 值为 3.8,之后,论文作者结合诸多不确定性因素更新了这一数字,为 2.5%。

今日,论文作者再次在个人推特上放出更新结果。重新评估后的 R0 值是:3.11

最新版论文地址:

https://www.medrxiv.org/content/10.1101/2020.01.23.20018549v2

这一版本有五处更新:

1、案例数据更新至 1 月 22 日。没有使用这一日期之后数据的原因是,自这日起,武汉市卫健委不再发布全市新型冠状病毒感染的肺炎情况,全省感染数据情况由湖北省卫健委统一发布;且该日后中国采取了更广泛的防控手段;

2、进一步完善了 似然函数,更好地解释了最早确诊的 41 个病例。现在可以使用所有武汉确诊感染病例(而不只是疑似病例)来预测国际旅客的感染传播情况;

3、改进了 参数不确定性的表征,并使用更加严谨的统计方法计算了流行病轨迹的 置信区间

4、在 敏感性分析中延长潜伏期的时间,以反映家庭群集中长达 6 天的潜伏期报告;

5、移除了旅行行程的限制,因为不同的建模方法(例如随机传输,而不是确定性传输)更适合于这种情况的分析。

可以说,虽然目前疫情已经引起了足够的重视,相关阻断措施也在不断加码中,但疫情的发展仍然存在着很多的不确定。

除此之外,来自美国约翰霍普金斯大学和香港大学的两个研究团队也发布了相关传播预测研究。

需要注意的是,后两项传播预测研究结论是基于 1 月 25 日甚至更早时所公布的统计数据,而且研究者也在说明中指出了研究存在的一系列局限性,但我们仍可以从中得到一些启示。

港大学者:不采取措施的情况下, R0 值为 2.13

国内,香港大学学者 Gabriel Leung 教授和 Joseph Wu 教授近日也对新型冠状病毒的爆发程度、国内外传播情况进行了分析和预测。

早在 1 月 21 日,两位教授已经就本次新型冠状病毒肺炎发布过相关研究报告(当时结论取自 21 日之前的案例数据),事实上,疫情在后来的每一天都面临着非常多的变化。

21 日所发布报告地址如下,可对比阅读:

https://www.med.hku.hk/f/news/3543/7406/presentation_wuhan_20200121_final_1033.pdf

1 月 27 日,两位教授在此前研究的基础上,结合更新的案例数据,发布了最新传播预测报告,新增了 R0 值等重要评判维度。

27 日报告链接:

https://www.med.hku.hk/f/news/3549/7418/Wuhan-coronavirus-outbreak_AN-UPDATE_20200127.pdf

基于截止到 1 月 25 的上报案例数据,27 日报告得出以下结论:

1、本次新型冠状病毒肺炎的 R0 值为 2.13,浮动范围是 1.92 到 2.31 之间;

2、感染人数将在 6.2 天内翻倍。

需要注意的是,该报告基于的假设是「在不采取任何防护措施的情况下」,同时两位学者也提到:「一些感染者处于潜伏期,因此研究所使用的案例数低于实际感染数量。

香港大学 Gabriel Leung 教授和 Joseph Wu 教授在 1 月 27 日的媒体发布会上。

同时,新型冠状病毒的扩散与航空、铁路、客运等运输工具有着很大关系,大部分城市的主要扩散方式都是铁路。例如北京,总体在 1 月 25 号预测为 150 例,其中箱线图的最小与最大分别为 72 与 260。之所以要做这样的「当前预测」,是为了检测模型对后期预测的可信度,就像 ML 中的 验证集一样。

现在我们看看向后的预测是什么样的,港科大表示,隔离交通的影响有限。如下所示武汉从 1 月 23 日开始隔离或不隔离的效果差不多,差不多日常感染会在 4、5 月份达到最高。

在报告的最后,给出了一些结论和建议:

1、新型冠状病毒将成为全球性的流行病;

2、在中国的一些重点城市中,已经存在当地社区中的自发传播;

3、应立即采取严格限制人口流动的措施,比如取消聚集型活动、关闭学校(可以看到,目前全国范围内已落实);

4、一些之前重大疫情爆发时的措施可以借鉴,比如非典、中东呼吸综合症和大型流感。

5、与中国主要交通港口有紧密联系的区域,要尽早做好准备。

美国约翰霍普金斯大学疫情控制最新研究

此前,来自约翰霍普金斯大学的研究团队曾结合实时数据制作「冠状病毒扩散地图」,数据来自世界卫生组织(WHO)、美国疾病预防控制中心 (ECDC)、中国疾病预防控制中心(CCDC)、中国卫生应急办公室(NHC)和丁香园,将疫情进展通过可视化的方式向公众展示。

图中数据截止到北京时间 1 月 29 日 13 时。

地址:

https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

1 月 26 日,团队在约翰霍普金斯大学系统科学与工程中心博客中进一步介绍了这项研究。

研究由约翰霍普金斯大学系统科学与工程中心的 Lauren Gardner 领衔,团队成员还包括新南威尔士大学的 Aleksa Zlojutro 和 David Rey,以及同在约翰霍普金斯大学系统科学与工程中心的 Ensheng Dong。

模型

研究团队基于去年 12 月发布的模型「疫情边界控制决策支持框架」做出新的分析,该模型将此次新型冠状病毒肺炎的疫情动态和疫情控制集成至决策支持工具中,以便于在疫情爆发前期通过边境控制从而减轻疫情进一步扩散。

团队采用随机集合种群流行病模拟工具模拟疫情动态,并且在建模过程中考虑边境防范机制(入境检查),其主要用于识别感染者或高危人群。

模型详情:

https://systems.jhu.edu/wp-content/uploads/2020/01/Gardner-JHU_nCoV-Modeling-Report_Jan-26.pdf

集合种群模型主要根据人口网络来构建,其中网络分为市内和城际等部分,网络的边为不同城市之间的航空线。在此网络的每个节点上,研究者使用一个离散时间的 Susceptible-Exposed-Infected-Recovered(SEIR)模型来模拟疫情爆发动态变化。再通过一系列 参数的设定,包括有效传播率 R0=2(基本传染数)、2019-nCoV 的初始病例只存在于武汉等,研究者完成了建模。

结论

模型模拟是从疫情开始直至 1 月 25 日,研究者可以从模拟结果中观察到很多有意思的信息。具体而言,研究者估计截止 1 月 25 日,已有 40 例 2019-nCoV 病例从中国内向海外流出。同时,研究团队预估中国国内 2019-nCoV 病例数可能已远远高于整个一月份报告的数量。

团队预估截止 1 月 25 日国内大约有 20000 例 2019-nCoV 病例(当时所报告出的数量为近 2000 例)。研究者还估计在 12 月初武汉就已有数百人感染病毒。

图 1 介绍了在 1 月份的预估病例,此模型预估数略高于另外两个模型,其中一个即帝国理工学院所报告的于 1 月 18 日在中国大陆大约有 4000 位病例,而另一个则是美国东北大学所报告的于 1 月 24 日约有 12700 位病例。同时在这段时间里,海外的地区所报告的病例也有所增加,可能会导致病例数量超过此次研究所预估数。

预估数 vs. 全球报告 2019 n-CoV 病例数

此次模拟提供了直至 1 月 25 日全球每个机场的预估病例进入数(基于乘客的最终旅游目的地)。通过这些数据汇总至以一个国家/地区为单位的所有机场,可以推出每个国家预估的病例进入总数。

图 2 展示了团队预估抵达每个国家/地区的病例数量于截止至 1 月 26 日 2019-nCoV 报告病例数的对比,同时研究者所确定风险最高的 13 个国家/地区都报告出了至少一例病例。

图 2:新型冠状病毒输入型风险最高的国家/地区列表。

团队进一步在机场角度去提供预测结果(基于乘客最终旅行的目的地),为了确定中国境内和境外病例进入的一些高风险城市集合。中国境内和境外的前 50 个高风险机场分别如图 3 和图 4,可以看出感染风险最高的城市一般是从武汉能够直接或间接到达的。同时,已有许多中国以外的高风险城市已报告了病例,但这些城市更应该注意在 1 月 23 日武汉封城前离开的乘客,以防更多感染病例。在美国,这些高风险城市已经被疾控中心定点筛查(LAX,JFK,SFO,ATL,ORD)。通过完整的旅行路线分析(包括中途所停留的机场),研究人员还确定其他可能接触到感染者的机场,并对这些国际机场做出了建议。

图 3:中国大陆范围内新型冠状病毒感染风险最高的 50 个机场


图 4:中国大陆以外新型冠状病毒感染风险最高的 50 个机场

局限性说明

与此同时,团队也在博客中说明了这项研究可能会存在的局限性。

1、在本次分析完成的第二天,所报告的旅行类感染病例数量从 40 人变为 56 人,上涨了 40%。因此,本次分析所用的数据很可能是最保守估计的数量。

2、新型冠状病毒的传播仍然存在不确定性,尤其是基本再生数(R0 值)和潜伏期。1 月下旬以来报告病例数量的大幅增长显示了分析数据可能还是相对保守了。

3、没有涵盖无症状感染的情况。如果无症状感染传播被证实,那么事实上的风险比这次分析的还会更高。

4、模型只包括旅客的航空出行情况,不包括城市内部及城际间的其他交通方式,因此可能低估了其他出行方式下的区域分布风险。(这一点最需要注意,事实上,铁路、区域长途客运、市内公共交通等运输方式在中国占据了更高的比例。)

5、本次分析中用来模拟每座城市疫情爆发的 SEIR 参数是确定的,但真实情况中感染旅客在城市之间流动的传播情况是不确定性的。

6、虽然本次分析未考虑到 1 月 23 日武汉所实施的封城措施和机场的旅客检测措施,但这些措施不会太影响现有的分析结果,目前的结果是基于疫情爆发到 1 月 25 日的数据和情况得出的。

受多方面因素的限制,传播预测模型可能会与后续的实际情况有所出入。接下来,团队将专注于两个方面的预测:

一是在中国各地都在爆发疫情的前提下,假如旅客不再是直接从武汉出发,那么该如何确定全球范围内哪些旅行路线可能会继续扩散新型冠状病毒?

二是给予一些决策上的直接支持,比如判定全球范围内的哪些机场应该优先对旅客进行检测。

北大团队以深度学习算法分析病毒基因序列,水貂或为中间宿主

自疫情爆发后,新型冠状病毒的传染源一直悬而未知。1 月 24 日,北京大学工学院生物医学工程系朱怀球团队在论文预印本平台 bioRxiv 上发布了一篇论文,利用 深度学习算法分析了新型冠状病毒与其他冠状病毒的基因序列,来预测潜在的病毒宿主。

分析结果表明,蝙蝠和水貂可能为新型冠状病毒的的两个潜在宿主,水貂则可能为病毒的中间宿主。

论文地址:

https://www.biorxiv.org/content/10.1101/2020.01.21.914044v2

研究表明,新型冠状病毒与人类的其他冠状病毒具有相似的感染模式,尤其是严重急性呼吸综合症冠状病毒 (SARS-CoV)、蝙蝠 SARS 样冠状病毒(Bat SARS-like CoV)、中东呼吸综合症冠状病毒 (MERS-CoV)。

在与其他脊椎动物的冠状病毒对比之后,研究发现,蝙蝠冠状病毒与新型冠状病毒的感染模式最为相似;而在对比了其他脊椎动物冠状病毒宿主的感染模式以后,发现水貂病毒的传染模式与新型冠状病毒的感染模式最为接近。

这项研究对于之后的病毒分析和病毒病原体的早期预防和控制具有重要意义。

入门传播预测新型冠状病毒
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

验证集技术

验证数据集是用于调整分类器超参数(即模型结构)的一组数据集,它有时也被称为开发集(dev set)。

置信区间技术

在统计学中,一个概率样本的置信区间(Confidence interval),是对这个样本的某个总体参数的区间估计(Interval Estimation)。置信区间展现的是,这个总体参数的真实值有一定概率落在与该测量结果有关的某对应区间。置信区间给出的是,声称总体参数的真实值在测量值的区间所具有的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%, 60%),那么他的真实支持率落在50%和60%之区间的机率为95%,因此他的真实支持率不足50%的可能性小于2.5%(假设分布是对称的)。

敏感性分析技术

敏感性分析是研究数学模型或系统的输出的不确定性(数值或其他)如何能够分配到输入中不同的不确定性来源

似然函数技术

在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。 似然函数在统计推断中有重大作用,如在最大似然估计和费雪信息之中的应用等等。“ 似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“或然性”或“概率”又有明确的区分。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~