机器之心编辑部报道

7万病例,迄今最大新冠研究发表:传染性超SARS,医务人员感染超三千

截止 2 月 11 日中国内地上报的所有新冠病例中,有 44672 例确诊。其中死亡 1023 例,粗病死率为 2.3%。共有 3019 名医务人员感染了新型冠状病毒 (包括确诊病例、疑似病例、临床诊断病例及无症状感染者,其中确诊病例 1716 名),可能存在非职业暴露造成的感染。

新冠病毒引起的疫情仍在肆虐,截止今天上午,全国统计已有新冠肺炎确诊病例超过 72000 人。

如此大量的病例数据不仅说明了疫情的严重程度,同时也有大量的数据亟待整理分析。近日,在《中华流行病学杂志》上,一篇来自中国疾病预防控制中心(China CDC)的新研究引发了所有人的关注。在该论文中,研究人员调查了截至 2 月 11 日中国内地传染病报告信息系统中上报的所有新型冠状病毒肺炎病例,总人数高达 72314 人。这是迄今为止调查范围最广,最具统计学习意义的一份研究。

在该研究中研究人员表示,早期病例表明,新冠病毒(2019-nCoV)可能不如 SARS-CoV 和 MERS-CoV 严重,但随着发病数迅速增加,以及越来越多人际传播证据表明,该病毒比 SARS 和 MERS 更具传染性

该项研究为新型冠状病毒肺炎流行病学特征分析,团队来自中国疾控中心新型冠状病毒肺炎应急响应机制流行病学组。目前研究论文的全部内容已公开。

论文地址:http://chinaepi.icdc.cn/zhlxbx/ch/reader/view_abstract.aspx?file_no=004&flag=1

最大规模流行病学研究

这篇论文是一项对流行病学特征进行描述和分析的研究,采用横断面研究设计,参考了 STROBE 指南。这项研究最大的亮点在于对(截止研究结束前)所有的中国内地病例进行了研究。这是利用报告上来的所有病例开展的工作,能够最大程度地覆盖样本总体。

以下为论文重点内容:

  1. 中国内地共报告 72314 例病例,包括确诊病例 44672 例(61.8%)、疑似病例 16168 例(22.4%)、临床诊断病例 10567(14.6%),以及无症状感染者 889 例(1.2%);

  2. 年龄方面,大多数年龄在 30-79 岁(86.6%),感染者所在地则主要集中于湖北(74.7%),严重程度上以轻/中症病例为主;

  3. 在确诊病例中,已有死亡病例 1023 例,粗病死率为 2.3%

  4. 个案调查显示,去年 12 月,疫情已开始向湖北省外传播,而流行曲线在 23-36 日达到峰值,并观察到发病数下降的趋势;

  5. 医务工作者感染情况严重,截至 2 月 11 日,有 1716 名医务工作者确诊,5 人死亡

  6. 最终结论:疫情从首次报告日的 30天 蔓延至 31 个省级行政区,2 月 1 日出现了单日发病异常高值,而后逐渐下降。新冠肺炎病毒的传播能力比非典病毒更强。

数据与方法

这篇论文描述与分析了截至 2020 年 2 月 11 日报告的所有中国内地 COVID-19 病例的流行病学特征。该论文表示,自去年 12 月 31 日起,全国各级 CDC 联合开展了 COVID-19 调查,因此研究者可以从病例报告系统中提取所有数据。不过在分析过程中,所有病例的个人身份和其它可识别信息都有去除,以保护个人隐私。

按照规定,关于 COVID-19 的所有病例都应该上报系统,且病例纪录非重复。该项研究包含了所有病例,即确诊、疑似、临床诊断等等。这些病例可以组成一个大型数据集,数据特征为流行病学相关的信息。例如,人口学特征、诊断时间、武汉接触史、症状严重性等等。

统计学分析

有了这么多病例数据后,统计学分析会更精确一些。该论文表示,对于确诊病例,可以使用描述性统计病例的人口学和临床特征。该论文制作了很多可视化分析结果,通过研究者对病例特征的理解,统计学分析主要关注病死率、年龄性别分布、地理分布和疫情流行曲线。

具体而言,该论文做了如下统计学分析:

  • 确诊病例死亡数(分子)除以确诊病例总数(分母),以确认粗病死率;

  • 确诊病例死亡数(分子)除以确诊病例的累计观察人天数(分母),以计算病死率密度;

  • 使用确诊病例诊断时的年龄,分别绘制武汉、湖北和中国区域的年龄分布图,并计算男女性别比;

  • 将诊断时每个病例的县级位置用于绘制彩色疫情地图,从去年 12 月 31 日到 2 月 11 日分为五个时段,以报告省份统计的病例数分布图;

  • 通过病例数(y 轴)与最早出现临床症状的自我报告发病日期(x 轴)来绘制疫情流行曲线;

  • 分别分析了湖北省以外的确诊病例(是否有武汉相关的暴露)和医务人员病例(确诊病例和疑似病例)的疫情流行曲线。

研究结果

病例总体统计情况

论文介绍了在总报告病例数 72 314 例中,确诊病例 44 672 例(占 61.8%)。而针对确诊病例(44 672 例)的基本特征,大多数年龄在 30~69 岁之间(77.8%),51.4% 为男性,农民或工人占 22.0%,湖北省占 74.7%,80.9% 属于轻症。

总体粗病死率 2.3%,湖北省更高

在已知的 44,672 例确诊病例中,共有 1,023 例死亡,粗病死率为 2.3%,病死率密度为 0.015/10 人天,即平均每个患者观察 10 日的死亡风险为 0.015。老年人的粗病死率更高,例如,在≥80 岁年龄组的粗病死率最高为 14.8%。男性的粗病死率为 2.8%,女性为 1.7%。按职业划分,退休人员的粗病死率最高为 5.1%。

在地域分布上,湖北省的粗病死率(2.9%)高出其他省份(0.4%)。在性别和感染情况上,男性感染者数量、粗病死率等都高于女性。

基础性疾病患者粗病死率更高

论文也统计了基础性疾病对新冠病毒肺炎患者的影响。其中,未报告合并症患者的粗病死率约为 0.9%,有合并症患者的病死率则高得多。

具体数据而言,心血管疾病患者为 10.5%,糖尿病为 7.3%,慢性呼吸道疾病为 6.3%,高血压病为 6.0%,癌症为 5.6%。论文也研究了基础性疾病和重症的关系。其中,重症病例占 13.8%,危重病例占 4.7%。危重病例的粗病死率为 49%,病死率密度为 0.325,即平均每个危重病例观察 10 d 的死亡风险为 0.325。

因为基础疾病患者有更大的风险,年龄上确诊病例的分布主要体现在中老年。

医务人员感染

论文指出,医务人员病例发病的高峰期可能出现在 1 月 28 日。在为新冠肺炎患者提供诊治服务的 422 家医疗机构中,共有 3019 名医务人员感染了新型冠状病毒(1716 名确诊病例),其中 5 人死亡。论文认为,其中可能存在非职业暴露造成的感染。

医务人员的发病日期分布图。

此外,研究对 1 688 名有病情严重程度的确诊病例进行分析,武汉有 1080 例,占全国医务人员发病总数 64.0%,湖北除武汉外的其他地区 394 例(占 23.3%),除湖北外全国其他 30 个省(区/市)214 例(12.7%)。

重症病例上,在武汉的为 17.7%,湖北全省则为 10.4%,非湖北为 7.0%。按照不同时段,武汉医务人员重症比例从最高时 38.9%,逐渐下降,到 2 月上旬 12.7%(表 2)。

论文还指出,截至目前还没有证据表明,在任何一家为新型冠状病毒肺炎患者提供服务的医疗机构中发生了「超级传播者」事件。

药物临床实验取得进展

值得注意的是,在新冠病毒肺炎的有效药物的临床实验取得了一定的进展。在 2 月 17 日下午的国务院联防联控机制新闻发布会上,科技部生物中心副主任孙燕荣介绍说,目前,抗疟药磷酸氯喹已在临床上「非常确定地」显示出对新冠肺炎的疗效,且未发现和药物相关的严重不良反应。

与此同时,法匹拉韦、瑞德西韦两种针对新冠病毒肺炎治疗的药物临床实验也在继续,其中法匹拉韦已经上市,为流感治疗药物。以上三种药物都是由国家科技部筛选出来的。

钟南山:新冠肺炎将在 2 月中下旬达到峰值

越来越多的研究让我们对于新冠病毒的了解变得更加深入,它的高传染性和对于多个器官的危害让我们不得不采取最为严格的防御措施。不过随着隔离等措施逐渐显现效果,目前严重的疫情可能很快就会到达峰值。

2 月 17 日下午,广州医科大学附属第一医院副院长张挪富带领广东医疗队,在武汉协和医院西院区通过网络平台与钟南山院士进行视频会诊。期间,钟南山院士表示根据现有数学模型和政府采取的有力措施,预计在 2 月中下旬出现峰值,4 月左右全国疫情会平稳。

随着人们返回工作岗位,我们仍需积极应对可能出现的疫情反弹。希望在各方努力之下,我们很快能够度过这一难关。

在这特殊的时期,贪心学院决定联合国内外顶尖AI专家(包括ALBERT第一作者兼谷歌科学家蓝振忠博士)一起筹划”共同战疫,贪心在行动“的计划,提供免费NLP专题课程,共5次直播。从词向量,LSTM,ELMo,BERT,XLNet到ALBERT, 主要讲解近10年NLP领域最为颠覆性的成果。

入门最大规模流行病学研究新冠病毒肺炎
相关数据
ELMo技术

ELMO 是“Embedding from Language Models”的简称, ELMO 本身是个根据当前上下文对 Word Embedding 动态调整的思路。ELMO 采用了典型的两阶段过程,第一个阶段是利用语言模型进行预训练;第二个阶段是在做下游任务时,从预训练网络中提取对应单词的网络各层的 Word Embedding 作为新特征补充到下游任务中。

推荐文章
暂无评论
暂无评论~