【河南省新冠病患知识图谱可视分析系统】项目详细介绍

指导老师:蒋秉川 任琰 谭力恒

团队成员:牛加胜(队长),李丁,史凯文,龚禧,祁可贵

创作初心

本作品构建“河南省新冠病患知识图谱可视分析系统”,利用地理知识图谱与交互可视分析相关技术,基于官方发布的病患信息结合时空位置信息构建新冠病患知识图谱,综合运用地理知识语义网模型与时空分析模型进行协同分析,能够实现实时掌握疫情态势,发现病患关联关系,分析病患时空分布,超级传染源挖掘,关键节点分析,高危人群防控等功能,可达到“宏观态势把控”到“精准病患防控”的多级分析与应用,可用于提高新冠肺炎疫情监测、预测与应对的科学性、准确性,为进一步推动突发重大传染病疫情的智能化防控提供支撑,有助于进一步精准定位疫情传播路径,防控疫情扩散。

视频链接:https://v.youku.com/v_show/id_XNDU5Nzk1ODM3Mg==.html

作品简介 

1.整体设计思路

团队成员来自高校,整合在知识图谱与可视分析领域的研究基础,主要结合知识图谱语义网模型与地理时空可视分析模型的优势,利用交互协同分析的方法,在掌握整体态势的基础之上,实现病患关系、时空行为模式等的挖掘。作品兼具学术与工程应用的特色。

基本思路:综合地理知识图谱的基本分析框架,以知识图谱语义网模型和时空数据模型为基础,充分发挥语义网图分析和地理时空分析的特点,进行综合分析与应用。地理时空可视分析的优势能够直观表示疫情态势的空间分布和扩散态势,语义网的优势能够探索确诊病患的关系。如图1所示,基于时空数据模型的分析包括地理时空分布、时空轨迹分析、人物事件分析和时空态势分析等功能,主要用于“宏观态势把控”。基于知识图谱语义模型的图分析包括:关系分析、网络图分布、链接预测和图谱可视化等功能,主要用于“精准病患防控”。 

                                图1 语义网模型与时空模型联合分析

2.系统框架

实验平台采用B/S架构,基于ECharts和Java语言开发实现,整合地理信息系统地理信息丰富、病患知识图谱语义分析、可视分析系统交互可视分析的特点,构建了新冠病患知识图谱系统。系统界面如图2和图3所示,主要包括态势监控模块和病患关系分析模块,态势监控模块主要由全国疫情态势折线图、疫情变化动态气泡图、迁徙图、网络节点图和地图分布图组成,详细介绍见第四部分;病患关系分析模块主要包括地图展示视图、病患关系网络视图和事件列表视图。

                                                      图2 疫情态势监控 

                                               图3 病患知识图谱可视分析

3.系统功能

(1)全国及河南省疫情态势展示。通过曲线图、气泡图、迁徙图、病患关系图、地图分布等视图的统一界面展示,实现对河南省疫情整体态势展示。曲线图展示全国和河南省疫情发展态势、疫情节点分析;气泡图表示全国各省市新冠病患发展趋势;迁徙图主要依据人民网客户端发布的确诊患者高铁迁徙路径;网络节点图表示病患知识图谱关系网络;地图分布表示河南省每日确诊病例的分布情况。

(2)病患关系及轨迹查询。可查询病患之间的关联关系、病患的迁徙轨迹、市内活动轨迹及病患的详细信息。病患关系图谱包括:“病患—病患”、“病患—所在地”、“病患—就诊医院”、“病患—出发地/目的地”、“病患—事件”、“事件—医院”、“事件—地点”等关系类型。市内活动轨迹可在地图上展示。

(3)河南省病患关系追踪与挖掘。可通过与地图联动的协同分析,通过病患类型分析、地区防控态势分析、聚集传染案例分析、高危群体防控、市内轨迹分析、漏报瞒报情况分析等实现病患关系追踪、高维群体防控信息发布、事件规律分析等功能。

作品价值及影响力

系统除了能够掌握全国及河南省疫情态势,进行相关信息的查询外,通过可视化和视图交互,可进行如下分析:

河南省疫情宏观态势监控 

多视图协同可视分析方法充分掌握当前疫情态势,包括:

(1)河南省疫情态势变化视图。通过曲线图,显示河南省(及全国)确诊患者、疑似病例(后续疑似病例不再发布,出现曲线图断开)、死亡人数等动态变化。

                                                  (a)河南态势                        

                                                    (b)全国态势

                                          图4 河南及全国疫情变化趋势

(2)河南省患者关系图。通过“节点-链接”网络图展示河南新冠患者人物关系、患者-所在地、患者-事件、患者-收治医院等关系。

                                            图5 河南省新冠病患关系网络

(注:此图应用了InteractiveGraph工具(https://github.com/grapheco/InteractiveGraph))

(3)河南省病患分布点状分布图。通过河南省所有病患的位置,通过点状分布图了解确诊病患地区分布。

                                             图6 河南省新冠病患地图点状分布

(4)全国疫情发展趋势图。通过全国各省新冠病患发布数据,通过气泡图动态展示各省市确诊人数、疑似人数、死亡人数的动态变化。柱状图展示河南省各省市疫情的分布态势。

                                          (a)河南省各省市疫情态势              

                                             (b)全国疫情发展趋势

                                                   图7 全国疫情发展趋势图

(5)河南省病患迁徙图。基于病患迁徙位置数据和高铁分布数据,利用迁徙图动态展示病患迁徙轨迹。

                                                          图8 患者迁徙图

河南省确诊病患精准防控

主要通过河南病患知识图谱交互式可视分析的方法,实现病患关系追踪、病患轨迹查询、超级传播者分析、高危人群防控等实现河南省确诊患者的精准防控。

(1)病患类型分析。通过“病患案例”、“出发地”和“目的地”实体关联分析,案例大部分与武汉有直接联系,即属于“直接输入型病例”,游离的病患节点为“间接输入型病例”。

                                       图9 “病患-出发地/目的地”关系分析

                                   图10 与武汉地区有直接关系的病例

(2)地区防控态势分析:通过“病患案例”与“所在地”关联分析,可看到河南省各市县的确诊病例分布情况,“信阳”、“南阳”、“郑州”、“商丘”等地的确诊病例明显较多,并可发现少部分案例在封城之前与其他城市有所接触,而“济源”、“漯河”、“三门峡”等地区人员控制比较硬核,几乎没有人员流动。

                                              图11 “病患——在地”关系分析

(3)病患医院收治情况分析:通过“病患案例”与“医院”关联分析,可看到各定点医院收治情况,“信阳市第四人民医院”、“信阳市第五人民医院”、“罗山县人民医院”、“郑州市第六人民医院”等医院收治病患较多,有较大压力,可为病患就诊和政府物资调配提供意见参考。此外,发现具有亲属关系的病患存在收治于不同医院的情况,可建议收治于同一家医院。 

                                             图12 医院收治情况关系分析

                                         图13 有亲属关系的病患收治于不同医院

(4)家庭聚集传染案例分析:病患案例关系分析,可发现非常典型的家庭聚集型传染案例,例如最多者1人传染了9个人,属于超级传播者,可查询期迁徙轨迹,需要重点进行防控。若有进一步的相关数据支撑,可重点防控其接触的人和地点。

                                                    图14 病患关系分析

                                                      图15 超级传染者分析

(5)高危群体防控:病患与车次关系分析,发现典型旅游团传染,V704与V705航班前往越南旅游团,已有6人确诊,民航部门应采取措施,对所搭乘人员进行重点通报和采取隔离措施。

                                                    图16 航班与高铁车次预警

(6)病患市内轨迹分析:病患市内轨迹和迁徙轨迹分析,可通过市内轨迹分析和事件,对所到地点和搭乘公共交通分析进行重点通报和管控。市内轨迹如左图所示,中间显示“就诊事件—就诊事件—就诊事件—就诊事件—确诊事件”事件继承关系网络,右侧显示事件轴列表。

                                                 图17 病患市内轨迹分析

(7)病患事件查询与规律分析:病患事件查询,通过事件列表,可掌握病患所经过的地点和接触的人员,有利于进一步对人员进行把控。

                                              图18 “病患—事件”关系分析

(8)漏报瞒报情况分析。通过可视化交互发现,病例17和病例41同日乘坐同一车次高铁,且就诊医院和所属地区一致,可能为亲属,但病例公开信息里没有涉及,疑似漏报/瞒报现象。

                                                图19病患潜在关系分析1

    

                                               图20病患潜在关系分析2

系统发布后,得到学术界和产业界的广泛关注,受到多个微信群的转发。项目组已与河南卫健委取得联系和沟通,对系统进行进一步优化和改进后进行推广使用。项目组与解放军疾病防控控制所(现在武汉防治一线)展开合作,对疾病的预防、防控提供了较好的意见建议。另外,通过系统可挖掘超级传染者和关键节点,发布重点防控人群信息,风险区域评估和重点车次/航班预警,均可应用于各级政府疫情防控部门,为精准防控、精准布控提供信息支撑。


作品技术说明

1.新冠病患数据采集

新冠数据包括的数据类型如下:

    数据来源:每日疫情数据:国家卫计委和各省市卫健委官方网站;

    迁徙数据:人民日报客户端公布出现疫情高铁车次数据以及确诊病患的迁徙位置数据;

    新冠病患知识图谱数据:河南省卫健委官方网站,河南省共青团官方微信;

    新冠病患位移轨迹数据:通过病患信息调用百度API进行处理。

针对不同的数据源,对数据清洗、整理后形成病患数据,通过实体、关系抽取,建立病患、医院、出发地、目的地、车次、事件之间的关系数据,存储为三元组数据,数据格式为json文件。数据截止时间为2020年3月13日,实体数量2312个,实体关系为5055个,实体标签包括“患者”、“车次”、“居之地”、“出发地”、“目的地”、“医院”、“事件”等。

2.新冠病患知识图谱构建

定义概念集ON_Concept:{C,E}

ON_Concept:{C}定义为:{C1:新冠病例,C2:居住地,C3:就诊医院,C4:交通工具,C5:所在地,E:事件本体}。C1:新冠病例指确诊新冠病例;C2:指新冠病例居住地;C3指新冠病例所就诊医院;C4:指新冠病例迁移所乘交通工具;C5:指新冠病例所在地;E:事件本体,主要包括就诊事件、确诊事件、旅行事件、接触事件、购物事件、聚集事件、居家事件和发热事件。病患和事件图谱关系构建,如图16和图17所示。

                                                  图16 病患实体及关系构建

                                          图17 事件模式层和关系示例

3.知识图谱语义网可视分析

知识图谱语义网重在显示知识图谱实体之间的关系分析,时空数据重点分析病患、事件等的时空分布,作品综合利用二者优势,利用地理位置信息实现图数据、位置数据的关联,利用交互分析的方法,分析疫情态势,能够充分掌握患者关联关系。


进一步应用说明

当前系统集成了病患信息数据、位置数据、患者关系数据、迁徙数据、疫情态势数据,未来可充分结合民航、高铁、公路迁徙数据、人口户籍数据、手机信令数据等数据,构建大规模知识图谱语义网,结合时空分析模型协同分析,对新冠疫情的发布、扩散、抗疫等过程进行回溯,全面掌握疫情扩展态势、防疫抗疫时间空间节点布控方案进行仿真,能够为进一步的突发疫情传染监控、预测、应急应对方案的制定提供一种新的思路和方法。


说明:系统进一步完善中,代码不公开。



疫情数据可视化公益行动
疫情数据可视化公益行动

中国计算机学会CAD&CG专委会、阿里云天池、机器之心、阿里云DataV联合发起的以“万众’疫’心 天池众智”为主题的疫情数据可视化公益行动。专栏将对每周提交的优秀作品进行相关公示,优秀作品详细介绍可在专栏页面进行查看。

产业知识图谱
5
投票
投票
投票
投票
我要投票