《COVID-19患者追踪—体验设计师的疫情可视化探索》项目详细介绍

马宇诗、段珺

创作初心

COVID-19可视化看板地址:

http://covid-19.generativegraph.com

正当人们准备喜迎庚子春节的时候,一种未知的病毒却悄然之间散播到世间,在2020年的一开头就为这一整年蒙上了一层阴霾。

病毒凶险,政府抗击病毒的决心不可谓不坚决,无论在疫情发布还是在数据公开上都前所未有地公开与透明。

作为专门研究态势可视化的设计师,我们不禁思考,可视化技术能否从这些海量的数据中挖掘出什么可用的信息,让人们进一步了解这种新型病毒,并对病毒引起的这种疾病的病程有所了解呢?

我们设计了一套名为“跌落态势图”的通用可视化图表,目的就是用来展示某一“事件”从发生到终结的过程。那么跌落态势图这种通用可视化图表是否可以用来对COVID-19这种由新型冠状病毒引起的肺炎的病程情况进行分析呢?

此外,从患者整体数量上对疫情发展情况的分析,和在地域上对病毒传播情况的分析已经比较丰富了。我们考虑的是能否从单个患者的情况出发,将一个个单独个体的病程在某种程度上进行聚合展示,从而观察出某种整体上的状态和发展趋势

比如患者从首次暴露到发病的时间间隔是否反映了病毒的潜伏期?患者从发病到治愈的时间间隔是否与病毒世代和毒力相关?患者的连续ID是否反映了聚集发病情况等等。态势可视化能否在一定程度上帮助人们解答这些问题?

以上两个,既是我们这次制作COVID-19患者追踪可视化看板想要回答的问题,也是创作的初心。

作品简介

基于来源于深圳和青岛卫健委公开的所有患者的病程数据(目前已知只有这两个城市的卫健委对患者进行了唯一编码与病程持续追踪),Generative Graph 态势可视化小组的两位体验设计师创作了 COVID-19 Patients Tracking 可视化看板。

该看板以团队发明的通用可视化图表 ‘跌落态势图’ 为核心,主要用于可视化呈现部分省市 COVID-19 患者每个个体从发病到治愈,以及从接触到发病等不同维度的历程与时间分布。并试图通过这种可视化方法观察患者病程与病毒传代,毒力,及潜伏期之间可能存在的关系。

看板可在地区与病程维度上进行切换,其中每个白色圆点都表示一位患者。在接触-发病维度下,点的出现时刻为患者的接触时刻;而在发病-治愈维度下,点的出现时刻为患者的发病时刻。

从起始点发出的曲线则分别表示患者的发病或治愈历程,当曲线与上方横轴相交时表明该名患者已发病/治愈,而当曲线与下方横轴相交时,表明该名患者医治无效已去世。

设计

编号“1”是双轴跌落态势图中的两条结果轴,分别表现了事件的两种发展结果,分别是“治愈”和“死亡”。

编号“2”的纵轴则表现了某一天,在其上的点表现了在该日发生的事件,具体到发病-治愈维度,这两个点就表现了当天发病的两位患者,患者排列的先后顺序按照病人ID排序。在其后的曲线表示患者病程,曲线与“治愈”轴相交时,表示在该日患者已治愈,而继续向前延伸则表示这位患者尚在治疗中。

数据

数据是态势可视化的核心。

既然我们决心从个体患者的角度出发,那么我们就需要寻找个体患者的数据,并且要关注这些数据是否有我们需要的维度,以及是否便于之后的跟进维护。

我们陆续从WHO和The Lancet寻找到了一些论文,发现其中披露的患者数据不足以支撑这次的看板制作。

直到我们找到了深圳卫健委公布的患者数据,这份数据非常详尽,而且深圳卫健委还对所有患者进行了连续统一编号,并进行了后续的追踪(出院情况公示),这为我们的态势可视化工作提供了极大的方便,向这些提供了丰富数据的一线工作者们致敬!

具体到这些数据的具体情况,它们来源于微博,是标准的非结构化数据。实际上来说在一般情况下,同样的容量下结构化数据的信息容量要小于非结构化数据。因此不论面对何种数据源,作为可视化设计师基本的数据处理能力还是需要具备的。

在本案例里,主要使用开源工具Openrefine对源数据进行半自动的结构化和清洗。

实现

既然说到了实现,对于设计师而言,其实有很多相对没那么复杂的工具可以将自己的想法快速落地。比如低代码图形生成工具Nodebox,或者比较简单的图形编程语言Processing,以及它的Web衍生物P5.js。在这个案例中,综合考虑(交互性要求不高+基于Web端进行展示)之下,我们使用P5.js对看板进行了实现。

其中有三个实现的核心环节:

赋妄想以有型——将数据可跌落曲线

跌落态势曲线是以「事件-时间」为对应关系呈现的可视化图形。因此我们将病例数据中要展示的事件节点映射到时间线(x轴)上,把被定义为起始事件的节点映射为跌落线的起点,把被定义为终结事件的节点映射为跌落曲线的落点,用贝塞尔曲线画出需要的曲线;然后将所有病例数据按设定的关系映射在垂直方向上。

 时间轴交

时间轴的交互是这次坠落图的重要功能,它能让用户以动态的方式来洞察数据。

图形的响应式适

为了进行手机端的适配和便于传播,这次的看板也做了响应式设计。

化分析与价

COVID-19看板可以从以下几个角度加以解读。

首先,基于接触-发病维度,以深圳患者数据为例:

接触-发病最集中分布在2020.1.10到2020.1.30之间,时间可能还会再略短一些,这似乎很好地印证了潜伏期14天的说法。当然,在看板中接触时间的计算不太精确,深圳卫健委给出的是一个区间范围。

又因为该看板上所描述的“事件”是根据患者ID从纵轴最高处向最低处绘制的,ID最小,也就是最先确诊的患者会排在纵轴的最上方,且因为连续确诊的患者ID也连续,那么面对图中所示的这种情况所表征的可能是一起聚集式传播事件。

接下来,基于发病-治愈维度,我们又可以明显看出,跨度越大的曲线纵向高度越矮;反之越高的曲线跨度越小。

在COVID-19图上,患者ID是按从小到大,从高到低绘制出来的,因此确诊越早的患者的病程曲线高度越低,从图上看来,他们的病程曲线普遍跨度也较大,说明他们经历的病程较长,截至2.18,发生唯二两例致死病例全部都是初期确诊患者。

这可能和两个因素有关:1.病毒传播世代和毒力;2.治疗手段

假如可以结合传播关系图(分析病毒的传播世代),并对病情严重程度进行量化(判断治疗的有效性),再结合三图进行综合判断,那么就可以给出更加清晰的结论。

写在最后

以上,就是从两个大维度上对深圳数据进行的可视化挖掘与分析的尝试。

如果继续保持对数据的追踪,并从更多的大维度上进行观察,相信还可以发现一些更有价值的信息。

这种从个体维度出发,依靠将大量个体情报汇总并对总体态势进行判断的分析方法可能也会加深我们对于这种未知病毒的认识。而对于跌落态势图这种通用可视化图表而言,在患者病程-病毒毒力研究领域之外,可能也会有更加广阔的应用。

对于广大设计师朋友们,数据可视化设计相对于其它泛UI设计的最大不同,是它的核心是基于数据的,所有洞察、呈现都基于此。在数据时代,设计师对数据的认知与理解是不可或缺的。如果设计师具有一定的数据分析和呈现能力,他就有更多的可能获得足够认知,从而找到更多切入点来发挥自己的设计能力。

假如没有太多相关基础的设计师又希望能踏入到数据可视化领域中,可以试着从两方面入手:

1. 基础的可视化实现工具:

   a. 代码向比如Processing,或者P5.js

   b. 非代码向比如Nodebox
 

2. 数据处理方面的知识:

   a. 对通用图表的理解

   b. 处理数据的基本方法(清洗,结构化,去重和排序等)


最后,在这里祝愿这场疫情早日结束,所有受瘟疫影响的人们都能尽快恢复正常生活。



疫情数据可视化公益行动
疫情数据可视化公益行动

中国计算机学会CAD&CG专委会、阿里云天池、机器之心、阿里云DataV联合发起的以“万众’疫’心 天池众智”为主题的疫情数据可视化公益行动。专栏将对每周提交的优秀作品进行相关公示,优秀作品详细介绍可在专栏页面进行查看。

产业
暂无评论
暂无评论~