《COVID-19 国内数据综合可视化》项目详细介绍

区绍彬Steve OU 

体验链接: https://oushaobin.cn/covid-19-vis/#/

创作初心:

创作本项目的主要初心是对目前纷繁复杂的疫情信息进行一个汇总,并通过可视化的信息,令公众可以通过图表直观的观察到疫情的发展,了解疫情传播相关因素、社会关注和谣言的特点,以及部分公开样例中的规律。

作品介绍详情:

  1. 态势分析可视化

全国总体态势

全国总体态势主要使用国家卫健委数据,属于时序类的数据。本设计中,总体态势分为四个子图表示确诊与重症比例,确诊增长趋势,疑似病例数变化和治愈率、死亡率信息。

各省态势

全国总体态势主要使用Github仓库BlankerL/DXY-COVID-19-Data中的时序数据。本设计采用了每个省份一个小图,并把全部小图集合成一个大图的方式。每个小图中使用不同颜色的曲线,快速地观察到全国各地的疫情变化趋势。

相关分析

相关分析部分,主要是分析疫情的传播和治愈情况是否于社会因素相关。本作品使用了国家统计局各省人口、运输相关数据与确诊数绘制气泡散点图并以颜色和点的大小标示确诊数的数量。同时本作品也使用了国家统计局提供的各地区医疗资源统计数据绘制了医疗资源与治愈率相关关系的散点图,以医疗资源相关指标与治愈率之间的关系。

社会关注度

社会关注度主要采用的数据来自百度搜索指数和微博指数。本设计中,本作品使用了“武汉+肺炎”(总体疫情)和“口罩”(防护用品)的百度指数和微博指数进行变换和加权,得到相对的关注指数;为了更方便地分析社会对事件关注的变化,本作品在折线图中标识了某些重要的时间节点。

谣言热词

谣言热词主要使用Github仓库BlankerL/DXY-COVID-19-Data中的丁香园辟谣数据。我们首先使用jieba分词工具进行TF-IDF算法提取关键词,随后使用词云工具进行绘制,并根据颜色深浅和字体大小表示该关键词的出现次数。


病例数据可视化

病例数据的可视化使用了澎湃新闻整理的“763个冠状病毒确诊案例数据”。


一般信息

本作品采用了三个环状饼图,以不同的颜色对所有案例中的三种分类数据:是否人传人、传播途径和是否死亡进行了可视化。通过饼图可以清晰地查看出763个个案中各分类占比的情况。

时间相关信息

本作品通过简单的时间戳相减并分类进行数据处理后,使用柱状图对处理后的数据进行描述。通过柱状图可以清晰地查看两个分类在时间间隔上的分布情况。

病例分布信息

本作品根据个案中的性别和年龄信息进行了分组的统计,并根据统计结果分别绘制了男性和女性的病例与年龄分布图。为了清晰地观察到男女性别间的分布差异,本作品使用镜像分面的方法,在坐标轴的左右两侧进行分布图绘制并根据性别进行着色,以确保可以清晰地查看并比对不同性别的确诊病例年龄分布。

离汉后主要去向

本作品对数据中给出的明确路径信息进行了清洗处理。本作品以地理位置作为点,路径作为边。除武汉外,点的大小由到达该地理位置的总病例数决定。武汉地区会以红色标注,其他地区以深蓝色标注。本作品也设置了交互的提示信息,当选择某条边或节点时,会显示途经对应路径或到达对应地理位置的病例数总数。

作品价值:

目前每日有大量疫情相关的报道、文章涌入人们的视野,本作品的价值在于本作品通过大量官方的权威的数据,对疫情进行了多方面的分析。社会公众可以通过对图形的感知,直观地了解疫情趋势、影响因素、社会关注等情况。

Github: https://github.com/ousheobin/covid-19-vis 


疫情数据可视化公益行动
疫情数据可视化公益行动

中国计算机学会CAD&CG专委会、阿里云天池、机器之心、阿里云DataV联合发起的以“万众’疫’心 天池众智”为主题的疫情数据可视化公益行动。专栏将对每周提交的优秀作品进行相关公示,优秀作品详细介绍可在专栏页面进行查看。

产业
暂无评论
暂无评论~