《新冠肺炎疫情下的多尺度舆情分析及动态可视化》项目详细介绍

指导老师:沈婕

队长:杜毅贤

成员:钟琳颖、徐家鹏、侯盈旭、李翰宸

作品简介

2020年初,新型冠状病毒肺炎席卷中国大江南北,武汉封城,疫情发展变化牵动着亿万国人的心,引发了社会各界的广泛关注,政府及相关部门在积极应对疫情的同时还需及时了解舆情态势,有针对性地进行风险预测、舆论疏导和应急防控。本项目通过百度舆情平台、网络爬虫技术等获取新冠肺炎疫情相关的舆情数据,基于地图与地理信息技术将舆情信息与疫情发展情况进行多尺度对比与相关性分析,动态展现疫情期间网络舆情的时空变化过程,挖掘疫情相关热点事件,并基于信息图表对舆情情感等进行可视化。通过处理和分析疫情相关舆情数据,直观展现舆情态势、舆情焦点和情绪变化,为政府及相关部门有效引导与控制网络舆情提供一定的理论基础支撑和参考借鉴。

作品演示视频:http://v.qq.com/vplus/be716bed89b55a1f73a28f240e970869

作品展示

本作品一共分3个主题,界面展示分别如下:

(1)多尺度舆情信息分析与可视化

说明: 界面1

(2)舆情信息动态可视化

说明: 界面2

(3)舆情情感分析可视化

说明: 3-3

作品解读

(1)多尺度舆情信息分析与可视化

该主题使用交互功能展现疫情期间国家、省、市三个尺度下舆情信息的变化态势,将疫情发展与舆情态势进行关联分析,解析舆情焦点。主要包括全国、省、市多尺度下舆情数量分布图、每日新增病例数与舆情数量关系图、舆情高频词分析图、舆情词云。

根据百度舆情平台采集的疫情期间相关的舆情数据,采用分层设色的形式来表达全国各地的舆情数量,地图分为三个尺度,全国、省级和市级,点击不同的省份和城市即可进入相应尺度下的地图。

说明: 全国舆情数量分布图

说明: 湖北舆情数量分布图说明: 武汉市舆情数量分布图

通过数据清洗与整理,将疫情相关的每日舆情数据与每日新增病例数进行对比,可以看出疫情发展前期,每日舆情数据数量不断上升,舆情总量不断增加,随着国内疫情的向好发展,每日舆情数量大体呈下降趋势。

说明: A)362WN`S2P15TC)CR13NRM

说明: ~QT6)MKX866)_%I%HF4Q@@Q说明: E2LD)JBQ6TE}L{FX9]}BW@P

通过爬取新闻、论坛、微信、微博与疫情相关对的标题文本信息,利用python对文本进行分词处理并做了词频数量统计,之后按照全国、省级、市级三个尺度进行展示了每个区域排名前十五的热点词,并选取前60位的高频词制作了词云。对比发现,在各个尺度下的各个地区,前十位的关键词经常出现重复:比如“疫情”、“疫情防控”“战疫”、“抗疫”、“复工”、“企业”,反应了各个地区对这些话题普遍的关注;而对比不同地区,一些关键词又能体现其区域特点,如武汉的“封城”、“驰援”、“火神山”。 此外将各地区的词云做成其对应的行政区形状,以更好的区分不同地区的词云。

说明: 全国舆情词云

(2)舆情信息动态可视化

该主题主要展现疫情期间舆情信息数量的空间分布特征及动态变化情况,为用户了解疫情期间每日舆情态势提供参考。主要包括全国舆情数量动态变化图、全国舆情数量动态监测图。

根据疫情期间各省舆情数量制作了的全国舆情数量动态地图,以1s为时间间隔动态展现各省每日舆情数量在空间上的变化。设计了可以交互的动态折线图,可选取不同时间段,从宏观角度来分析舆情数量随时间的变化趋势。

(3)舆情情感分析可视化

该主题主要展现新冠肺炎疫情下舆情情感特征、高频话题分析及网民关注度对比。主要包括疫情期间各省舆情情感倾向对比图、 疫情期间微博高频话题分类及情感分析图、疫情期间微博热点事件情感类别分析图、不同媒体舆情数量统计与倾向分析图、舆情高频词网民关注度对比图。

在疫情期间舆情情感地图中,将疫情期间的舆情数据分为正面、中面和负面分别在地图上进行展示,点击下分按钮可以进行相应的切换,直观展现舆情总量及情感倾向在空间上的分布情况;在疫情期间各省舆情情感倾向对比图中,可以从宏观角度快速掌握不同省份正面、中面和负面舆情数量和构成情况。

对微博疫情相关的高频话题进行主题分类,并按照正面、中立、负面三种情感倾向进分析,可以看出疫情期间人们对于疫情防控知识教育、官方权威信息发布、抗疫一线感人事迹更加关注。同时,在情感倾向方面,有关抗疫一线感人事迹的话题情感较为正面;谣言相关话题、疫情对国际民生的影响则表现出较为负面的情绪倾向;而疫情防控知识教育、官方权威信息发布这种官方发布的消息则保持了中立。

通过对比分析发布于新闻、论坛、微信、微博的舆情的数量及情感倾向,可以看出媒体舆情大多比较中立,而正面、负面倾向的舆情数大致持平。

爬取微博每日热搜前100中与疫情相关的话题,利用情感字典将其文本的情感分为“乐”、“好”、“平淡”、“哀”、“惧”、“惊”六个类别。并将每一个话题作为气泡按照不同情感类别标记在散点图中,其中纵坐标为话题的搜索量,而横坐标则为该话题的发布时间,整个图可以通过交互选择展示哪些情感类别的话题。通过分析可以看出,在所有话题中,“乐”相关的话题数最少,“好”相关的话题数最多;而在热度方面,“惊”和“怒”相关的话题搜索量普遍较高;在情绪的发展上,随着疫情逐渐得到控制,“哀”、“惧”、“惊”这三个负面情绪相关的话题量和搜索量逐渐降低,“平淡”这一中性情感相关的话题量和搜索量有所升高。

说明: RP205~FRYE[3L9K}%$J([NG

通过对比微信、百度、微博平台网民对于舆情高频词的关注程度的变化情况,可以发现三平台网民对于疫情的关注趋势基本一致,并且随着疫情的进一步发展,关注度呈现波动上升的趋势。

可视化项目是否开源

项目需进一步完善,暂不开源。

疫情数据可视化公益行动
疫情数据可视化公益行动

中国计算机学会CAD&CG专委会、阿里云天池、机器之心、阿里云DataV联合发起的以“万众’疫’心 天池众智”为主题的疫情数据可视化公益行动。专栏将对每周提交的优秀作品进行相关公示,优秀作品详细介绍可在专栏页面进行查看。

产业
暂无评论
暂无评论~