《谣言数据可视分析系统》项目详细介绍

指导教师:奎晓燕 夏佳志

团队信息:刘乃铭、王霞

创作初心

从疫情爆发到如今,伴随着疫情的传播还有谣言的传播。这些谣言不仅会散发大量的负面情绪,增加人们的恐慌,还会宣传一些错误和虚假的信息。致使人们做出错误的决定,造成不可挽回的后果。例如人们相信谣言中虚假的预防信息,会将自己置于危险之中,增加感染风险。因此对于谣言的监控是非常重要的。在疫情期间,保持信息的透明度,以人为本,切实关注人民群众的生存境遇,及时处理民众关心问题,政府和专家通过大众传媒及时地,有针对性地发布正确消息,压缩谣言的产生和生存空间,对于制止不良传闻,以正视听,缓解大众的恐慌心理是十分有效的。因此我们设计了一个可视分析系统,分析谣言的主要分布内容和类别,谣言的地区分布,谣言类别随着事件发生的动态变化,热点谣言以及媒体在其中发挥的作用等一系统重要信息。不论对于普通民众还是官方都是非常有参考价值的,他们可以采取一些措施辟谣,避免其带来的危害。这个系统可以还增加辟谣的力度。帮助人们搜索与自己生活相关的谣言。为抗役战役做出贡献。

作品简介

这个项目的主题是通过交互式可视分析系统来展示疫情相关的谣言的分布情况,便于大众和媒体及时了解谣言信息并及时辟谣,掌握正确的疫情信息。

视频链接:https://v.qq.com/x/page/f09454u5slf.html

说明: 截屏2020-03-30上午12.31.16

谣言类别分布河流图

说明: 屏幕快照 2020-04-04 下午5.03.42

4种颜色的河流分布代表4类不同的谣言,一般事件谣言,科普类谣言,虚假病例类谣言和政治类谣言,主题河流图的宽度编码谣言的数量,通过谣言类别分布河流图,我们可以分析各类谣言数目随时间的动态变化情况。

每日谣言热点分布图

说明: 屏幕快照 2020-04-04 下午5.04.16

这是一个glyph设计,可以分析每日热度top5的谣言类别,用方块的位置编码辟谣的热度(阅读数量),最上一行是热度top1,第二行是top2,以此类推,最下一行是top5,颜色编码谣言的类别,该视图主题颜色与河流图的颜色编码保持一致。

谣言主题词云图、谣言地域分布图

说明: 屏幕快照 2020-04-04 下午5.10.01

通过词云图我们可以快速了解一段时期中每周类别谣言的关键词;在谣言地域分布图中,用颜色编码每个地区产生谣言的数目。可以分析各地区谣言数目随时间的变化。

辟谣媒体分布图

说明: 屏幕快照 2020-04-04 下午5.04.57

按照全国性媒体、省级媒体、市级媒体;数字媒体、传统媒体、官媒、自媒体对辟谣媒体进行分类,分析辟谣媒体的分布情况。境内境外是谣言的产生地。

谣言详细信息

说明: 屏幕快照 2020-04-04 下午5.05.09

说明: 截屏2020-03-30上午1.29.35

展示每一条谣言的日期,内容,辟谣媒体和阅读数量。其中谣言内容包含超链接,点击可以直接今日辟谣的正文,查看详细信息。

此外,该系统具有非常强的交互性,我们可以对时间、谣言类别、地域、和辟谣媒体进行任意组合以筛选谣言。

说明: 截屏2020-03-30上午1.22.40

作品价值及影响力

该系统具有非常强大的筛选器功能,帮助人们从海量的谣言中找到跟自己息息相关的信息,有助于人们及时了解辟谣信息,避免出现恐慌或不必要的麻烦。通过分析谣言的性质和属性,为提高辟谣力度和遏制谣言产生提供支持。该系统可以直观展示辟谣数据,可以给更多的人普及谣言的信息,让身在不同省份的人可以关注到自己所在地的主要谣言,及时了解与自己息息相关的信息,做出正确的决定,不被谣言影响。同时希望通过这个系统分析谣言内容的变化趋势,分析谣言主题与时政之间的关系。争取从源头上减少谣言的产生。希望官方媒体通过我展示的辟谣媒体与阅读数目的关系对辟谣力度做出分析评估,将辟谣消息传递给更多人,为大家带来更多精准的消息,减少谣言的相应危害。

作品技术说明

辟谣数据使用自今日头条的辟谣数据,因为今日头条辟谣数据整理的较为齐全。收集了2020-1-27至2020-4-3日的所以辟谣数据,一共1151条,然后使用pandas进行数据清洗,并为谣言按照类别打上标签。通过字符串匹配算法抽取每个谣言的发生地和判断辟谣媒体的性质。并使用NPL技术抽取每个谣言的核心关键字组成标签云数据。使用flask搭建服务器,前端使用d3绘图。




疫情数据可视化公益行动
疫情数据可视化公益行动

中国计算机学会CAD&CG专委会、阿里云天池、机器之心、阿里云DataV联合发起的以“万众’疫’心 天池众智”为主题的疫情数据可视化公益行动。专栏将对每周提交的优秀作品进行相关公示,优秀作品详细介绍可在专栏页面进行查看。

产业
暂无评论
暂无评论~