Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

学术俊作者

同济大学曹楠“交互式视觉异常检测及其应用”

方圆系列报告会之《大数据分析与可视化报告会》于4月4日清华大学内成功举办,现场邀请了清华大学副教授刘世霞、浙江大学教授陈为、同济大学教授曹楠和中国人民大学讲师张静共四位嘉宾进行学术演讲。

今天小编为大家带来的是曹楠老师“Interactive Visual Anomaly Detection and its Applications”演讲PPT分享。

曹楠

A Big Data Visualization Researcher Intelligent Big Data Visualization Lab (iDVx Lab) TongjiUniversity, Shanghai, China

“交互式视觉异常检测及其应用”

同济大学智能大数据可视化实验室(智能大数据可视化实验室,即iDV x实验室)

曹楠老师演讲关键词之一:ANOMALY DETECTION(异常检测),异常检测是对不符合数据集中的预期模式或其他项目的项目,事件或观察的识别。

面临的挑战

接下来是对社交媒体(以推特为例)的发展趋势以及社交媒体用户画像的分析,引出“anonymous users are potential threats to the society ”,然后提出异常检测的最终目标:捕捉到存在异常行为的用户。

社交媒体用户画像和行为分析(附引用文献)以及如何进行异常检测捕捉到用户的异常行为

微言

用户行为主要有两种,一是发布,即创建消息并发布给其他人;二是回复和转发,即转播他人发布的信息。

通过功能捕获用户行为

时间局部异常因子,TLOF通过识别与测试数据中的其他用户明显不同的特征以及他自己的过去历史,为每个用户提供异常测量。

用户行为分析,创建消息和转发回复的传播趋势

用户可视化为由其重要性决定的圆圈,并按其异常分数着色

当用户发布或转发推文时,我们在活动发生时绘制垂直于时间弧的相应活动线程

以下三个圆状物,哪个才是表示较为正常的用户行为呢?答案是第一个。第二个圆状物黄色几乎覆盖了整个圆形,说明发文时间和发文频率过于密集,不符合正常人类使用社交媒体的行为习惯,疑似bot;第三个同理。

可视化用户特征

使用基线圆圈指示所有用户的平均特征值

沿着基线周围的要素轴绘制用户的要素值

特征动态

bot异常检测存在的挑战

Voila:使用流式时空数据进行视觉异常检测和监控

以上海外滩踩踏事件为例,提出我们如果能有一种用于跟踪异常移动趋势的技术,实时监测人群流动趋势,当人群流动趋势出现异常情况时,可及时做出反应以避免踩踏事故的发生。

该技术还在研究完善过程中,现主要研究目标是:Urban computing、 Meteorology、 Public Health Surveillance 

即监控动态流时空数据、及时发现恶意事件和预测罕见的时空事件(未来工作)

驾驶员心电图行为监测

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
理论同济大学曹楠异常检测数据分析
3
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

异常检测技术

在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。 异常也被称为离群值、新奇、噪声、偏差和例外。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

数据可视化技术

数据可视化被许多学科视为现代视觉传达的等价物。为了清晰有效地传递信息,数据可视化使用统计图形、图表、信息图和其他工具。数字数据可以使用点、线或条编码,以视觉传达定量消息。有效的可视化帮助用户对数据进行分析和推理。它使复杂的数据更容易理解和使用。用户可以根据特定的分析任务进行数据可视化,例如进行比较或理解因果关系,并且图形的设计原则(即,显示比较或显示因果关系)来进行可视化。表通常用于用户查找特定测量的地方,而各种类型的图表用于显示一个或多个变量的数据中的模式或关系。

推荐文章
暂无评论
暂无评论~