趋势分析之数据挖掘

AMiner全新功能技术趋势分析Trend analysis(http://trend.aminer.cn)基于AMiner 2亿篇论文数据进行深入挖掘,包括对技术来源、热度、发展趋势进行研究,进而预测未来的技术前景。技术趋势分析描述了技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题。

我们目前已发布了5期分析内容,具体如下:

数据挖掘(data mining)是数据库知识发现(Knowledge-Discovery in Databases,简称KDD)中的一个步骤,指的是从大量的模糊的数据集合中提取人们感兴趣的知识和信息。数据挖掘设计到机器学习模式识别归纳推理、统计学、数据库、高性能计算等多个领域。

下面我们用Trend analysis分析数据挖掘领域内的研究热点。

上图是当前该领域的热点技术趋势分析,通过Trend analysis分析挖掘可以发现当前该领域TOP10的热点研究话题如下:
  • data mining

  • social network

  • applied science

  • social science

  • graph theory

  • heterogeneous information network

  • big data

  • feature extraction

  • feature selection

  • anomaly detection

根据Trend analysis我们可以发现,当前最热门的话题是data mining,该技术的话题热度稳定,发表论文数量相对其他技术而言也较多;heterogeneous informationnetwork和big data从2011年开始话题热度稳步增长;data stream的热度变化则是经历了一定的起伏,2001年后的十年期间话题热度曾经一度仅次于data mining,但在近几年话题热度明显下降。

美国伊利诺伊大学香槟分校的韩家炜教授是数据挖掘领域的代表学者之一,同时也是IEEE和ACM Fellow。他曾经担任美国ARL资助的信息网络联合研究中心主任,KDD、SDM和ICDM等国际知名会议的程序委员会主席,并创办了ACM TKDD学报并任主编。

他在数据挖掘数据库和信息网络领域发表论文600余篇。出版了数据挖掘专著《Data Mining: Concepts and Techniques》,成为数据挖掘国内外经典教材。曾获ICDE 2002杰出贡献奖、SIGKDD 2004最佳创新奖、 2009年麦克道尔奖(the McDowell Award)。在谷歌学术的 H-index中,名列全球计算机科学领域高引作者前三。

ACM SIGKDD 创新奖是知识发现与数据挖掘领域(KDD)的最高荣誉,授予对这一领域做出重大技术贡献的研究人员。根据评审要求,其研究成果必须在数据挖掘理论或商业数据挖掘系统的开发上能够产生深远的影响。历届 SIGKDD 创新奖的获得者都是数据挖掘领域的杰出研究者,曾经获得这一奖项的华人包括:

(2004 年)韩家炜(Jiawei Han)博士

美国伊利诺伊大学香槟分校计算机系教授,ACM、IEEE Fellow。值得一提的是,韩家炜博士是裴健教授在加拿大西蒙弗雷泽大学的博士导师。

(2016 年)俞士纶 (Philip S. Yu) 博士

美国伊利诺伊大学芝加哥分校特聘主任教授、清华大学数据科学研究院院长。

(2017年)裴健(Jian Pei)博士

加拿大西蒙弗雷泽大学计算机学院教授,ACM、IEEE Fellow,加拿大研究讲席教授(Canada Research Chair, Tier I)。

(2018年)刘兵(Bing Liu)博士

美国伊利诺伊大学芝加哥分校杰出教授,ACM、AAAI、IEEE Fellow。

作为一门新兴的信息处理技术,数据挖掘技术的应用领域十分广泛,包括交通、金融投资、市场营销等方面都得到了应用,显示出其强大的生命力。

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
入门数据挖掘趋势分析
2
相关数据
裴健人物

京东集团副总裁,加拿大一级研究讲座教授(大数据科学领域)、加拿大西蒙弗雷泽大学计算科学学院教授、统计与精算学系和健康科学院兼职教授,前华为首席科学家。裴健在数据科学、大数据、数据挖掘和数据库系统等领域,是世界领先的研究学者,擅长为数据密集型应用设计开发创新性的数据业务产品和高效的数据分析技术。他是国际计算机协会(ACM)院士和国际电气电子工程师协会(IEEE)院士,ACM SIGKDD(数据挖掘及知识发现专委会)现任主席。因其在数据挖掘基础、方法和应用方面的杰出贡献,裴健曾获得数据科学领域技术成就最高奖ACM SIGKDD Innovation Award(ACM SIGKDD创新奖)和IEEE ICDM Research Contributions Award(IEEE ICDM研究贡献奖)。

韩家炜人物

韩家炜,美国伊利诺伊大学香槟分校计算机系教授,IEEE和ACM院士,美国信息网络学术研究中心主任。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席,创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文600余篇。

区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

归纳推理技术

归纳法或归纳推理(Inductive reasoning),有时叫做归纳逻辑,是论证的前提支持结论但不确保结论的推理过程。它基于对特殊的代表(token)的有限观察,把性质或关系归结到类型;或基于对反复再现的现象的模式(pattern)的有限观察,公式表达规律。例如,使用归纳法在如下特殊的命题中: 冰是冷的。 弹子球在击打球杆的时候移动。 推断出普遍的命题如: 所有冰都是冷的。 所有弹子球都在击打球杆的时候移动。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~