萝卜兔作者

用子图网络补充原始网络特征 | 图学习论文快讯


本周论文快讯介绍的五篇论文包括的方向图表示学习、网络嵌入、节点嵌入,一种新的聚类算法ECG和Subgraph netwok的概念。希望这些新的想法,能为大家的研究提供灵感。

01

建模growing graph的生成过程在社交网络和推荐系统中有着广泛的应用,但是由于冷启动问题,导致新加入的节点往往与原来的graph孤立。虽然现在有很多关于graph的新兴研究,但是大多数都没有解决这个问题。关键的难点在于模型学习为graph中的节点生成表示严重依赖于图的拓扑结构,但是新节点往往只有属性特征。该论文就着眼于这个问题,提出了统一的图卷积生成网络,通过对观察到的图数据构建的图生成序列进行采样,在生成模型中自适应地学习图中所有节点的表示。与此同时,还优化了由图重构项和基于KL散度的正则项组成的变分下界。

论文链接:https://arxiv.org/pdf/1903.02640.pdf

02

挖掘网络数据的一个挑战是找到有效的方式表示或编码图结构,让机器学习算法可以有效的利用这些数据。现在的一些方法主要考虑节点、边或者结构这一层面上的表示,而现实生活中的图,有时变的、多层级的、有化合物、脑神经网络等,都是一系列的图,而不是单一的图,这为图的比较和表示增加了不少难度。传统学习表示的方法依赖于hand-crafting 来提取图中的有用信息,比如统计特性、结构特征。

该论文则提出一种无监督的方式来学习一组graphs的嵌入表示,以应用于各种图数据挖掘的任务中。该方式用无监督神经网络学习输入的图数据的基本分布,以此来区别不同类别的网络。论文在三个不同的任务中评估了这种无监督的网络嵌入方法,包括图的聚类、分类和可视化。


论文链接:https://arxiv.org/pdf/1903.05980.pdf


03

这篇论文提出了一种针对temporal graphs的节点嵌入方法。本文的算法学习temporal graph的节点和边随时间的变化,并针对不同的任务,把这种动态结合到temporal node嵌入框架中。论文还提出了联合损失函数,通过结合历史时间嵌入来学习节点新的时间嵌入,这样来优化特定的任务,比如说链路预测。算法使用静态节点嵌入进行初始化,随后在不同的时间点对节点的表示进行对齐,最后在联合优化中适用于给定的任务。论文在链路预测和多标签节点分类两个任务上进行了实验,该方法表现出了更优的性能。


论文链接:https://arxiv.org/pdf/1903.08889.pdf

04


论文基于一致性聚类(consensus clustering)的概念,提出了一种针对图的聚类融合算法(ECG)。为了验证方法,论文通过考虑更加广泛的基准参数来扩展比较,生成具有不同属性的图。相较于之前的方法,ECG算法缓和了分辨率限制问题以及提高了聚类的稳定性。


论文链接:https://arxiv.org/pdf/1903.08012.pdf

05


该论文介绍了subgraph network(SGN)的概念,并将其应用到网络模型中,设计了构造一阶和二阶子图网络的算法。SGN可以用于拓展底层网络的结构特征空间,有利于网络分类。实验数据表明,基于带有一阶或者二阶SGN的原始网络特征的网络分类模型表现要比仅有一两个这样网络的模型好。换句话说,SGN的网络结构特征可以补充原始网络的结构特征。

论文链接:https://arxiv.org/pdf/1903.09022.pdf

极验
极验

极验是全球顶尖的交互安全技术服务商,于2012年在武汉成立。全球首创 “行为式验证技术” ,利用生物特征与人工智能技术解决交互安全问题,为企业抵御恶意攻击防止资产损失提供一站式解决方案。

理论生成模型数据挖掘ECG节点嵌入图网络网络嵌入论文聚类算法图表示学习
3
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

推荐系统技术

推荐系统(RS)主要是指应用协同智能(collaborative intelligence)做推荐的技术。推荐系统的两大主流类型是基于内容的推荐系统和协同过滤(Collaborative Filtering)。另外还有基于知识的推荐系统(包括基于本体和基于案例的推荐系统)是一类特殊的推荐系统,这类系统更加注重知识表征和推理。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

图网络技术

2018年6月,由 DeepMind、谷歌大脑、MIT 和爱丁堡大学等公司和机构的 27 位科学家共同提交了论文《Relational inductive biases, deep learning, and graph networks》,该研究提出了一个基于关系归纳偏置的 AI 概念:图网络(Graph Networks)。研究人员称,该方法推广并扩展了各种神经网络方法,并为操作结构化知识和生成结构化行为提供了新的思路。

推荐文章
暂无评论
暂无评论~