Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

陈萍、杜伟报道

支持异构图、集成GraphGym,超好用的图神经网络库PyG更新2.0版本

当前最流行和广泛使用的 GNN 库 PyG(PyTorch Geometric)现在出 2.0 版本了,新版本提供了全面的异构图支持、GraphGam 以及很多其他特性,这一系列改进,为使用者带来了更好的用户体验。

PyTorch Geometric(PyG)是一个构建于 PyTorch 之上的库,用来为一系列与结构化数据相关的应用编写和训练图神经网络(GNN)。PyG 对机器学习研究者以及机器学习工具包的首次使用者都很友好。

就其特征和功能而言,PyG 具有易用和统一的 API,用户花费更少的时间在实现和运行图神经网络的底层机制上,只需要 10 至 20 行代码就可以训练自定义 GNN 模型。PyG 涵盖了大量的 SOTA GNN 架构以及训练和可扩展流程,并且易于扩展以匹配用户自己的特定用例或进行自己的 GNN 研究。

此外,PyG 中的全新 GraphGym 使得用户可以轻松地复现 GNN 实验,执行和分析数千个 GNN 实验,并将自定义模块嵌入到 GNN 学习 pipeline 中。

近日,PyG 核心领导者(Core lead)Matthias Fey 宣布 PyG 2.0 版本来了!新版本提供了全面的异构图支持、GraphGam 以及很多其他特性。

PyG 2.0 详情地址:https://github.com/pyg-team/pytorch_geometric/releases/tag/2.0.0

PyG 2.0 新特性

PyG 2.0 是一个新的版本,提供了复杂的异构图支持、GraphGym 集成以及其他新特性。

PyG 2.0 中提供了完全的异构图支持。异构图支持包括数据存储层的完整重写(同时保持向后兼容性)、异构图转换、通过邻采样的关系型数据加载例程,以及一整套异构 GNN 模型 / 示例。

突出亮点

异构图存储:异构图现在可以存储在它们自己的专用 data.HeteroData 类中。

异构 Mini-Batch 加载:异构图可以分别通过 loader.DataLoader 和 loader.NextorLoader 对许多小的、单个的巨大图进行转化,转换成 mini-batches。这些 loaders 现在可以处理同构图和异构图。

异构图神经网络:异构 GNN 现在可以通过 nn.to_hetero、nn.to_hetero_with_bases 从同构 GNN 轻松创建。这些进程采用现有的 GNN 模型并复制其消息功能,以考虑不同的节点和边缘类型。

使用 GraphGym 管理实验

PyG 2.0 现在通过 torch_geometric.graphgym 正式支持 GraphGym。总的来说,GraphGym 是一个平台,用于通过高度模块化的 pipeline 从配置文件中设计和评估图神经网络
  • GraphGym 是开始学习标准化 GNN 实现和评估的最佳平台;

  • GraphGym 提供了一个简单的接口来并行尝试数千个 GNN 架构,以找到适合特定任务的最佳设计;

  • GraphGym 可轻松进行超参数搜索并可视化哪些设计选择更好。

重大改变

datasets.AMiner 数据集现在返回 data.HeteroData 对象;transforms.AddTrainValTestMask 已被替换为 transforms.RandomNodeSplit;由于 data.Data 的存储布局发生了显着变化以支持异构图,因此需要通过删除 root/processed 文件夹来重新处理已处理的数据集。如果你修改了自定义 data.Data 对象中的__cat_dim__或__inc__ ,请确保应用上述更改。

了解更多变化,请参考原项目。

核心团队成员

PyG 核心团队共有 6 位成员,包括多特蒙德工业大学四年级图机器学习博士生 Matthias Fey、多特蒙德工业大学博士生 Jan Eric Lenssen(核心贡献者)和图网络领域大牛 & 斯坦福计算机科学副教授 Jure Leskovec(担任顾问)。

从左至右依次为 Matthias Fey、Jan Eric Lenssen 和 Jure Leskovec。

此外还有三位华人成员,分别是斯坦福大学计算机科学四年级博士生尤佳轩(Jiaxuan You,核心领导者)、斯坦福大学计算机科学博士生 Rex Ying(核心贡献者,他将于 2022 年加入耶鲁大学担任助理教授)和卡内基梅隆大学 - 汉斯学院三年级博士生赵越(Yue Zhao,核心贡献者)。

从左至右依次为尤佳轩、Rex Ying 和赵越。

日前,赵越在知乎分享了自己参与 PyG 2.0 版本设计与升级过程中的心得体会,感兴趣的读者可以参考阅读。

知乎链接:https://www.zhihu.com/pin/1420674585365196800

参考链接:
http://www.pyg.org/
入门Matthias Fey图神经网络库PyG 2.0
1
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

图网络技术

2018年6月,由 DeepMind、谷歌大脑、MIT 和爱丁堡大学等公司和机构的 27 位科学家共同提交了论文《Relational inductive biases, deep learning, and graph networks》,该研究提出了一个基于关系归纳偏置的 AI 概念:图网络(Graph Networks)。研究人员称,该方法推广并扩展了各种神经网络方法,并为操作结构化知识和生成结构化行为提供了新的思路。

推荐文章
暂无评论
暂无评论~