Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

萝卜编译

图神经网络的惊人应用

机器学习的预测能力被广泛誉为当前统计人工智能的巅峰。它具有增强「从客户服务到运营等」所有内容的能力。其中神经网络、多维模型和深度学习部署被视为企业从数据中获利的重要保障。
根据Franz首席执行官Jans Aasman的说法,这里有一个很小的问题,那就是它本来是准确的:在大多数情况下,它「仅适用于他们所谓的欧几里得数据集,你可以在其中查看情况,从中提取一些显着的点,将其转换为矢量中的数字,然后你就可以进行监督学习和无监督学习等等操作。」
当然,大量的企业数据是欧几里得数据,并且易于矢量化。同时,也有大量非欧几里得、多维数据作为机器学习用例的催化剂,例如:
网络预测:分析朋友和敌人复杂社交网络中实体或事件之间的所有不同关系,可得出惊人的准确预测,即任何事件(如特定客户购买特定产品)将如何影响网络参与者。这种情报可以改进各类事件,例如从营销和销售方法到监管授权(了解你的客户、反洗钱等)、医疗保健、执法等等。
实体分类:根据事件(例如连接车辆的部分故障或系统故障)对实体进行分类的潜力,对于预测性维护工作至关重要。该功能对车队管理、设备资产监控等物联网应用具有积极作用。
计算机视觉、自然语言处理:理解场景中单词与彼此或图像之间关系的多维性,改变了 NLP 或计算机视觉的典型神经网络部署。后者支持场景生成,比如,机器在观看汽车经过消防栓的场景后,可以替换为狗睡在消防栓附近。
Aasman 指出,这些用例中的每一个都围绕着实体或节点之间具有多方面关系的高维数据展开,在这种情况下,「常规机器学习失败了」。然而,它们是图神经网络的理想选择,专门用于这些和其他高维数据的部署。

高维数据

图片

图神经网络之所以能取得这些成就,是因为图方法侧重于识别数据之间的关系。Aasman 指出,欧几里数据集中的关系不像高维数据集中的关系那么复杂,因为「直线或二维平面的所有东西都可以变成矢量。」这些数字与载体构成了,生成典型机器学习用例功能的基础。

非欧几里德数据集的例子包括,100多个飞机系统之间的大量关系,一组客户与另外四组客户之间的联系,以及这些额外组之间联系的无数相互依赖性。这些信息不容易矢量化,因此无法使用无图神经网络的机器学习能力。Aasman 评论道:「矢量中的每个数字实际上都依赖于图的其他部分,因此它太复杂了。一旦事物进入稀疏图,并且你还拥有事物网络、药物网络、基因和药物分子,就很难预测特定药物是否缺少与其他药物的联系。」

关系预测

当节点、实体或事件之间的上下文非常重要时(如在Aasman引用的药物使用案例或任何其他复杂的网络应用程序中),图神经网络则会通过理解数据的关系,来提供预测精度。这种特性主要表现在三个方面,包括:
预测链接:图神经网络善于预测节点之间的链接,以便理解实体相关、关联程度以及这种关系对业务目标的影响。Aasman透露,这种洞察力对于回答诸如「某些事件是否更频繁地发生在患者、飞机或文本文档中,以及能否实际预测下一个事件」等问题至关重要。
分类实体:根据属性对实体进行分类很简单。图神经网络在考虑实体之间的关系时会这样做,从而导致没有图就难以实现的新分类。此应用程序涉及监督学习;预测关系需要无监督学习。
图集群:此功能可指示特定图包含多少图像以及它们彼此之间的关系。此拓扑信息基于无人监督的学习。
将这些特性与具有普遍时间信息(包括事件时间,即客户购买时间)的数据模型相结合,产生了令人信服的机器学习示例。这种方法可以根据患者的过去以及所有健康相关事件,来说明患者的医疗未来。「你可以说,这将给这个病人以后可能患病的情况,按几率降序排列。」Aasman 说。组织也可以为客户流失、贷款失败、某些类型的欺诈或其他使用案例做同样的事情。

拓扑文本分类,图片理解

图片

当图神经网络在无与伦比的关系辨别能力集中在 NLP 和计算机视觉方面时,它们会产生转化结果。对于前者,它支持拓扑文本分类,这是更快、更精细地理解书面语言的基础。常规实体提取可以精确定位文本中的关键术语。「但在一句话中,事情可以参考前后文,」Aasman解释道,「实体提取根本无法识别这个,但图神经网络会查看句子的结构,然后你可以在理解方面做更多的工作。」

这种方法还支持了图像理解,图神经网络可以理解单张图片中不同图像的关联方式。没有它们,机器学习只能识别场景中的各种对象。通过它们,它可以收集这些对象如何相互作用或相互关联。「(非图神经网络)机器学习不会做到这一点,」Aasman 指出「不是所有的事情在一起的场景。」图神经网络与传统神经网络的耦合可以更丰富地描述场景中的图像;反过来,也可以从描述中生成详细的场景。

图方法

图神经网络基于最初在20世纪设计的神经网络。然而,图方法使前者能够克服矢量化的极限,在高维、非欧几里德数据集中运行。有助于这项工作的特定图技术(以及适用于图的技术)包括:
Jaccard索引:例如,当试图确定一组节点或另一组节点之间是否缺少链接时,Jaccard索引可以通过揭示「图中两个节点的相似程度」来反映结果。
优先附件:Aasman提到,这个统计概念是一种「他们称之为赢家通吃的技术,你可以预测某人是否会得到一切,或者一无所获」。优先附件会衡量节点的紧密程度。
中心性:中心性是网络中重要性指标,它与其他节点之间的节点相关。
图片

这些图方法等使图神经网络能够在不进行矢量化的情况下处理高维数据,从而扩大企业机器学习应用的整体效用。

多维机器学习规模

将图神经网络应用于前述使用案例和应用典型机器学习方法的关键区别在于所分析关系的复杂性和复杂性。Aasman 解释了一个应用实例,其中图神经网络根据一年中大部分时间、20000 多个实体和近 50 万个事件的投入,对世界领导者的行动做出了准确的预测。当转向客户行为、医疗保健或其他关键任务部署时,这种远见远不止学术性。因此,它影响认知计算部署,可能会比科学家预计的要早。
相关报道:https://insidebigdata.com/2021/06/26/the-amazing-applications-of-graph-neural-networks/
理论人工智能图神经网络
1
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~