如何用NLP与知识图谱支援MarTech建设?

所有人都向往无所不知,营销尤为如此。

不同的是,营销人追求的「无所不知」更像对洞察和精准的执着——无论是大到用户数据管理,还是小到销售线索的筛选,营销人希望知道更多,从而减少销售转化过程中的损耗,提高效率。

由于语言文字是人类社会信息传递的主要形式,当人们交流、存储信息的主要场地逐渐偏向互联网,触及「无所不知」的方法也在这里被渐渐发掘——人工智能领域的发展可见一斑:

自然语言处理(Natural Language Processing,简称NLP)技术探讨的基本命题是如何处理和运用自然语言。而知识图谱则是在NLP对语言文本的解构基础上,以图数据形式存储信息,并描述客观世界中概念、实体及其关系。

简单来说,NLP技术类似于人类读懂语言和文字的能力,而知识图谱则对应着人类储存在脑海里的知识体系。

于是,AI投资热潮过境之后,高投入、低回报、落地难的固有印象让这个领域短暂失去了吸引力。但在资本眼中,两个细分领域仍然存在大量的机会,一个是计算机视觉(CV),另一个就是自然语言处理(NLP)。

自然语言处理知识图谱是两颗相辅相成的AI双子星,在MarTech领域已经找到了帮助营销人「无所不知」的方法:智能获客。

从智能获客快速落地的NLP

在Google开源BERT后,NLP行业迎来了自己的标杆模型,识别精准度大幅提升。再加上互联网世界中文本数据普遍,又存在大量如搜索等垂直领域的需求,该技术受到VC青睐理所当然。

但作为NLP技术重要的应用之一,知识图谱在不同环境下却表现出不同的形态,一方面,「Google知识图谱」试图还原整个现实世界联系,叙事恢弘,另一方面在MarTech领域,知识图谱的应用则从更贴近商业本质的一面展示价值,那就是智能获客。

智能获客,同时对Marketing与Sales部门产生影响:Marketing负责为销售导入优质潜在线索,属于线索管理(Lead Management)范畴。而销售部门也需要对已有数据做进一步筛选,这属于销售支持(Sales Enablement)的范畴。 

IDC分析师曾认为,销售支持(Sales Enablement)其实就是「在正确的时间以正确的格式向正确的人提供正确的信息,以帮助推动特定的销售机会。」对于销售部门而言,这往往需要能够连贯地组织、查找、共享、定制和分析目标的必要框架。

在业务场景中,「正确」并不容易达成——事实上,大多数企业地销售数据很容易给销售人员造成紊乱,一般造成这一现象的原因有三: 

  • 销售线索往往由多个团队输入,内容良莠不齐,导致目标画像不全

  • 行业数据信息庞杂,商业关系还原难度大

  • 潜客筛选、销售线索优先级划分困难 

而这些痛点也为NLP和知识图谱的应用提供了丰富的应用场景。

「以销售为导向的企业,每天各个渠道都会产生大量的销售线索。几百人的销售团队,每天可能需要面对上万条参差不齐的线索。行业需要一套解决方案,能帮助销售人员自动补齐线索内容、自动挑选更有价值的销售线索优先触达。」百炼智能联合创始人&CTO姚从磊在接受采访时这样说道。

在姚从磊看来,销售线索是ToB销售侧的痛点之一,百炼智能据此打造了自己的智能获客四大产品:竞争分析、档案补齐、模型预测和客户裂变。

「档案补齐是通过知识图谱的实体对齐技术,对残缺不全的销售线索进行自动化补充整理;而以NLP技术处理后的销售端成单数据和销量数据为基础,我们可以通过建立深度神经网络模型帮助客户实现成单和销量的预测;此外,基于全网公开数据,知识图谱能带来客户竟对关系的提炼和KP的锁定,辅助销售工作。」姚从磊补充道。 

把数据转化成业务语言 

由此看来,知识图谱在销售支持领域的应用,已经涉及到数据收集、数据治理以及数据分析三个环节。在实际辅助销售人员的过程中,知识图谱技术承担着将销售大数据转化成「业务语言」的重任。

例如,客户过往成单总的信息,返回到客户模型中,成为能够基本定性的数据,如公司规模、地理位置附近存在竞对产品的数量等。随后这些数据进入到深度学习神经网络模型,最终形成应用标签,最终预测销量。

但在ToB企业销售部门,知识图谱也有自己发展的不利因素,如可供训练模型使用数据量相对较少,不同行业数据类型差异较大等问题。 

在被问及这些问题时,姚从磊表示训练数据较少的问题确实存在,但只要数据规模能保证在千级,知识图谱+模型就能产生相对有效的标签支持。另外,GAN (对抗生成网络)技术能帮助模型在较少训练数据下,获得较高的预测准确率。 

而不同行业的数据类型不同的影响并不大,知识图谱产品的服务模式是可以切换到其他行业的,需要调整的只是数据刻画和分析的维度。

「我们从一开始只做销售线索的筛选导入到如今,一年时间里已经开始与部分客户合作进行销量预测。」姚从磊说,「接下来,我们会逐步将自然语言处理技术的召回率提升到较高的水平(平均98%以上)并部署GAN (对抗生成网络)」

消费者全量数据的知识图谱畅想

对于那些具备通用产品,客户群大而分散,且有筛选销售目标需求的用户,知识图谱是一个见效迅速且成本不高的销售效率提升之法。 

百炼智能选择了从智能获客切入,同时在销售支持(Sales Enablement)与线索管理(Lead Management)的细分赛道上不断深耕。但对知识图谱而言,如果将「销售数据」换成营销「全量数据」,那么NLP和知识图谱技术对Martech的影响会更加广泛。

销售业务场景下,人们主要工作内容是拜访客户。在拜访完一家客户后,销售人员往往需要了解就近还有哪些客户,这意味着基于地理位置的对潜客的筛选能够帮助到销售人员,而地理信息仅仅是一个维度。

如果将地理位置、竞对关系、人事变动、近期行业资讯等公网「知识图谱」,与目标客户的网页浏览URL、APP行为、第三方平台行为等营销「知识图谱」结合起来,营销人员将最大限度地「在正确的时间,像正确的人传达正确的信息」,销售人员也将最大限度地「在正确的时间,正确的地点,接触正确的人,提供正确的产品信息沟通」,最终双方协同推动特定的销售机会。

这是比较理想的基于消费者全量信息建立知识图谱的情景——高精度的知识图谱必然需要NLP技术与强大的AI模型共同实现,如消费者访问海量的URL数据,首先需要用爬虫获取页面内容,再通过NLP语义识别为每一个URL贴上相应标签。

随着CDP、数据中台概念的兴起,广告主越来越关注第一方数据与第三方数据的结合,建立自己的私域流量池。但在全量数据面前,数据标签打通成本高、难度大,也限制着广告主建立自己的洞察。

知识图谱,可能就是那条捷径。

百炼智能
百炼智能

百炼智能是一家提供知识引擎服务的人工智能公司,旨在应用AI技术,把互联网上非结构化的信息,再组织成结构化的知识,提高人们获取知识的效率,并从中受益。

http://bailian.ai/
专栏二维码
工程市场营销销售知识图谱NLP
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

百炼智能机构

百炼智能(bailian.ai)是一家提供知识引擎服务的人工智能公司,旨在应用AI技术,把互联网上非结构化的信息,再组织成结构化的知识,提高人们获取知识的效率,并从中受益。百炼智能致力于研发基于深度学习的自动化知识生成技术,对各领域信息进行收集、清洗、抽取、甄别和重写,提炼为可信赖且可执行的知识,从而提高工作、学习效率和生活质量。

推荐文章
暂无评论
暂无评论~