晋耀红作者

面向NLP场景应用的智能辅助建模(二)--本体树建模

我们以前文介绍的一个场景本体的实例,银行领域客服投诉分析挖掘的场景本体模型,来说明本体树辅助建模。模型包括三部分:本体模型、要素模型、概念模型。本文说明本体树模型的辅助建模。


本体树辅助建模

本体树辅助建模实现的功能是,对输入的客服投诉文本数据,采用智能搜索、分类聚类算法等技术,进行自动分析,以辅助发现本体树节点。对发现的本体树节点提供合并、删除、修改等操作,业务人员可以方便地进行修改。同时,支持对发现的节点进行二次(或多次)分类聚类,以实现多级本体树节点的自动发现。分类体系辅助建模的输出是,经人工确认后的本体树。

本体树建模流程

以银行领域客服投诉模型中,“贷记卡”相关的本体树建模为例,说明辅助建模流程。

步骤一

将“种子词"操作,拖拽到建模区。实现的功能是,对选择的客服投诉文本进行搜索,得到与种子词”贷记卡“相关的所有投诉文本(结果区可以展示)。

步骤二

将”分类聚类“组件,拖拽到建模区,放到”种子词“结果之后。实现的功能是,对种子词搜索结果,进行自动聚类,输出自动聚类结果到结果区。

在结果区,对分类聚类结果进行人工干预,可以选择其中一个或多个节点,进行“合并。

步骤三

在一级分类聚类结果之后,再次将“分类聚类”组件拖拽,放到其结果之后,以对选择的类,进行二级聚类。在结果中,二级分类聚类结果,显示在相应节点之下。对二级分类聚类结果,同样支持人工干预操作。

这个流程可以不断重复,以拓展贷记卡相关的本体树节点的层级。

步骤四

将“加入本体”操作拖拽到建模区,将人工调整、确认后的前两级分类聚类结果,加入到本体树。

本体树建模的输出

在DINFO-OEC平台中,分类体系辅助建模的输出结果,就是本体树的节点,在本体模型中可以方便查看。

泰岳语义工厂
泰岳语义工厂

泰岳语义工厂是神州泰岳推出的NLP服务的开放SaaS平台,旨在为企业客户和行业应用开发商提供最专业、最快捷、性价比最高的NLP技术和服务。该专栏聚焦于介绍神州泰岳智慧语义认知技术和泰岳语义工厂提供的NLP服务。

http://www.nlpai.cn/
专栏二维码
工程NLP
2
相关数据
聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

本体技术

在计算机科学和信息科学中,本体包括表示、正式命名和定义概念,数据,实体之间的类别,属性和关系,并在一个,多个或所有域实例中。

推荐文章
暂无评论
暂无评论~