晋耀红作者

面向NLP场景应用的智能辅助建模(五)特色与优势

我们以前文介绍的一个场景本体的实例,银行领域客服投诉分析挖掘的场景本体模型,来说明本体树辅助建模。模型包括三部分:本体模型、要素模型、概念模型。智能辅助建模将介绍如何利用机器学习算法和语义资源,辅助场景业务人员,自动或半自动化地构建具体场景应用中的OEC模型。本文将简单总结下OEC智能辅助建模的特色和优势。

智能辅助建模优势

OEC智能辅助建模,提供一套完整的面向业务建模的流程,以本体模型为主线,对本体模型中的本体树、领域模型,以及要素模型和概念模型中需要建模的内容,通过辅助建模工具的功能,调用相应的机器学习算法,来进行自动学习,将学习结果输出给模型,辅助业务人员快速构建适应业务需要的本体模型。

与市场上其他面向场景的NLP解决方案相比,OEC智能辅助建模具有几个优势:

1、将业务人员的操作与机器学习、NLP算法严格区分开来。业务人员无须掌握高深的机器学习算法,也无须针对每个业务场景来费尽洪荒之力,将各种NLP算法组织成一个应用流程,而只需要运用业务知识,对文本数据进行操作,即可完成业务模型建模。

2、业务针对性更强。智能辅助建模可实现有指导的建模,而不是仅仅只看到一个算法黑盒子,业务人员对整个处理过程、输出结果,以及与业务知识的因果关系等一览无余。

智能辅助建模特色

下面通过将OEC智能辅助建模与传统的NLP解决方案对比,来简单说明OEC智能辅助建模的特色。下面图示中,红色字体表示的是OEC智能辅助建模的功能,蓝色字体表示的是传统解决方案的功能。

特色一

智能辅助建模对业务分类体系的输出结果是本体模型中的本体树,本体树与业务直接对应,以最大程度的满足业务可解释性的需求。而传统解决方案一般直接采用分类聚类算法,输出的结果无法与业务有明显的业务关联,可解释性差。


特色二

智能辅助建模对业务相关实体自动发现的结果,输出到要素树进行管理,要素树直观可见,方便业务人员管理,同时,具有要素树的复用性强。而传统解决方案,一般直接输出实体发现结果,杂质太多,而且不利于复用。


特色三

智能辅助建模对领域模型的构建,通过对本体树节点的本体表达式发现,来自动挖掘每个业务节点的领域知识。本体表达式发现使得隐藏在数据中的业务规则,显式地表示在本体模型中,从而获得良好的可解释性,并实现最大化的复用。同时,本体模型也支持给单个的本体节点,配置机器学习模型,来通过机器学习算法,自动训练模型。传统的解决方案一般都无法构建关联规则,特别是具体到某个业务节点的关联规则。

特色四

智能辅助建模提供可视化建模工具,业务人员可以通过简单的拖拉拽的方式,即可完成辅助建模过程,而无须掌握过程中用到的复杂的机器学习算法,以最大化的降低业务人员使用门槛。传统的解决方案无法实现可视化建模,处理过程需要业务人员熟知各种机器学习算法,使得业务人员望而生畏。


特色五

智能辅助建模的后期维护成本低,模型复用性高,其中的要素树、概念树、本体表达式等均可以一次建模,多个业务复用,大幅度降低维护成本。传统解决方案一般每个业务均需要单独开发算法,无法复用,新业务开发和已有业务维护均需要投入大量人力。


智能辅助建模总结

最后,我们总结下OEC智能辅助建模的特色和优势,辅助建模面向业务,业务人员操作简单,模型复用性高,输出的线上模型与输入的线下数据打通,提供覆盖本体模型、要素模型、概念模型的整套辅助建模平台,同时兼容概念模型和机器学习模型。

泰岳语义工厂
泰岳语义工厂

泰岳语义工厂是神州泰岳推出的NLP服务的开放SaaS平台,旨在为企业客户和行业应用开发商提供最专业、最快捷、性价比最高的NLP技术和服务。该专栏聚焦于介绍神州泰岳智慧语义认知技术和泰岳语义工厂提供的NLP服务。

http://www.nlpai.cn/
专栏二维码
工程NLP
2
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

本体技术

在计算机科学和信息科学中,本体包括表示、正式命名和定义概念,数据,实体之间的类别,属性和关系,并在一个,多个或所有域实例中。

推荐文章
暂无评论
暂无评论~