百度AI快车道飞桨PaddleNLP实战营:客服质检情感识别 让对话不再冷冰冰

日前,智研咨询、易观等数据平台相继发布《2022-2026年中国智能客服行业市场运营现状及投资规划研究建议报告》、《2019中国客户服务智能化市场专题分析》等客服行业相关报告,报告内容都在不同程度提及了客服行业市场规模的扩大,其中智研咨询发布的报告显示,至2018年我国智能客服行业市场规模达到了27.22亿元,同比2017年增长了44.48%。智能客服行业规模不断扩大,而如何降低成本并提供给顾客更好的体验,一直是该行业在不断探索的重要问题。

这其中,自然语言处理(NLP)技术的应用则是优化体验的重要“工具”之一。NLP技术不仅在智能对话、智能问答等智能客服场景中发挥着核心的作用,而且能在客服质检环节提高质检效率、优化客服质量。

智研报告资料内容

在传统客服场景下,为了保证服务质量,有专门的客服质检员来对服务记录进行抽样监听及评分工作,并形成质量报告反馈于业务人员和客服人员。但往往客服质检员在抽样和统计过程存在耗时、效率较低、质量报告难以完全代表整体客服水平等问题。利用NLP技术后,可以对顾客的说话内容进行情绪正向、负向、中性的标签定义,初步完成对存在问题的客服进行筛选,从而为企业降低了人工质检的成本并提高了效率。

在优化客服体验的“这条路上”,基于飞桨深度学习平台开发的自然语言处理(NLP)工具PaddleNLP,为企业与开发者带来了诸多便利。PaddleNLP是百度飞桨开源的产业级NLP工具与预训练模型集,提供了依托于百度实际产品打磨,通过百亿级大数据训练的预训练模型,能够极大地方便 NLP 研究者和工程师快速应用。使用者可利用百度飞桨PaddleNLP 灵活使用文本分类词法分析、相似度计算、语言模型文本生成、阅读理解和问答、对话系统以及语义表示8大类工具,并且可以直接使用百度飞桨开源工业级预训练模型进行快速应用,在极大地减少研究和开发成本的同时,获得更好的基于产业实践的应用效果。近期,百度AI快车道PaddleNLP实战营举办多次活动,从文本语义匹配、对话情绪识别、物流信息抽取三个主题带来不同的PaddleNLP开源工具的实战课程。

其中,“对话情绪识别”的本质就是通过“分类任务模型”对客户表达的内容进行快速分类,辨别其当前表达的内容在情感上是正向、负向还是中性的。因此,当模型应用于客服质检业务时,可有效快速地检测出用户表达的内容中,是否表达了不满、满意和无情绪三种感受。客服质检员则可针对识别为不满情绪的对话客户进行集中的查看,用以提升客服质检的效率。

使用NLP分类任务的客服质检业务

技术上,基于百度飞桨PaddleNLP的“对话情绪识别”模型则特别针对中文表达中口语化、语气词多、词汇乱序等常见情况与难题,优化除去口语化、同义词转换等预处理方式,保证识别数据的干净有效,从而让机器“更懂”用户所表达的“中心思想”。因此,该模型可以广泛的适用于电商、教育、地图导航等场景,帮助“机器”更好地理解“人心”。

此外,百度飞桨所提供的AI Studio一站式开发实训平台,还可提供集开放数据、开源算法、免费算力三位一体的服务,为开发者提供高效易用的学习开发环境、高价值高奖金的算法大赛、高质量的案例和进阶课程,助力企业加速落地 AI 业务场景,相关内容可进入百度大脑开放平台AIStudio页面查看。

活动当天,不少开发者表示导师讲解的内容“非常实用”,一位来自社交领域NLP开发的从业者更指出:“飞桨AI Studio使用下来感觉非常‘流畅舒服’, 开发者可以用现成的代码,把整个操作流程‘跑通’。尤其是对于初学者有着极大帮助,能够帮他们快速上手建立信心。”

百度AI快车道活动现场

在应用上,面对解决实际问题的具体模型选择时,除了要考虑模型本身的效果,还要考虑跟真实操作环境的匹配。在GitHub的PaddleNLP主页里,已经对包括对话情绪识别工具——emotion_detection等许多数据集等进行验证,开发者可以直接进入GitHub网站使用。

GitHub中对话情绪识别代码结构说明

2006年深度学习模型的提出,直接驱动了AI在图像识别、语音识别自然语言处理等方面取得众多技术突破。而AI作为一种“新动能”,正在为众多传统产业降本提效和模式升级,带来质的突破,产业智能化将成为新的趋势。因此对AI乃至深度学习的关注和了解,将成为各行业“玩家”领先一步的关键。据了解,百度大脑AI开放平台十月份集中分享了基于飞桨的深度学习领域资料,面向众多开发者推出“深度学习技术课堂,探索实践继往开来”主题月活动。

在客户服务场景中,语言和表达就像是“第一生产力”。随着金融、电信、教育、电商等行业的快速发展,大众对客服的需求也随之增加。然而,人工客服因数量覆盖有限,而现有的“智能客服”则因语言和表达“不通人情”常让客户难以满意,此时,情绪识别的价值便凸显出来。

具体如何使用PaddleNLP开源工具集的分类任务,从数据准备到模型训练,再到效果调优,百度AI快车道PaddleNLP专场活动中已进行详细说明。错过此次活动不要紧,开发者可以进入“IT大咖说”网站后搜索“AI快车道”即可回看活动直播。

百度飞桨深度学习平台对“产业智变”的探索还在持续进行中,想要快速上手、获得开源代码、听大咖实操解读等,可以进入百度飞桨官网,关注微信公众号“飞桨PaddlePaddle”,或加入PaddleNLP交流群,了解最新信息。

产业图像识别深度学习PaddlePaddle百度飞桨
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

文本分类技术

该技术可被用于理解、组织和分类结构化或非结构化文本文档。文本挖掘所使用的模型有词袋(BOW)模型、语言模型(ngram)和主题模型。隐马尔可夫模型通常用于词性标注(POS)。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

词法分析技术

词法分析是计算机科学中将字符序列转换为标记序列的过程。进行词法分析的程序或者函数叫作词法分析器,也叫扫描器。词法分析器一般以函数的形式存在,供语法分析器调用

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

模型选择技术

模型选择是从给定数据的一组候选模型中选择统计模型的任务。对于具有类似预测或解释力的候选模型,最简单的模型最有可能是最佳选择(奥卡姆剃刀)。

信息抽取技术

信息/数据抽取是指从非结构化或半结构化文档中提取结构化信息的技术。信息抽取有两部分:命名实体识别(目标是识别和分类真实世界里的知名实体)和关系提取(目标是提取实体之间的语义关系)。概率模型/分类器可以帮助实现这些任务。

百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

推荐文章
暂无评论
暂无评论~