Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

从二手车到自然语言处理:车好多基于业务驱动的人工智能落地应用

日前,GMIS 2019全球数据智能峰会在上海召开,车好多集团(瓜子二手车及毛豆新车母公司)NLP和用户画像负责人王文斌受邀参加峰会并发表主题演讲。在题为《对话机器人赋能企业在线化》的主题演讲中,他介绍到,车好多已经将大数据与人工智能技术应用于汽车消费服务的全流程中,包括在线客服这类极具个性化的服务也已经大多被基于NLP的人工智能客服所代替,目前瓜子二手车有90%的售中售后均由人工智能客服独立完成。除了客户服务效率与体验得到大幅提升之外,对用户画像、个性化服务也发挥了关键的作用。

本文根据演讲主要内容编辑,略有调整。

传统的汽车交易非常复杂,交易链条冗长,具有卖家和买家双边市场的不确定性,又在各个环节对人工服务有严重的依赖。车好多集团持续尝试通过技术创新改变传统汽车消费流程和体验,旗下包括瓜子二手车、毛豆新车、瓜子养车等多条业务线,基于AI+大数据结合实现交易流程的变革,打破汽车行业的不透明性不确定性,将汽车检测、定价、推荐、流转等流程全部智能化,实现互联网+传统行业的产业升级。在业务在线化的过程中,以NLP方向为核心的对话机器人成为连接人和企业的桥梁,是车好多生态服务的一个重要入口和出口。

瓜子智能团队从0到1研发了一套对话机器人平台,结合了模版、搜索、深度学习等多种技术实现意图的精准识别,并通过知识库系统实现对话的灵活定制和效果保障。

首先,对话机器人最核心的能力,就是不管你说什么,它总能理解其意图,或者总能对问题进行很好的结构化。意图的理解总结起来先后有四种技术:关键词、模版、搜索、深度学习。对比4种技术:关键词是比较久的技术,准确率和泛化能力都有问题;模版技术准确率高,但是泛化能力弱;搜索技术业务适应能力强,很适合新业务的快速支持,但准确率受限于语义相似度的计算;深度学习技术指的是利用深度学习进行意图的分类,准确率高,但同时对数据要求高。瓜子对话机器人在实践中结合了几种技术,充分利用各自的优势、互相弥补各自的不足。

识别了意图,接下来就是如何做出回答。在瓜子的场景里,要求回答是确定的。所以如何回答就变成了意图和回答的对应方式。三种不同意图识别,有三种不同的对应方式。回答可以是文本,也可以是服务,可以是单轮问答,也可以是多轮对话。

多轮是一个更偏工程的过程。里面更多的算法是在做槽位解析,需要做好三件事,首先是填槽,如果对话过程中槽位未补全,在下轮对话过程中引导用户补全槽位信息。其次是场景管理,需要维护海量用户的聊天信息。最后一点是可配置,多轮最后面都是一个业务问题,开发一个可配置的界面,让运营自行配置其需要的对话。多轮的逻辑是在知识库里配置的,DM是和业务无关的,只需要按配置的解析结果执行即可。

按照上面设计还是会出现风险,归纳起来常见的五个风险有:任何算法的选择都只是满足当前的需求,数据是历史数据,算法是当前反馈,业务演化过程不可知;模型互搏,各种模型都要去做A/BTest确定哪种好哪种坏,之前更多的判断是从原理上判断;意图爆炸,目前知识库是基于意图回答一对一关系,业务相对收敛,但是未来发展速度可能导致意图不可收敛;主观标准的反复,很多过程都由人工参与,每个人评判标准不一;模型更新滞后于业务发展,技术发展较快。解决方案就是永远保持主动,提前应对。

最后介绍下系统架构:前端有一个对话框和消息服务器,类似于IM基本架构,消息服务器会将消息路由到对话管理模块(中控)。用户聊天文本会在中控识别意图和槽位,通过意图在知识库中获取对应的话术。知识库有一个控制台,与外部交互的界面,对话管理也会访问后端云服务,比如通过ip地址获取其属于哪个城市,除此外还有语义理解、CRM服务等。

目前车好多智能团队已经上线了20款以上机器人,覆盖了在线客服、电话外呼、企业IM多个场景,未来将继续肩负起服务桥梁的作用。用户需要什么服务,企业可以提供什么服务,用户对服务是否满意等,对话机器人将成为服务闭环中的关键一环。

产业瓜子二手车智能物联网自然语言处理
21
斌哥讲的太好了,既有现有核心技术点,又有现存风险,学习了。