车好多王文斌: 人工智能如何在汽车交易中发挥作用?

在刚刚结束的市北·GMIS 2019 全球数据智能峰会上,车好多高级算法专家、NLP 与用户画像方向负责人王文斌带来主题为「对话机器人赋能企业在线化」的演讲,介绍了对话机器人在企业服务在线化的过程中是如何成为关键的智能化业务节点并提效业务发展的。

以下为机器之心根据演讲内容进行的不改变原意的编辑、整理:

非常荣幸有这么一个机会,能够代表车好多集团和大家一起探讨人工智能、数据智能在一个具体的产业里面是怎么落地的。

提到车好多大家可能不太熟悉,但是翻到这一页,应该很多人想起孙红雷和杨颖的广告词,车好多旗下有很多品牌,包括瓜子二手车,毛豆新车,瓜子养车,瓜子金融,车好多保险等等一系列协同的业务,我们立足于让每个家庭都拥有更好的车。 

车好多现在在打造一个覆盖车辆评估监测,二手车交易,新车交易,汽车金融,还有维修保养,汽车保险等等在内的全生态的产业闭环。

那么汽车交易是否真的像吃瓜子毛豆这么简单呢? 

其实不是的,汽车交易的复杂性很有可能让你恨不得坐在汽车的引擎盖上大哭一场。

为什么汽车交易复杂呢?一方面,汽车交易的链条非常长,包括从一开始的体验、交易到后续的金融,物流,保险,养护等等。另一方面,在交易过程中具有很大的不确定性,主要是来源于这个过程中有各种各样人的决策的参与。

 比如双边交易的买家和卖家,人工评估师,还有销售的差异化的问题。既然有人的参与,我们在一个成功的交易过程中,其实在跟人性打交道,所以整个过程有很大的不透明性还有不确定性。

我们公司立足于通过技术创新的手段,让整个复杂的交易,从传统的纯线下交易变成线上线下相结合,通过线上的技术能力赋能线下的场景,依托人工智能和大数据的方案促使整个产业升级和转变。

今天我就其中一个落地的实践跟大家展开说一下,也就是对话机器人,在企业服务在线化的过程中是如何赋能提效业务发展的。

首先,一个用户来到我们的 APP 或者 Web 页面,会有有各种各样的渠道,公司会提供一些在线化服务,中间就是包括机器人在内的在线产品,比如用户需要什么样的服务,

用户有什么样的诉求,他需要一个窗口反馈,会把他的数据和诉求留在这个系统里面,后台的系统结合这些数据做出进一步的优化和产品的闭环。 

对话机器人在这个过程中有缩减人力培训成本,提升服务效率等等基本的提高效率的能力;更重要的是,它可以将服务在线化,企业在这一过程中做到沟通的可追踪可优化,把用户咨询和诉求相关的数据记录下来,提供差异化的服务,精细化的运营,从而推动企业精细化的发展。对话机器人的 IM,是其中特别关键的一环,它既是服务的入口又是服务的出口。

对话机器人还可以覆盖售前、售中、售后,省去调查问卷做商业智能分析,把客服从传统的重复工作中解脱出来,变成一个类似专家/秘书的更专业的角色。

特别是精准营销,对话机器人在这方面有天然的优势,是最直接的和用户的触达,我们可以用多轮对话引导用户完善用户画像,从而提供更准确的千人千面的精准营销,把传统的花钱的客服部门转化成赚钱的收益的部门。

接下来跟大家分享一下,我们在具体实践过程中一些技术上的积累和经验。

 我一直在想怎么把对话机器人给所有人解释清楚,其中最核心的是两个方面:一个是用户留下了问题,我要知道他问的是什么意思,也就是意图识别;第二是拿到意图以后,要给一个什么样的回答,除了意图和回答关联关系,我们会重点讲一下知识库在里面扮演什么角色。

 首先对话机器人的基础能力,不管用户输入什么样的问题都能很好的结构化,或者说把问题映射到一个意图,例如画面上这些问题都是在问买车的步骤。下面这是一个对话机器人经典的流程,我们在做的右边这部分,语义理解,对话管理引擎,和基础的知识库。对话机器人的核心概念一个是意图,一个是槽位。

在工业环境中,我把对话机器人技术演进为四个阶段,首先是关健词,后面有模板技术,搜索技术和深度学习技术,这些所有的技术都是基于自然语言处理的基础之上去构建的。 

先说一下模板技术,举个例子,「泉州过户到厦门会不会很麻烦」,先把这个问题进行预处理,然后映射到一个模板,在已经积累的模板库里面进行匹配,如果匹配上意图就会回答,如果没有匹配上,就失败了。

模板对应的知识库中,问题和模板是 N 比 1 关系,模板和回答也是 N 比 1 的关系,我们要积累大量模板库,可以进行同义词的扩展加人工审核,以及人工补充模板,回答也需要人工配置回答。

第二种技术,我把它叫做搜索,问题先经过一个预处理的 query 理解,然后把这个理解结果扔给搜索系统,搜索系统会反馈一个相关的问题 list,通过精细的 rank,得到一个最终从语义上相关度最高的问题。但是稍微变化一下说法,有可能依赖于语义相似度的局限性得到的问题看起来从字面上一样的,实际上语义上完全不相关。 

搜索的知识库就是搜索系统,是我们搜索里面知识的索引库,它的问题和回答是一对一的,我们需要长期的通过人工补充相似问题,同一个意图下不同的问法越多越好,回答也需要人工配置,或者去关联问题。

对话机器人的基础技术第三种,我把它叫做深度学习,深度学习在一般的 NLP 的基础技术里面已经带来很大的提升。

在刚才提到的搜索技术里面,其实深度学习也扮演很重要的角色,比如可以通过比较经典的语义计算框架做排序,排序的特征也可以用深度学习模型提取,但是在具体的对话系统里面,我们用深度学习直接做了一个最核心的提取,就是意图识别和槽位解析。 

深度学习的知识库长什么样子呢?其实是问题到意图是 N 比 1 的,我们需要通过人工标注大量的标签,然后通过意图再关联对应的回答,这个回答也是需要人工配置的。 

模板技术,它的优势主要是准确率比较高,泛化能力比较弱,我认为它的模式是比较重的。

搜索这种技术,它的优势是对业务的适应能力强,无需太多的标注工作,我把积累相似的问题还有回答直接扔到我的搜索系统里面就可以进行一个简单的冷启动。它的劣势是依赖于语义相似性的计算,需要依赖于特别大量的数据才能把模型做到相对准确的程度,同时泛化能力和准确率相对比较低。

深度学习泛化能力比较强,它充分利用深度学习的文本分类能力,但是这种泛化能力和准确率依赖于高质量的数据标注工作,所以它的模式轻重介于模板和搜索之间。

这个是我们对话机器人的算法架构,基于这些基础的技术,再往上我们去开发一些基础的服务,比如意图识别,智能导购,对话辅助,还有自己的 NLP 平台。我们包装了一个比较完整的对话平台,使这个对话平台可以高效的支持新业务,包括 C 端的在线客服,还有打电话的在线机器人客服等等。

刚才提到的意图识别,我们在实践过程中发现可以把这几种技术进行有效的结合,充分利用它们的优势,弥补它们的劣势。 

比如第一层就是刚才以模板识别为主的快速识别过程,它的好处是准确率比较高,我也可以利用快速识别做 badcase 的实时响应。

第二层是深度学习,第三、四层是刚才提到的搜索,如果语义相关性足够高,我们就可以把对应的回答反馈过来。如果语义相关性不高,就会返回最相关的几种结果,让用户去选。

说到对话机器人,不得不提一下多轮对话,这是对话过程中更能精确的满足用户诉求的对话形式。

我总结多轮对话要做好三件事,第一个是填槽,比如说用户说「帮我推荐一款车」,我要反复的确认信息,比如说车型,品牌,价格等等。

第二个是场景管理,有两个概念,一个叫长期记忆,一个是短期记忆,这个短期记忆是用户当前会话或当天的上下文的信息,长期记忆就是积累的用户画像,有了这些记忆的内容让整个对话更智能一些。

第三个是做好可配置,就像在座可能有很多程序开发人员,大家写完一段代码扔给编译器,编译器并不关心这个代码逻辑是怎么样的,只要符合语法就可以了。这个可配置就是这个目的。

 对话机器人整个的系统架构,从用户的角度看到就是一个对话框,把消息发给消息服务器,然后到对话引擎,对话引擎可以和场景管理的记忆进行交互,和知识库进行交互,后面我们的回答有多种多样的形式。

比如说文本类的,一些卡片类的,还有多轮对话,还有可能包含云端服务获取到的信息拼接的一些回答。

我们是需要通过知识库这个媒介去配置回答里面应该去访问哪些动态 API,应该访问哪一个多轮对话。

对话机器人做到后面最关键的是做知识库,真正的把对话的维护能力赋能给业务方和产品。

大家可以看到在最左边主要这么几个部分,知识的管理,意图的管理,训练样本的管理,文本的配置,多轮对话的配置,还有一个标注的系统,我们每天把识别出来和识别不出来的抽样进行标注。这是一个多轮对话的配置的图,现在可以做到非常高效的配置的过程。

接下来跟大家分享一些我们在具体做这个事情的过程中,遇到的一些困难,以及从我个人角度得到的一些心得。

首先作为一个技术人员,比较理想的情况需要算法、平台特别的牛,但是实际过程中我更多的考虑人的因素,产品的因素,整个平台迭代过程也是一个数据和产品驱动的过程。我们希望把这个平台真正赋能给运营,让每个运营人员都成为一个高效的机器人训练师。希望对话机器人配合产品完成整个产品的闭环。 

在这个过程中还有一些比较有意思的事情,比如说数据的来源。刚开始做这个事情的时候,没有任何的数据,我们通过规则定向挖掘一些数据,通过迁移学习得到一些预处理的特征,通过人工纠正和模型反复的迭代,让这个数据训练样本的质量变得越来越高。

然后迭代出一些话术的确认流程,在这个过程中要权衡人和人之间主观意识。产品和算法的平衡,比如用户刚来到对话框,我们会给他个性化的问题列表推荐,给用户回答完以后给他推荐下一个问题,但是这种产品上的方式其实是对我们积累语料有伤害的,抑制用户主动表达他们问题的意愿。

比如业务和技术之间的平衡,大家平时用 APP 还有 Web 的时候觉得界面体验非常炫。但是把这种界面封装成特殊的卡片消息塞进对话框,实际上是与对话形式的交互相冲突的。比如说如果以后我们希望做成语音的交互,这些所有的卡片都没有用了。

这是从技术的角度需要注意的地方,任何算法的选择只满足于当前的需求,我们要坚持不懈的主动做模型的 ab 测试,随着业务的发展意图会呈现一个爆炸的趋势,如何去权衡意图的粒度,也就是服务的粒度,以及可维护性,也是比较有挑战的。

怎么去解决这些挑战?我觉得就是一句话,永远保持主动,我们会主动的提前做一些挑战自己,挑战自己现有系统的事情。

接下来给大家展示现有的一些场景,第一个是刚才提到的用户刚开始进入问题列表的个性化问题推荐,第二个是刚才一直提到的在线化的例子,就是服务直达,我们希望用户在表达他诉求以后把他的需求闭环的解决在这个对话框里面。

第三个是刚才提到的智能导购,或者叫精准营销,比如用户主动表达我想买 30 万的车,我们在对话中给他精准的推荐,用户会表达看车地点太远了,我们会挖掘他潜在的需求,后面为他做一个更准确的推荐。 

这是一个例子,我们会引导他输入城市,品牌等等信息,然后最终给他一个个性化的推荐结果。 

在目前为止经过一年半的时间,对话机器人平台从 0 到 1 已经是比较完善的平台,有效支持公司 20 多款机器人,甚至可以实现一键上新一个机器人,现在已经有包括瓜子二手车的客服,毛豆新车的客服,还有企业内部等等各种各样的对话机器人。

最后给大家简单介绍一下,我们从三个维度,人货场,人是用户画像,千人千面,还有分单调度,我们有大量的线下人员,哪些车分给哪一个评估师,或者哪一个客户分给哪一个销售都需要有一个智能调度的算法在里面。

货主要做的车况智能评估,评估师戴上智能眼镜就可以对车况进行智能的分析,包括汽车画像,还有结合大数据和人工智能的智能定价;然后是智能供应链,比如我们全国那么多仓库,每个仓库下个月到底应该进多少辆车,都需要提前做出有效的预测。 

最后场这一块,主要是车辆的智能管理,资产的智能管理,以及智能的监控分析。我们会做一些人流监测和人脸识别类似的事情。

谢谢大家!

产业大数据技术信息检索迁移学习智能汽车市北GMIS深度学习对话系统车好多
相关数据
调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

文本分类技术

该技术可被用于理解、组织和分类结构化或非结构化文本文档。文本挖掘所使用的模型有词袋(BOW)模型、语言模型(ngram)和主题模型。隐马尔可夫模型通常用于词性标注(POS)。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

商业智能技术

商业智能(Business Intelligence,BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

推荐文章
暂无评论
暂无评论~