誓做客服机器人里的大疆,意能通ALL IN自研智能语音引擎

客服机器人市场,在客户的争夺上已经进入白热化,尤其是中大型客户的争夺已经全面进入价格战模式。苏州AI公司意能通面对现状,却胸有成竹。因为在他们看来,属于他们的时代才刚刚开始。

近年来,国内客服机器人行业发展非常快。特别是随着深度学习技术的崛起,NLP领域有了极大的突破。智能客服机器人作为NLP最具潜力的应用场景之一,近年来有大批新玩家积极涌入这一领域。其实,造成这一现状的根本原因却是市场对客服机器人产品的刚性需求。由于客服人员招人难、培训成本高、流动性大,不易管理,而客服机器人可以全天24小时工作,还能通过实时数据反馈不断学习,企业有足够的动力用客服机器人取代一部分人工客服。

并且根据最新的调查数据显示,中国大约有500万全职客服,以年平均工资6万计算,再加上硬件设备和基础设施,整体规模约4000亿人民币。按照40-50%的替代比例,并排除场地、设备等基础设施以及甲方预算缩减,大概会有200-300亿规模留给客服机器人公司。面对如此大的蛋糕,市面上短期内出现近百家客服机器人公司就不难理解了,并且智能语音开放平台还提供了看似成熟的解决方案,让这个行业的门槛变得貌似非常低,所以行业整体上才呈现出大干快上的发展节奏。

其实做好客服机器人的门槛相当高。仅就语音识别来说,虽然智能语音开放平台,比如科大讯飞、百度、阿里、腾讯这些,都提供了解决方案,并且准确率都很高,但这个准确率都是在手机里面测试的结果,技术人士应该清楚,手机声音采样一般是16K Hz以上,双麦克风采集,语音质量非常高,所以才可以达到95%以上普通话识别准确率。但是在电话场景里采集的音频通常是8K Hz的,音频质量较差,所以直接调用开放平台的语音识别接口,准确率就会急剧下降,效果就不会太理想。因此,要做好客服机器人的语音识别率,就应该对语音识别(ASR)的算法进行深入的研究,针对8KHz在语音识别算法上做出针对性的参数调整,才能建立优秀的电话语音识别引擎,没有这些作为基础,就不会有让客户满意的语音识别率,更别妄想打造一个优秀的客服机器人产品。

https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1537433551828&di=bb7240053ad3f3db5007330a616844c8&imgtype=0&src=http%3A%2F%2Fweb.ee.nthu.edu.tw%2Fezfiles%2F30%2F1030%2Fpictures%2F33%2Fpart_11508_8272228_33354.png

成立于15年的意能通,刚刚完成2450万A轮融资,被估值2亿。旗下核心产品——小意机器人,就没有采用任何一个智能语音开放平台的方案,而是全情投入自研语音识别引擎,耗费巨资,从底层去解决电话语音识别准确率的问题。还自研了自然语言处理引擎,并把两个引擎进行了深度整合,实现语义库与语音识别引擎同步训练,在语音上就能进行适应和纠错,无需先做语音识别转文字,再做语义理解,避免了准确率经过逐级传递最后导致非常差的现象,让小意机器人智能语音识别准确率达到业内领先水平。

意能通能达到如此成就与其创始人刘雨松博士的理念密不可分,在15年意能通创立之初,就计划将其打造成客服机器人行业的大疆。笃信技术,崇尚创新能力,坚韧不拔,用具备在全球都领先的核心竞争力,为客户提供最优秀的客户体验,这即是刘雨松博士对大疆成功的总结,也是意能通最信奉的价值观。

在践行价值观的路上,刘雨松博士带领几十人的技术团队,创新性的判断只有大批量高质量的电话语音数据,对自研的算法模型进行针对性训练,才能打造出最好的客服机器人,由此,他们采集了长达数万小时的电话语音数据,进行标注和训练。如今,这些数据已成为小意机器人横行市场的硬核武器。

据了解,也正是看到了这些技术优势,多个行业近百家头部企业都成为了意能通的客户,比如中国电信、中国联通、人保财险、同程旅游等等。为了更好的服务这些客户,意能通为他们提供了完全私有云部署和离线部署方案,解决了客户对数据遗失、盗取的顾虑。同时在私有化部署上,意能通现在可以做到一个CPU 10并发,每个并发在一秒钟之内可以得到回复,双CPU共32核的话,极限可以做到500个并发,形成了强大的竞争优势。

产业人工智能应用语音识别客服机器人意能通NLP
12
相关数据
科大讯飞机构

科大讯飞股份有限公司(SZ.002230)成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞的语音合成、语音识别、口语评测、机器翻译等智能语音与人工智能核心技术代表了世界最高水平。

http://www.iflytek.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
客服机器人的市场的竞争确是越来越激烈。
点赞
1