5月15日,「与未来对话——百度大脑智能对话引擎及产品发布会」在京举行,会上发布了包含UNIT3.0和语音技术平台的全新智能对话引擎,并在此基础上推出了客服、消费电子和出行三大智能对话解决方案,首次展示了百度大脑智能对话生态。
UNIT3.0全面升级
UNIT(Understanding and Interaction Technology)是面向第三方开发者的理解与交互技术平台,提供专业对话系统定制技术。
2017年7月,百度在AI开发者大会上发布对话系统定制平台UNIT,搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力;2018年7月,UNIT推出的2.0版本,技术、功能与架构实现全面升级,为开发者提供更加易用、更加专业的对话系统定制能力。
据百度自然语言处理部主任架构师孙珂博士孙珂介绍,UNIT平台具有强大的对话理解及管理能力,该平台已累计超460亿次的交互量。而在应用中,从对话核心技术到场景化的真实对话系统落地,企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此,百度大脑推出UNIT3.0版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级。
搭建技能
技能搭建包括预置技能和自定义技能。
UNIT3.0全新发布了智能问答、设备控制、影音休闲、生活服务等多个方面共58项积累自真实业务的预置技能,沉淀了全网最全面最优质的信息类资源;同时,预置技能也支持开发者结合特定场景进行再次开发,使其更符合场景业务需要。
自定义技能包含自定义问答技能和对话技能两部分。
自定义问答技能方面,全新发布了文档问答功能,支持开发者上传业务文档并一键训练,在1分钟内快速定制问答系统。
自定义对话技能方面,针对大样本量训练数据的获取与标注难题,UNIT3.0正式发布了训练数据生产与标注辅助工具DataKit,实现自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。
强大的对话理解技术是实现优秀对话技能效果的必要条件。UNIT3.0使用多引擎融合的对话理解技术,融合「快速生效」与「深度训练」两种训练模式,利用「快速生效」实现对话技能快速冷启动,基于「深度训练」持续优化效果。其中,「深度训练」模型全新升级,融入了百度最新发布的语义表示预训练模型ERNIE,可在标注数据大量减少的情况下达到同样效果。升级后的DataKit和基于深度训练的理解技术结合起来,可使对话技能的综合研发成本节省60%。
构建知识
据了解,70%的企业在智能对话系统构建过程中面临梳理和准备企业知识的困难。针对这一痛点,UNIT3.0在构建知识方面实现重磅升级,全新发布问答知识库构建工具和图谱知识库构建工具。
问答知识库构建工具:帮助开发者构建问答知识库,节省人工成本。
图谱知识库构建工具:辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识可以导入UNIT问答技能词槽词典,进一步帮助对话理解效果的优化。
整合技能与知识
UNIT3.0进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。
技能与知识管理能力包含「技能管理」、「对话管理」、「知识接入」三个方面。其中技能管理实现多技能顺序可调,并共享全局记忆;对话管理具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,HTTP服务全面支持接入。
语音技术平台新升级
听懂语音、理解对话、快速反馈是智能对话中的重要组成部分,对此语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。
百度语音技术部资深产品经理何荡首先介绍了百度的语音技术,包括语音唤醒、语音识别、语音合成三大块:
呼叫中心语音解决方案
本次发布的呼叫中心语音解决方案,可在呼叫中心场景中提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型(基于流式多级的截断注意力模型SMLTA)、呼叫中心场景专属的语音合成8k音库,满足适配主流厂家MRCP对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。
语音自训练平台:零代码自助训练语言模型
「零代码自助训练」所体现的低门槛无疑是语音自训练平台的最大亮点。其操作步骤简单:创建模型,系统评估;上传文本,训练模型;上线模型,持续迭代。
据了解,该平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。
三大智能对话解决方案
上文介绍的百度全新智能对话引擎对开发者而言非常具有吸引力,不论是其简洁性,还是效果。
而场景落地是技术发展的最终方向,智能对话也是如此。百度大脑此次推出了针对客服、消费电子和出行的三大智能对话场景方案。这三大方案从领域业务需求、集成与配合、部署与维护做出了不同程度的升级。
客服智能对话场景方案
客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点,推出全新的语音语义一体化中控,实现一次交互完成语音和对话理解服务访问同时,预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。此外,在部署与维护方面实现了云端部署和私有化部署的多样化部署,可按需匹配。
消费电子对话场景方案
消费电子对话场景方案综合考虑其场景、资源的开放性,软硬件终端产品的多元化等特点,除了前面提到的沉淀至真实场景的58项预置技能和优质的信息与问答资源外,还开源了对话管理模块DMKit、对话中控模块USKit,它们具备与云端理解能力无缝对接,帮助开发者深度定制对话技能。也支持公有云、虚拟私有域部署模式,提供完善的Android、iOS SDK接入方式,还可一键接入DuerOS和小程序等。
出行智能对话场景方案
出行智能对话场景方案是面向出行场景专属定制的,拥有车载专属语音解决方案和车厂专属语义定制平台。车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。车厂专属语义定制平台提供丰富的预置能力和车厂技能自定制能力支持。
其中,在车载领域,面向车载网络稳定性不可控的特性,百度大脑推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能,高性能离线语义嵌入式SDK;也推出了支持出行场景离在线对话能力融合的框架。
从1.0到3.0,UNIT系统越来越开发者友好,利用大量预置技能、自定义技能,便捷的知识构建方式等帮助开发者和企业更加快速便捷地构建自己的对话交互系统。而升级后的语音技术平台携「零代码语音自训练平台」等更新,极大地降低了使用门槛。从「开发者友好」到「场景落地」,百度智能对话引擎开启了新的生态。