李泽南 路雪编译

微软收购伯克利创业公司Semantic Machines:探索语音交互技术新前沿

今日,微软宣布收购由 UC Berkeley 教授 Dan Klein 与斯坦福大学教授 Percy Liang 等人共同创立的对话系统创业公司 Semantic Machines。这家公司的技术或许将在语音合成、深度学习和自然语言处理等方面帮助微软与亚马逊 Alexa、苹果 Siri 和三星 Bixby 进行竞争。


Semantic Machines 团队成员 

人工智能的研究近年来经历了长足的进步,但迄今为止,我们仍处于教计算机理解人类对话文本的初始阶段。大多数目前的 聊天 机器人 和智能助理都可以回应简单的命令和 查询请求,如提供天气预报、播放歌曲或共享提醒,但却无法理解人类语言的含义或进行对话。为了让交流变得丰富有效,智能助理需要理解自然语言的含义,而不是仅能够响应命令。这就是我们所说的「会话式 AI」。

今日,微软宣布收购创业公司 Semantic Machines。这是一家背靠 UC Berkeley 的创业公司,它已开发出用于构建交互式 AI 系统的革命式新方法。他们的研究利用 机器学习的力量让用户通过更加自然的方式发现、获取信息与服务并与之互动,而且耗费的资源显著降低。

Semantic Machines 由会话式 AI 的很多先驱领导,其中包括业界的 Dan Roth 和两位全球知名的创新自然语言 AI 研究者:UC Berkeley 的 Dan Klein 教授和斯坦福大学的 Percy Liang,以及前苹果首席语音科学家 Larry Gillick。

近二十多年来,微软一直致力于会话式 AI 各方面的基础研究,并形成了一些技术突破,如 语音识别和自然语言理解。微软的目标是让全球的计算机可以看见、听到,并理解人类的意图。2016 年,微软迈出了实现会话式计算远景的又一大步:推出了一个开发 机器人的框架,并发布了预构建的认知服务(Cognitive Services),将 语音识别和自然语言理解产品注入智能助理。今天,已经有超过 100 万开发者正在使用微软 Cognitive Services,超过 30 万开发者正在使用 Azure Bot Service,这些服务都在帮助计算变得更加具有交互性。

微软正在持续开发自己的交互式 AI,包括数字助理 Cortana 以及社交 聊天 机器人 小冰。小冰已经与人类进行了超过 300 亿次对话,平均时长 30 分钟,小冰在中国、日本、美国、印度和印尼的平台上共计有 2 亿用户。通过小冰和 Cortana,微软在 语音识别领域上取得突破性进展,并在最近成为第一个在会话式 AI 系统中加入全双工语音交互感官(full-duplex voice sense)的公司,使人们可以和计算机进行自然的对话。

随着对 Semantic Machines 的收购,微软将在伯克利建立一个会话式 AI 研究中心,持续推进自然语言理解的前沿技术。微软相信,将 Semantic Machines 和微软自有的技术相结合,最终可以带来强大、自然且更具实用性的用户体验,将会话计算提升到一个全新的水平。

Semantic Machines 成立于 2014 年,曾于 2015 年 12 月获得了 1200 万美元的 B 轮融资。

原文链接:https://blogs.microsoft.com/blog/2018/05/20/microsoft-acquires-semantic-machines-advancing-the-state-of-conversational-ai/

产业对话系统UC Berkeley微软
1
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

推荐文章
暂无评论
暂无评论~