搜狗发布知音引擎,一家有技术基因的产品公司如何布局人工智能?

MIT-Address-Qubits_0.jpg

上周,搜狗发布了语音交互引擎——知音,其不仅带来了语音识别准确率和速度的大幅提升,还可以与用户更加自然的交互,支持多轮对话,处理更复杂的用户交互逻辑,等等。知音平台体现出搜狗在人工智能技术领域的长期积累,同时也能从中看出他们的技术基因和产品思维的良好结合。

知音交互引擎——一种人工智能技术能力

搜狗把语音识别、语义理解、和知识图谱等技术梳理成「知音交互引擎」,这主要是强调两件事情,一是从语音的角度上让机器听的更加准确,这主要是识别率的提升;另一方面是让机器更自然的听懂,这包括在语义和知识图谱方面的发展,既包括自然语言理解、多轮对话等技术,更包括搜狗在这方面的产品积累,「搜狗过去的信息和知识索引类产品比较多,搜索引擎,包括各类垂直搜索,工作目标就是索引各种知识,」搜狗 CTO 杨洪涛表示,「如果有方法可以更好的对这些知识进行提取和表示,再和语音识别结合起来,就可以为用户来回答问题了。总结来说,就是自然交互加知识计算,这是此面三五年的搜狗人工智能战略方向。」

对于搜狗来说,「知识交互引擎」和其他语音识别公司的技术开放平台有着很大区别,「这其实是一种技术能力」杨洪涛说。

自然语言会成为接下来非常重要的交互方式,这在科技巨头和语音交互企业之间都已经达成了共识,唯一不同的就是技术的应用方向。搜狗会特别注重技术和场景的匹配,「让机器能听懂人并回答人的问题,需要考虑在在哪种场景下用。」搜狗在短期内比较聚焦的应用场景是车载和客厅,杨洪涛认为这是语音产生很大价值的两个地方,「比如说,我们在和小米交流时,小米盒子上的语音使用率特别高,就是因为传统遥控器在输入时是非常不方便的。」

在这种技术能力的具体应用上,可以分为搜狗的体系内应用和外部应用两方面,杨洪涛对此进行了详细解释:「从搜狗内部体系来看,比如说输入法上更加智能的文字编辑;当用户在搜索问题时,可以直接给出答案,而不是传统的备选列表;地图和导航等产品也会利用语音和多轮对话等聪明的方式去解决,比如说可以理解用户导航背后的真实需求。」

对于外部的应用场景来看,搜狗也有着自己独特的思考,他们会选择通过合作的方式去做,搜狗不是简单的开放技术平台,而是和合作伙伴深度合作,他们认为,只有这样才能将人工智能技术转化成好的产品。「搜狗不是一个输出技术的公司,不是通过技术授权去赚钱。我们是一个产品公司,是去考虑如何打造一个好产品。所以,我们不会考虑把技术推销给更多的企业,而是找重点企业磨合打造一些好产品,这对于我们的技术来说也是真正产生价值。」杨洪涛对此评价,「如果只是开放sdk接口,让开发者嵌入去用,那双方就不能进行很好的互动,最终的产品体验一定不会好。好的产品体验需要两个团队在一起足够的紧密结合。」

搜狗桌面事业部总监王砚峰也补充到,我们的目的是和大家一起来提升这个能力,帮用户解决问题和创造价值。如果你不做这样的产品,那你对用户的痛点和需求、产品上面的内容都不会有深入了解。

自然交互的基础——知识图谱

不管是输入法,还是搜索引擎和导航,为了提供更加智能的服务,就需要有一定知识推理和预测能力,知识图谱和相关的技术也成为机器和用户之间可以进行问答的重要基础。

搜狗的知识图谱产品叫智立方,这主要是面向百科的狭义和独立的知识图谱,通过把知识组织在一起进行推理。而现在,搜狗新的知识图谱也更多的和产品结合在一起。

「比如说现在做基于地图的导航,我们是用地图的数据去做专用的知识图谱。」王砚峰提到。

他认为,这是垂直领域的知识图谱,同时现在语义理解的架构也变了,以前知识图谱只是一部分,更多还是基于搜索的方式去做,而现在是把所有的东西都通过知识图谱来实现,比如说导航里每个POI都是知识图谱的一个核心点,寻找它的属性其实是一个填槽的过程,本质上来讲还是一种查询。王砚峰说:「首先我知道知识图谱上会有什么属性,以及每种属性上大概会有什么样的值,其次我用这个在多轮交互过程中发现用户在针对这个东西的属性进行提问,那我就把属性的值拿出来填到查询的槽里去。」所以,以前搜狗对知识图谱的使用是一个相对更偏知识的,而现在所有垂直类的应用使用的也是知识图谱,都是通过知识的方式来组织和表达的。

同时,从搜索上的角度来讲,通用知识图谱的范围也在继续扩大,而且还要去解决一些不一样的问题,比如说不是传统知识图谱研究中的关于实体、属性和关系方面的问题,但对于搜索引擎用户有直接获得答案而非搜索列表这样的需求。「过去这个思考过程筛选是由人来完成的,对搜索而言,能不能把这种东西提炼出来,给你一个结果?这可能是另一种知识的提取和总结方式,这不是狭义的知识图谱,国内外的搜索引擎公司都在这个方向的思考和研究。」杨洪涛表示。

对于目前知识图谱研究方面还存在的难点,王砚峰认为在数据方面难点还是很多,需要考虑能否通过技术的方式去解决一些问题。比如「想找一家可以带宠物的餐厅」这个需求,最终的知识图谱一定是人类整理和确认后形成知识网络,否则就还是一种搜索,但能否带宠物是个很小的标签,通过人工整理很难实现。但有可能通过点评网站的数据和信息挖掘更多标签,然后再交给人工去整理,所以这个过程就是技术和人工协同起来让知识更完备。王砚峰说:「比如说我们的地图产品,什么东西可以作为地标,什么不能,你在做这类产品时就会有这样的累积,这就是让数据更科学的一个过程。」

杨洪涛认为,信息获取一定是一个知识和搜索相结合的方式,知识图谱会提供非常准确和具有实用性的答案,而一些很长尾的问题还是交给搜索去做。

搜狗未来的人工智能产品

搜狗发布的知识计算就是对知识图谱的衍生,是一种更大范围的知识提取表示,把知识提取出来帮助用户做总结、推理和计算,然后提供一个答案,这是搜狗要解决的问题。「知识计算一个是知识,一个是分析和辅助决策,对于搜索引擎公司而言,这是一个非常具体的概念。」杨洪涛表示。

搜狗在此前「输入法十周年」的发布会展示了具有强大智能辅助功能的输入法,杨洪涛表示这个功能会在今年内发布。这个目前解决的还是辅助表达的问题,帮助用户表达的更快更好更便捷。除了输入法,另外一个会被人工智能技术推动的产品就是搜索,比如说垂直搜索,收集高质量信息并通过问答的形式直接给用户提供答案。

对于今年上半年,谷歌、Facebook 和微软都提到了一个的概念 bots,通过自然对话的方式连接服务,甚至有人将其称之为下一种产品形态。但杨洪涛不认为 bots 会在短期内成为主流,具体的产品和服务还是要回归到场景。但对于搜狗输入法来说,他认可从文字预测到用户意图预测,以及从单纯的输入工具过渡到连接服务的过程。「我们的输入法会不会变成一个智能助手?这种机会是存在的,但要审慎的去看待,输入法是一个中间角色,比如说你在和朋友聊天,输入法突然跳出来帮你推荐,你可能会觉得很惊悚。所以在一个人与人沟通的场景中,这个助手(搜索或推荐)以何种方式推荐给你,以及这种服务的准确性,其实还是需要精妙思考的,而且在技术上的挑战也是非常高的。」杨洪涛说。

一家有着技术基因的产品公司

搜狗有着强大的技术实力,同时又有着领先的产品思维,所以在面对人工智能这项可能会引发变革的技术时,搜狗依然可以将技术和产品完好的匹配起来。「我们是家技术基因很强的产品公司,技术平台开放不是我们考虑的。我们优先考虑的是把产品做好。现在有人会说『我是一家人工智能公司』,这种概念是不对的,就像现在没有人会说『我是一家互联网公司』一样。你还是要回到本身——你提供什么产品和服务,」杨洪涛说,「那些独立人工智能需要并到一个产品生态或者服务生态中去,因为你无法游离体外做到一个产品技术的整合和贡献,两者必须紧密联系在一起,搜狗的好处是,技术能力够强,而本身又是做产品,所以在思考这个问题时,还是基于产品去思考。有些是需要去合作,但不是依靠自己的人工智能技术和别人的产品去合作,或者依靠自己的人工智能算法和别人的数据去对接。」

对于在人工智能趋势下的产品思维,杨洪涛认为,这个和以往阶段不同,第一代是工具互联网,为了上网要有浏览器和导航,为了找到信息要有搜索,为了输入要有输入法;后来是移动互联网,这和服务就密切相关;现在的人工智能,谷歌提出了「AI First」,他认为大家的理念是一致的,但对消费者的理解、对大量数据和知识的掌握又会催生出什么样的产品形态,还很难有个明确的想象,但肯定是这个方向。

本文由机器之心编译出品,原文来自 venturebeat, 作者:Jon Cifuentes, 参与:Terrence L,转载请查看要求,机器之心对于违规侵权者保有法律追诉权。

入门
登录后评论
暂无评论
暂无评论~
返回顶部