Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

沈向洋新官上任,小娜的这位新老板为何如此钟情人工智能?

上周,微软采取了不寻常的措施,将 Cortana 和 Bing 产品团队与微软研究院编入同一个组织中。新的微软人工智能和研究团队将由计算视觉领头人、微软执行副总裁沈向洋带领。在下面的采访中,沈对未来的工作信心满满,并表示,未来会将人工智能融入微软所有的产品中。

Synced (107).jpg

官方博文宣布微软成立了新的人工智能部门,Satya也大概描述了这个部门的定位,是不是可以理解为微软想要在人工智能方面展开某种空间竞赛?

沈:我只是感觉到时机对了,要在人工智能上大干一场。不过这对我来说是苦乐参半。因为我读博时研究的是机器人和人工智能,而我的工作领域却是计算机视觉。在毕业的那段时间里,我并不认为人工智能专业的学生能找到好工作。但现在你再看看这些人,任何一个懂得训练几层神经网络的人都有可能从每家公司找到一个好工作。


这个时机非常好。几个技术因素都融合了进来,包括大量数据的可访,大型计算能力,以及过去几年中机器学习取得了可以说是难以置信的进步,尤其是深度学习。我认为大家感受到时机对了,同时我们也觉得微软应该选择这条路。这就是为什么我们要宣布成立微软人工智能与研究团队( Microsoft AI and Research Group)这一重大决定。


现在Cortana和Bing的产品团队的座位就安置在微软研究员的旁边,此举隐含的意思是这些产品将成为微软的智能举措的焦点。你如何看待这两种产品改善后的结果?

沈:首先我想说的是,在过去的25年里,我们在微软、微软研究院创建的每样东西,都或多或少对产品有所帮助。这家公司里,几乎每一个主要的产品都受益于微软研究院的技术。现在不同的是,要开发出我们真正需要的新型人工智能产品和服务,让用户能更快地用上这些最新的技术。所以我们认为需要加快从研发到产品的周期,这也是为什么我们要将研究人员与开发者真正地放在一起。


而且对于Bing和Cortana这两个产品,如果你对前者有所了解,你不妨在看看后者。我个人服务于Bing已经7年了。人们当然应该有不同的意见,但我想说Bing是一个值得信赖的搜索引擎,我们为人们提供一个可信的选择。在美国,我们占了大约三分之一的搜索流量。


Cortana是那种让我们真的非常兴奋的东西。你说的对,像Cortana这样的产品象征着人工智能。今天我们大约拥有一亿三千三百万的Cortana用户,而且我们真的已经回答了超过100亿条问题。人们使用Cortana的次数越来越多。加入微软研究院及其人工智能研究团队的力量加持后,我对Cortana的质量及其用户体验的期望一下子就高了。所有的一切都在持续改善中。


我感觉Cortana的活跃用户还不及Windows10 用户的一半。你对此感到满意吗?

沈:如果你把这类产品一直做下去,总会有提升的空间的。你说的也对,当我们设计并发布这个产品时,会有两个最重要的事情:用户数量与用户参与数。这是一个非常有趣的设计决策:产品是什么?用户用这个东西来做什么?我真正要跟踪的一件事情是用户使用这些代理在每一次单独的会话中的对话数量。与市场中其他的竞争产品相比,我们真的觉得Cortana表现的还不错。


我不清楚你是否知道我们已经有了另一个非常好的产品叫小冰,一款聊天机器人。目前在中国发布,还有一个日语版本,在日本也同样受欢迎。我们也在想怎么将小冰引入美国市场。当你设计一个不同类型的代理,比如一个聊天机器人,用户互动量就会非常的高,而且不同。所以确实要依靠产品设计。


Cortana目前只是一个助手:你需要她时她出现,事情一完就自动消失。而谷歌在尝试一种助手式的聊天机器人。你觉得Cortana不久的未来会成为一个聊天机器人吗?

沈:Cortana是设计用来帮助人们完成任务的,可以提醒主人为妈妈的生日准备礼物,或者告诉你该回家了,不然等下会堵车。大概是类似这种知识类型的问题。而这是一种我们今天就要做出决定的设计决策。

我们会向已经发布以及还在研发中的其他聊天机器人取经。我们已经明白哪种用户场景对用户更重要。我不认为世界上只有一个智能代理的情况会很快出现。


我想再次强调这种类型产品的复杂性和难度。我认为它离成熟还尚早。

image02.png

沈向洋


你现在是Cortana的老板。你能比较一下Cortana与Siri还有Google Assistant的优势与弱点吗?

沈:市场中能有这些竞争产品真的很棒。我想没什么事情会比看看其他伟大的工程师在做什么更加令人兴奋了。


我想说,很清楚的一点是我们身上流着Bing的血液,我们理解这个世界的知识,以及我们能在这里做什么。然后我们再来做一下比较。我们理解不同场景下的用户,也拥有用户愿意与我们分享的旧的知识以及其他有趣的相关数据,比如日历信息,还有他们与我们分享的email。所以我们能把工作做得更好。


另外我们从一开始就很清楚,我们希望Cortana拥有某种形式的个性。这实际上是另一种设计选择。如果你观察Siri和Cortana,它们的背后有着共同的理念。而其他语音助手却不太一样。


微软现在鼓励我在对话中通过Skype翻译器使用德语,我不会德语。语音识别是其他产品的基础,包括听写软件。为什么听写软件不能在Word和Office中占据更重要的地位呢?

沈:我将会告诉你们现在现在是时候让它扮演重要角色了。请放心,我们正在将人工智能技术加入所有的微软产品中。如果你错过了,我可以确定的告诉你,在几周之前,我们已宣布微软的语音识别技术打破了交换机测试中的错误率记录。IBM原本一直领先,现在我们是第一名了。我们正在努力工作,争取早日将识别能力提升到人类水平「和人类认知水平相当」。相信我们很快就会成功。


Windows 10中应用的语音技术可以追溯到Windows Vista时期,而Cortana的语音技术显然更晚才发展起来。那么我们什么时候才能看到Cortana语音技术被整合进Windows中呢?


我们在Cortana中使用的技术并不基于Windows Vista的技术。Vista中的代理太老旧。这也是为什么微软的研究者们正在联手合作,希望实验室中才能展现的技术能够更快进入消费者手中。我们对此感到非常兴奋,希望能够很快向大家展示我们更多的进展。

理论微软产业沈向洋
暂无评论
暂无评论~