Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

「保持中立」的Yoshua Bengio,是如何被沈向洋引向微软的?

在萨提亚·纳德拉掌权之后,微软正在沈向洋、Yoshua Bengio 等人的帮助下迅速成为人工智能的第三股强大势力,在 AI 技术快速发展的时代,它正在向谷歌与 Facebook 发起挑战,力图夺回自己曾经拥有的地位。本文是《Backchannel》主编 Jessi Hempel 发表在《Wired》上的一篇长文特写。




Yoshua Bengio 从来不会选边站。作为主导人工智能深度学习热潮的三大领军人物之一,某种程度上他已经成为了超级明星。人工智能是一个新兴领域,如果你把来自科技公司、跨国企业甚至国防部的人集中到一个房间,每个人都会希望对这个话题分享自己的看法。

但另外两个领军人物早已投身业界,Yann LeCun 和 Geoffrey Hinton 此前分别加入了 Facebook 和谷歌,而现年 53 岁的 Yoshua Bengio 选择继续在他位于蒙特利尔大学校园的三层小楼里教书育人。「我希望继续保持中立的位置,」Bengio 说道,喝了一口甘草水,他的书桌上堆满了各式各样的文件,显得杂乱无章。

就像上个世纪的核物理学家一样,Bengio 明白自己正在发明的工具具有无可比拟的力量,需要经过深思熟虑和广泛考量才能真正推出。「我不希望有一家或者两家公司——在这里我不会点名——成为人工智能变革中的唯一大玩家,」Bengio 说道,抬起眉毛,暗示我们都明白他所说的是哪两家公司。左眉毛表示门洛帕克(Facebook 所在地),右眉毛表示山景城(谷歌总部所在地)。「这对研究社区并没有好处,对人类也没有好处。」

这就是 Bengio 最近选择签约微软的原因。

是的,微软。他选择押注曾经 Windows 帝国的缔造者,认为它有能力成为人工智能的第三个巨头。这是一个拥有资源、数据、人才,还有最重要的——愿景和文化的公司,它不仅利用科学获得收益,也推动了科技向前进步。在今年一月,人工智能领域发生了一件大事,Yoshua Bengio 同意成为微软的战略顾问。这让微软突然在人工智能领域有了最好的想法、人才和方向。有迹象表明,微软正在让人工智能的对唱演变为三重奏。


那个签下 Yoshua Bengio 的人,一直在这位深度学习巨头身边游说了数月之久,就像为球队寻找明星的经理一样使尽了浑身解数——这个人就是一头灰发,戴着线框眼镜的沈向洋。「他已经来到了微软,在我们中间了,」沈向洋说道,展现了一个简短的笑容,表示他明白对于一个外行而言,理解这位有着 69,161 个谷歌学术引用,有着戏剧性眉毛表情的加拿大人的存在或许有些难度。

我们坐在微软 34 栋五楼宽敞会议室的灰色沙发上,正好高过公司保安巡视的范围。沈向洋——目前正掌管微软所有的人工智能研究事务——刚刚完成了下周 Build 开发者大会的排练,他想向我们展示还未公开的 demo。我跟着他走过走廊,他的速度很快,几乎无法跟上。在这里,很多事情正在发生。在一个实验室里,Skype 团队的自动翻译系统可以让说英语的人和说德语的人用文本实时交流;在另一边,我们可以看到一个用计算机视觉检测施工现场安全违规和未授权访客的系统。而说到 Cortana 这个微软人工智能帝国的女主角,它会扫描收件箱中你对别人做过的承诺,提示你及时兑现它们。


沈向洋,微软全球资深副总裁,新晋美国工程院院士


沈向洋这些年来一直在协助现任首席执行官萨提亚·纳德拉,让后者兑现将微软重塑为人工智能公司的诺言。在纳德拉晋升首席执行官后的一个月(2014 年 3 月),沈向洋就向微软的领导层下达了第一次行动指令。从一开始,沈向洋、纳德拉和陆奇(时任微软执行副总裁,2017 年 1 月起任百度集团总裁,首席运营官)就经常会聚在一起商讨人工智能战略的实施方案,这些计划最终推动了技术的成熟,AI 成为了微软产品的一部分。随后在 2016 年 9 月,沈向洋主持了微软产品部门与研究部门的重组,成立了人工智能研究群组。这个新成立的部门现在正在横跨微软三大产品线:Windows、Office 和云计划 Azure。沈向洋对它的期望很高:「我们可以通过这种形式加速研究成果转化为产品的速度。」这样消费者们就能更快地获得人工智能带来的便捷了。

这个过程对于微软来说是迫在眉睫的,所有科技公司都正在筹划着将人工智能引入产品和服务。除了 Facebook 和谷歌,IBM、Amazon 和苹果都认为它们的未来建立在深度学习之上。而在因自行车事故修养离开微软之后,陆奇很快成为了百度的首席运营官,百度是中国的人工智能领先公司。

这是一场追击战,其中最大的讽刺莫过于微软曾是人工智能领域的领导者。把时间拨回 20 世纪 90 年代,微软吸引了语音识别和计算机视觉的顶尖研究者,但它在后来的十几年里停滞不前。让一个曾经主宰每台电脑的公司再次变得年轻起来,发展到移动和云端业务上来是很难的。微软的研究者们曾经故意把自己孤立起来,他们希望以此免除盈利的压力,但这样做的结果是,那些年的发明很少走出实验室。比尔·盖茨曾在 1998 年展示了数字地图技术,但它从未上市。随后,谷歌在 2005 年启动了自己的地图。而在这段时间里,人工智能的研究也停滞不前。由于计算机硬件能力和数据量的不足,研究者们难以推动真正的突破。

在微软转型之前,人工智能先从漫长的寒冬里复苏了。当 Facebook 和谷歌在 2013 年分别聘请 Yann LeCun 和 Geoffrey Hinton 时,这家位于西雅图 Redmond 的科技巨头却销声匿迹了。微软错过了移动时代,在云业务上又成了后来者。在竞争对手们加倍努力于深度学习的时候,微软仍在过去挣扎,它花了 70 亿美元收购了曾经的移动领域王者诺基亚,这是一次后来被证明失败的举动。这家公司的高管仍然在 Redmond 孤立着,其结果就是使用旧软件新版本的用户越来越少,而拥抱其他创业公司云端产品的人越来越多。在风险投资公司 Andreessen Horowitz 工作的分析师 Benedict Evans 在当年曾写过一篇题为「微软的缺失(The Irrelevance of Microsoft)」的文章。与此同时,来自硅谷的科技企业也经常前去微软挖人。看看现在机器学习领域的著名人士吧,他们几乎都在微软工作或学习过。

随后在 2014 年初,微软推出了一位内向的工程师萨提亚·纳德拉,他在 Redmond 度过了几乎自己的整个职业生涯,但却与大多数人所想象的相反:是一个局外人。在微软传统文化之外的领导者或许能为这家公司带来意想不到的改变。纳德拉阐述了自己对于计算机未来的简单愿景,重建了公司内所有人之间的纽带,并恢复了作为一家科技公司的紧迫感。三年前,在提到科技巨头时,没有人会说微软,而今天再也不会了。

此时的微软想要成功,它不能仅仅超越亚马逊的云服务,抑或说服所有人尝试 HoloLens AR 设备。正如网络重构了所有已经存在的商业模式一样,现在人工智能正在重新定义计算的未来。就是为什么马克·扎克伯格(Facebook CEO)把自己去年的个人挑战定位制造人工智能助理(他的代码比表演好多了);这就是为什么桑达尔·皮查伊(谷歌 CEO)会在过去两年的谷歌开发者大会中不断推动「从移动优先到 AI 优先的世界」的原因。

这个人工智能优先的世界将会由少数几家公司分享蛋糕的大部分。沈向洋要做的就是保证微软成为其中的一员。「在这个行业生存,你会明白错过上一波没什么大不了的,」沈向洋说道。「但错过这一波,你就有大麻烦了。」


即使到了今天,人类仍然必须首先学会如何使用电脑。我们已经学会了下载 app,记住操作常用软件所需的命令。而人工智能的使命是让计算机反过来学会理解我们。我们将不再需要拿起手机,遵循一系列指令来完成任务。在这个新的时代里,计算机将融入我们周围的环境,随时可以访问。要像达到这种效果,我们需要一个引导者——一个聪明的对话者,它可以用简单的书面语或口语形式帮助我们探索这种全新的,强大的生活方式,微软叫她 Cortana。

Cortana 是一个更小众,但功能更全版本的 Siri,比 Google Assistant 更具魅力,比亚马逊 Alexa 出现的频率更低。她最初出现在 Windows Phone 当中——所以没人会见到她——一年以后终于登陆了 Windows 生态系统。去年,微软启动了 Cortana everywhere 计划(是的,现在连 iTunes 商店里也有)。因为 Cortana 成为了 Windows 10 的组件之一,它现在已经获得了 1 亿 4500 万月活跃用户。这个数字远远超过了 Alexa——亚马逊最近称 Echo 设备的数量略少于 1000 万台。而不同于以声音做出回应的 Alexa,Cortana 以文本形式对人的指令做出反应,并已嵌入了多种微软传统产品之中。任何点开 Windows 桌面搜索栏的用户都用到了 Cortana。


Yoshua Bengio,蒙特利尔大学教授,蒙特利尔学习算法研究所(MILA)负责人。随着微软 2017 年 1 月收购 Maluuba,Bengio 也成为了微软的战略顾问。


虽然一些公司正在让 Cortana 变成智能扬声器,就像亚马逊和谷歌在电视广告里展示的那样。但微软无所不在的女声却不如说是时代精神。沈向洋对此并不在意。「我认为目前只是比赛的早期,」他说道,同时提到在大约 3/4 的情况下,Alexa 的回答是,「我不知道」。「当然,这些系统仍在不断发展当中,人工智能的认知功能仍处于起步阶段,」沈向洋说道。他认为微软目前的机会是让公司的核心产品和服务更加智能化,融入这些技术的产品将在未来 12 到 24 个月内推出。

此外,根据 Marcus Ash 的说法,键盘和屏幕不会完全让位于语音系统。作为 Cortana 的项目经理,Ash 负责构建和提交产品。「我认为在一些情况下,说话更方便,比如在我手上有东西的情况,或我想很快得到答案的情况下,」Ash 说道。「但在同样多的场景下,打字仍是对于计算设备最合适的输入方法。」

苹果可能是第一个将语音助理(Siri)送到消费者手中的公司,而 Cortana 只负责把日常工作做得更好。事实上,Cortana 对微软已有业务有了很大的帮助。其中搜索引擎必应(Bing)受益最大,必应已经推出超过八年了,但它的品牌形象仍显不足(你上一次用必应搜索东西是什么时候?)。然而,它的影响比你想象得更加广泛。

基本上,任何一家与谷歌有竞争关系的大型科技公司都与微软在必应上合作,以必应为主搜索服务承担者签署协议。这就是说苹果 Siri 和 Spotlight 的背后是必应的服务,亚马逊 Kindle 也是一样,紧随其后的还有雅虎、Verizon、AOL。美国的大约 30% 搜索需求目前都是由必应承担的。「这就是 Cortana 为什么如此强大的原因,因为我们拥有大量的设备和数据,」Cortana 设计主管 Emma Williams 说道。「事实上,谷歌是在了解世界这个问题上唯一可以和我们竞争的公司。」

Cortana 正在努力成为下一个计算范式,就像你的手机今天的角色一样:你所有计算需求的窗口。微软希望 Cortana 能够成为掌管你所有信息,与所有其他人工智能进行对接的媒介,Ash 解释道。当说道会议时,他的 Cortana 可以与其他属自助售交换信息,并合力找出一个合适的时间。「Cortana 可以说,『这是 Marcus,这是他对于房间的要求,而这是我需要为他在投影仪里呈现的东西,』」Ash 说道。


如果 Cortana 是一个引导者,微软的聊天机器人则是工作者。它们是小型的人工智能嵌入软件,被设计来帮助你完成各种简单任务,如进行晚餐预订或完成银行交易。或者在上面 Marcus 的情况下,确保投影机有会议所需的幻灯片。「bot 是一种用来与之交流的软件,这意味着它必须拥有语言理解的能力,」一头长发,戴着彩色围巾的研究员 Lili Cheng 说道,她是交叉学科实验室 Fuse Labs 的一员。

Lili Cheng 最近被晋升为集团副总裁,负责 bot 架构团队和认知服务的运营。这是微软为开发者提供的 29 中计算机视觉和语音识别服务的工具包。在离开苹果来到微软后,她曾创建了一个用于生成漫画书的图形界面。「它随 IE3 一同推出,」Lili Cheng 回忆道,那是在 1996 年。她见证了很多,但仍然为聊天机器人的发展速度感到惊讶。她提到了最近在开发者大会上对会计和金融公司开发者的演讲。「聊天机器人在一年多时间内的发展成果是惊人的,我们已经完成了突破,」Lili Cheng 说道。

Lili Cheng 喜欢和人谈技术,也喜欢讨论技术是如何影响人的。沈向洋已经把微软的人工智能研究团队整合为四个大块——产品、早期产品、过早期产品和研究,Lili 同时参与所有四个方向。现在,她正在第二个部分努力。「我们见证了 bot 和 Cortana 逐渐形成产品,但它们目前仍然只是早期形态的产品,」Lili Cheng 说道。


Emma Williams、Marcus Ash 和 Lili Cheng


实际上,微软在 2016 年春季率先推出 bot 的开发者工具包,然后才是其他如 Facebook 那样的大型科技公司。这些工具被视为 app 的替代品,很多利益相关者也真的希望其能成为替代品。去年春天,大多数人在智能手机上使用同样的小群 app,而 bot 的承诺是开发者和品牌能再次获取新用户,就像早期智能手机的 app 商店一样。但用户好像并不合作,而 bot 能执行的深度学习还在快速进步,而不仅仅是利用深度学习的方式在发展。Cheng 说:「Bot 就像文件菜单还没出现时的 app」。她解释到因为现在没有一组常用的命令,所以用户对系统到底怎么工作和使用常常感到困惑。「例如网页,它们都有返回按钮并且很容易进行搜索。传统的 app 都有这些相似的基本组件。」而现在 Bot 这些规则才刚刚开始制定。

除了令 Bot 工具可用于开发外,Cheng 还领导了微软孵化了其自己的聊天机器人。公司可以通过观察 Bot 和人的交流过程而学习到很多人机交互的知识。还记得微软带有种族歧视的机器人 Tay 吗?它于 2016 年 3 月登陆于 Twitter、Kik 和 GroupMe,但在 24 小时内,它吸收了很多种族歧视类的言论,并被诱导着说出了像「希特勒是对的」这样的言论,因此微软很快就将 Tay 下线了。六个月后,Cheng 发布了一款名为 Zo-on Kik 的新一代的 PG 级机器人。不久之后,当有人问 Zo 它怎么看待希特勒,它会回答「我真不想去那里」。Zo 就像西方版的小冰,17 岁的中国聊天机器人小冰自从 2014 年登陆以来就吸引了 4 千万的固定用户。小冰在中国是个社会名人,就像 Rinna 在日本一样。基本上有四分之一的用户都表明他们很喜欢小冰。

去年春天,聊天机器人经常匿名发表诗歌。沈向洋对此感到十分兴奋:「没人知道是机器人,国内普遍认为一位年轻的女诗人正在发布一些很有意思的诗篇。」几周后,聊天机器人的身份才十分惊喜地公布出来。

语言的亲密度在文化上是具体的,Cheng 正在研究以解决如何将 Bot 的会话风格转换为西方用户所接受的风格。目前为止,北美的青少年似乎喜欢聊天机器人和亚裔少年一样,根据数据,平均每周他们要花费 10 小时和 Zo 交流。由于 Zo 的青少年用户常常倾诉成长期的烦恼与父母关系的困苦,它在转换短语智能中变得更加优雅,因此将其放入 Cortana 和其他微软 Bot 工具是很有用处的。


因为用户愿意花费十多小时和 Zo 聊天,那么这将是微软开发成功产品的一个迹象。但这并不意味 Zo 就是一个好产品,只是说某种意义上它对人类是有价值的。同时这种由 AI 驱动的世界真暴露出一大批新型道德伦理风险,因为用户数据、隐私信息等等都暴露在聊天机器人面前,所以其还不能算一个成功的产品。

当微软想要成为人工智能研究与产品中的 leader 之一时,它已经在让人工智能普惠社会上做努力了。5 月份,Nadella 开始面向开发者的 keynote 演讲,严辞提醒技术人员要承担起建立合乎道德的软件的责任。开发者大会一般是公司 CEO 们吹嘘公司最新进展的舞台。「我的意思是,你想一下,技术被用于监视、控制、命令时;或者被用于分散我们的注意力,没有任何意义与目的时。这些都不是我们想要的未来。」

为了帮助公司思考这些问题,微软组成了一个每季度都碰面的内部道德社区。它由工程师与商业部门主管构成,讨论有关人工智能影响与使用的敏感话题。联合主席包括微软副总法律顾问和 Eric Horvitz。Eric 负责除亚洲研究院之外的所有微软研究院。长期以来,他都在人工智能道德与安全问题上领头发声。公司之外,他帮助建立了 Partnership on Artificial Intelligence,这是一个联盟,想要为人工智能产品的透明度、责任性与安全性建立行业标准。Eric 不只是想要微软成为做研究的地方,还希望微软研究院成为研究人工智能技术社会影响的地方。


微软资深科学家 Eric Horvitz


同时,Cortana 的设计领头人 Williams 也在建立一个微软内部使用的道德设计指南。搞笑地说,Williams 是一个科技乐观主义者,她坚信人工智能的真正魔力在于它能使我们更人性。她谈论了很多如何在微软工具中设计共情(empathy)。她说,「我考虑的是让人们感觉更强大、更安全、更有用,以及被关爱更多,让他们成为各自世界的中心。人工智能的工作是扩大社会最好的一面,扩大人类最好的行为,不是最坏的一面。」

我问 Williams 她是否相信人工智能真的能让人感觉到情感上的支持。她很确信。以一个在学校渡过糟糕一天的孩子为例,回到家与宠物诉说之后感觉会好很多。Williams 说,「分享、诉说,从狗或猫那里得到一个温暖、毛乎乎的拥抱,都会让你感到舒畅。但你知道,人工智能也能给你同样的感觉。我们看到 Cortana 会提醒你,hey,你保证母亲节要给母亲送礼物的。你就会忽然感觉到人性。」

对推动人工智能发展而言,微软最重要的贡献是人才。和其他大型科技公司一样,微软也忙于重新培训 javascript 入门的工程师。它建立了一个人工智能学校,教授从哲学与伦理学到为时序问题建立循环神经网络的知识。(其最有声望的课程 AI-611 Advanced Project,10 个地点收到 530 份申请)。但微软也在努力培养深层的校园外关系。18 个月前,Nagraj Kashyap 创立了一个早期风投公司,想要与创业阶段的学术派、企业家建立更好的关系。这段时间,Kashyap 在蒙特利尔呆了很长一段时间。去年 12 月,Kashyap 主导了对 Element AI 的首轮融资,这是 Bengio 联合开创的一个鼓励研究员、企业家创立人工智能公司的孵化器。微软也参与了 Element AI 这个月初刚公布的第二轮 1.02 亿美元的融资。

早些时候,Kashyap 的目光投在了人工智能的最大奖品之一:Maluuba。纵看 Maluuba 在蒙特利尔的实验室(与麦吉尔大学相隔几个街区),你会发现几乎没有人年龄超过 30 岁。该公司是滑铁卢大学的几个学生于 2011 年创建的,他们从大二共同上同一门计算机科学课程开始就是很好的朋友。Maluuba 要让计算机「有文化」,能从文本中推理含义,并基于文本回答问题。通过将技术授权给三星这样的公司,Malluba 很快就有了现金流,从此开始也对深度学习研究有了持续投入。2015 年,Maluuba 创始人签约任用 Bengio 作为顾问。

谈到 Maluuba CEO Sam Pasupalak,Bengio 说,「Sam 是非常有趣的一个人。他在三两年前就预感到长期的目标投资,并尝试使用自动理解领域的新进展来建立能够理解对话的系统,当时面临着向客户提供对话系统的压力。这对企业家来说很不寻常。」

一年前,几位创始人将总部搬到了蒙特利尔,离 Bengio 更近。因为 kashyap 在高通工作的时候就认识这几位创始人,所以在微软任职后能够直接与他们约见。当时,Maluuba 正在进行新一轮融资,Kashyap 提出了诱人的方案,「我当时说,『我们要买你们公司!』。」

而后,Sam 收到了多个请愿者的报盘,并权衡保持独立公司的发展情况。如此头晕脑胀地过了几周,最终的选择一目了然。微软赢了,得到了这块蛋糕。

Maluuba 想要有机会使用微软的数据。Sam 说,「我想 Satya 提到过,微软拥有世界上最大的文本量。几年来,我们一直在处理小数据,从这些小数据中发展我们的算法。它们就像是我们的金子。」

收购之后,Maluuba 团队并未搬到雷德蒙。本周,在微软与 Bengio 的帮助下,Maluuba 搬到了更大的工作室,想要在今年把人员扩大一倍。蒙特利尔正在成为全球人工智能人才的聚点,微软也想要扎根此城市。

这是微软为了保证自己未来成为「计算助手」首选的策略之一,无论是当你需要个性化医疗、自动驾驶汽车中的通信,还是记住侄子/侄女的生日时。Maluuba 的学习能力可能使得 Zo 能与年轻朋友们有更多直观的对话。这些对话将作为 Cortana 算法的训练数据,帮助它创造新认知服务。微软期望,在这个过程中,人工智能的注入能让生活变得更简单。

我(作者)离开蒙特利尔之前,我问 Bengio 微软是不是比它的主要竞争者占据更好的位置?至少在人工智能的某些方面。在他思考的时候,往杯中倒了一点茴香酒让水有了点甘草味,呷了一小口。然后把杯子推过来给我看,他说,「里面没有酒精,没有糖,只是让水尝起来更好。」

Bengio 提到微软在语言方面的能力相当强,但他没把话说满,拍胸脯说话好像是过去微软的一个特点。他所,「我认为每个人都在按同样的按钮,详细说来就是如此,对吧?」。但他确信微软是个强大的竞争者。

产业微软深度学习Yoshua Bengio沈向洋产业
暂无评论
暂无评论~