深度探访Facebook人工智能实验室

Facebook 因为其企业文化中的各种各样的口号而知名,这些口号经常出现在这家公司的办公室的标牌或者被 CEO 马克·扎克伯格和其他管理人员挂在嘴边:「代码胜于雄辩」,「快速行动,打破成规」或者「比完美更重要的是完成」。


这家公司的纽约办公室墙上的标牌,完美地总结了 Yann LeCun 领导的  Facebook 在人工智能和机器学习领域的哲学:「保持开放」。人工智能已经成为快速扩张的 Facebook 的关键部分。这些技术已经被用于识别照片中你朋友的脸庞,并帮你智能推荐新闻推送。上周,Facebook 推出了用于阅读文本的人工智能引擎 DeepText,它可以利用「接近人类的准确度」,在短短一秒之内理解超过二十多种语言的数千封邮件的内容。之后,这些文本将被自动翻译成数十种不同语言。Facebook 正致力于识别你的语音,以及识别视频中的人物,这样你就可以快进到你的朋友出现的片段。


Facebook 希望能够主导人工智能和机器学习领域,就像它引领社交网络和即时通讯领域那样。该公司已经雇用了超过 150 位人工智能领域的人才,并宣布对这一领域的投资将提高三倍——尽管他们并没有说明具体的投资金额是多少。


如果说过去的计算时代是移动纪元,那么下一个时代将是人工智能纪元, 英伟达首席执行官 Jen-Hsun Huang 认为。「人工智能是计算机领域最近二十年来最重要的进展,Facebook 和其他公司都不得不参与这场竞赛以确保其在人工智能领域的核心竞争力。」


然而,Facebook 正式进入人工智能领域不到三年,它现在需要的不仅仅是资金,因为人工智能已经是是现在最热门的技术领域之一。「他们是后来者,」华盛顿大学计算机科学专业的教授、「The Master Algorithm」一书的作者  Pedro Domingos 说。「谷歌和微软这样的公司已经遥遥领先,它们在扎克伯格宣布开发智能管家计划的很久之前,就已经开发出了自己的人工智能软件。」


微软从 1991 年以来就已经致力于研究机器学习,并雇用了人工智能领域的数十个分支的数百位科学家和工程师;谷歌深度学习成果的核心,Google Assitant,正在成为谷歌大多数应用和服务的前端大脑。中国搜索巨头百度在 2014 年聘请了谷歌深度学习项目的负责人吴恩达。非营利组织 OpenAI 则得到了特斯拉创始人埃隆·马斯克及其他科技巨擘的十亿美元投资。亚马逊首席执行官杰夫·贝索斯在 Code 大会的演讲中透露他的公司四年来一直在幕后进行人工智能研究,并且已经投入了数千人研究他们的语音识别生态系统。苹果和 Uber 也各自在人工智能领域投入巨资,参与到吸引人工智能人才的竞争中。


Facebook 做出的这些改变都发生在人工智能这一创新浪潮来临之后,其中有一些来源于 LeCun 本人,在加入 Facebook 之前,LeCun 被认为是该领域最富成就的科学家之一。在那之后 Facebook 从没有正式的人工智能研究实验室快速发展到拥有两所成熟的实验室。Facebook 的人工智能研究项目(FAIR)由 LeCun 领导,专注于基础科学和长期研究。其次是应用机器学习部门(AML),由西班牙裔的 Joaquin Candela 领导,Candela 是一个资深的机器学习专家,除此以外,他还创建了剑桥大学的一项顶尖课程。他的团队目前的研究方向是将人工智能应用于已有的 Facebook 产品。


这两个部门是各自独立的,LeCun 和 Candela 都向 Facebook 的首席技术官 Mike Schroepfer 汇报工作。最大的挑战在于找到如何让两个部门通力协作的方法,并利用长期的科学研究成果来帮助公司完成短期的商业目标。一个简单直接的方法是:让两个团队坐在一起交谈。「两个团队的人必须有私人关系」LeCun说,「他们必须合作无间」。


在Facebook,他们不仅坐在一起,而且还离公司高层很近——与扎克伯格和 Schroepher 的办公室只有咫尺之遥,事实上,这正是人工智能和机器学习对这家公司变得至关重要的标志之一。


但是仅仅因为你和某人在一起工作并不能帮助对深度科学的投资任务更早实现。要理解 LeCun 和 Candela 如何规划这些工作,你首先要了解他们来自何处。


Facebook 的人工智能研究实验室


Yann LeCun 位于纽约大学计算机科学系的办公室前门上贴着一个巨大的 Facebook 点赞图标。但这并不是 LeCun 自己放上去的。LeCun 穿着在印有单词「THINK」以及爱因斯坦小幅照片的海军蓝色polo衫,他笑着解释说他在两年半之前宣布加入 Facebook的时候,有人把图标放在了这里,他没有取下。


LeCun 今年 55 岁,仍是是纽约大学计算机科学系的兼职教授,那里离 Facebook 的纽约办公室只有数步之遥。你很难在人群中辩认出这个在世界上最大的社交网络公司为他们宏大的人工智能愿景冲锋陷阵的科学家,另外他还是所谓「第一次坐特斯拉电动车是和伊隆·马斯克一起」的那种人。


如果你曾经用过 ATM 存款,那么你就有可能见过 LeCun 的研究成果。作为深度学习一个分支—— 卷积神经网络(convolutional neural nets)的发明人之一,LeCun 是人工智能世界的明星。因为卷积神经网络现在被视为开发可拓展自动自然语言理解和图像识别工具,甚至是语音识别和视觉搜索系统的基本构件。而所有的这些对Facebook,谷歌,百度,微软以及其他科技巨头具有非凡的价值。LeCun 在人工智能领域的工作专注于构建旨在复制生物视觉皮层工作模式的模型。


LeCun 被给予了很大程度的自由来按照他认可的方式创建 FAIR,扎克伯格和  Schroepfer 授予LeCun 这样的自由是合理的:他在贝尔实验室工作了十四年,知道怎样可行而怎样不可行,而且他一直在思考如果有机会他将如何建立一个全新的研究实验室。


他深信成功的关键在于对开放性的坚持。LeCun 的企业和学术的两种生涯在践行着一种哲学,这种哲学要求研究者公开发布他们的研究成果,在公开会议的演讲中,在和学术界的广泛互动中,以及将代码发布到类似 GitHub 这样的开源资料库。


「我见过很多朋友加入大型科技公司,他们原来在具有开放性文化的研究实验室工作,进入企业后试图改变公司的文化,但都以失败告终。」LeCun 说。加入 Facebook 之前,他提的第一个问题是关于这家公司对于开源世界的承诺和文化开放性的。


他也想弄清楚如何在做研究和将研究转化为产品之间找到平衡点。他觉得很多科技公司即使在目标明确的情况下,都不知道如何解决这个问题。也许最为人所熟知的例子就是硅谷传奇 Xerox PARC 公司在图形用户界面所获得的成果在斯蒂夫·乔布斯著名的 1979 年访问之后,被苹果应用于 Lisa 电脑,以及随后的 Macintosh 电脑。


LeCun 曾经见证过的一个失败的模式被称作「聚合研究」,这种情形下,科学家被工程师团队包围。这种情况会阻碍科学家的创新性。另一种情况是把研究者隐藏在和公司其他成员都甚少交流的象牙塔中。这对公司的声望大有好处,但少有实效。


扎克伯格对于 Facebook 的宏伟蓝图


扎克伯格正从人工智能、虚拟现实和无人机这些角度全方位展望 Facebook 的未来十年,而 Facebook 也正开足马力前进。


在 LeCun 的指导下,FAIR 项目于 2013 年 12 月成立,重点关注人工智能和机器学习方向的一些长期问题。Facebook 明白,为了通过团队的工作来实现短期和长期的利益,他们必须要拥有一些能够在这个领域内开发出能够持续很多年影响的新技术,而其他人只是在关注现有的产品。LeCun 估计,大概有 70% 的团队工作是在进行研究,而剩下 30% 是为了近期的发展。


「对外部来说我们更加专注,」LeCun 解释道,「所以我们公布了很多我们在做的事情,分发大量的开源代码。所以我们真的是这个研究团队的一部分,因为我们真的想要挑战极限、推动技术的反战和科学的前进。同时我们也要确保拥有最好的最先进的技术,并且朝着这个方向不断努力。」


整个团队的目标野心勃勃:将一些基本常识教授给机器——本质上就是能让它们像婴儿或者动物一样去学习。LeCun 说,FAIR 目前最大的一个项目,就是对话系统的自然语言理解,它也将成为 Facebook 智能语音助手的基础。 

   

image-5.jpg

Antoine Bordes、Yann LeCun、Laurens van der Maaten、Leon Bottou、Y-Lan Boureau、Soumith Chintala


很明显的是,各大科技巨头都希望成为语音助手方面的领跑者。最著名的例子便是苹果的 Siri。但是微软也有 Cortana,亚马逊有 Alexa,到时候还有来自之前在 SRL 国际的开发 Siri 的苹果团队开发的 Viv。


对于智能语音助手,Facebook 有着自己的计划和长足的努力。而人工智能是其中的核心,LeCun 说道,因为一个系统为了成功的回答用户提出的任何问题,它必须具备常识。


「这也就意味着,我们应让机器学会如何观察整个世界,」他说,「而不是浅显地训练它们去识别汽车,手机等等物品。」


今天,给机器提供常识的技术还不存在。LeCun 相信,解决方案并不是通过攻击它来解决问题。相反,你必须找出一种方式去让机器理解文本,这也就意味着,给机器教授关于这个世界足够的背景知识,它们就可以去理解了。    


「如果我说,『奖杯并不适合这个手提箱,因为它太小了』,你知道这里的它是指代手提箱而不是奖杯,因为你知道这就是在讲述把一个东西装进另一个东西的事情。」


一台机器是不会理解这些的,达到这一水平的理解程度是 FAIR 的一个长期目标。


实现复杂的常识和文本理解能力不仅会影响语音助手,而且会影响自动语言翻译这个 Facebook 认为在国际用户增长上一个很关键的功能。    


「翻译是一件非常重要的事情,」LeCun 说,「Facebook的最重要使命便是连接人群,所以第一件事情就是要确保通过翻译能够让人和人之间成功沟通。」


但首先,他需要确保他的团队在 FAIR 上所做的工作是被成功翻译并能够和坐在很远的地方成功沟通。


应用机器学习实验室


坐在 Facebook 由弗兰克·盖里(Frank Gehry,美国知名后现代主义及解构主义建筑师)设计的总部,公司的应用机器学习部门负责人 Joaquin Candela,在充斥着巨型填充玩具动物的箱子中间显得格外矮小。这位 39 岁的戴眼镜的负责人并未因没有空闲的会议室而苦恼:他毫不犹豫地选择了一对长沙发来进行这场对话。


当 AML 还在孵化的时候,LeCun 就已经在 Facebook 了,也正是他推动了这个项目的创立。「因为我认为这是最基本的通道,那些在 FAIR 平台上开发的技术将通过它来实现产品化。」


AML 的目标是「推进技术转移最大化的工艺水平」以及成为「科学、研究以及技术转移之间的纽带」。AML 正试图为提供排名、广告、搜索、语言翻译、语音识别、自动产生视频字幕以及自然语言理解等所有领域开发更好的算法以提升 Facebook 的底线。


当 Candela 被要求启动 AML 项目时,作为一个曾领导着建立了机器学习框架的 Facebook 工程项目经理,他想要避免其他应用研究实验室曾经犯过的错误。作为一个曾在 Microsoft 以及德国著名的 Max Plank Institute 效力过五年的老兵,Candela 说:「我见过的许多科学到工程的转化,都是差强人意的。」


究其原因,是来源于实验室与实际工程过于脱节,或是沉溺于忽视了创造实际产品的研究文化中。


相对于 LeCun 的团队花费 70% 的时间在研究上,Candela 的团队正好相反,他们的大部分时间用于研究可部署的产品上。Candela 说,他们的团队是以季度或月来考量项目进度的,而非像 LeCun 的团队那样,以五到十年的时间跨度来部署工作。他们通常在六个月的整块时间内做规划——尽管事实上,大部分时间被团队用来思考「从现在起的两年后我们该到达什么程度。」


尽管在项目和做法上有所差异,但 Candela 和 LeCun 都赞成,对开放性的献身精神会引领他们走向更大的成功。CTO Schoepfer 也同意这一观点,并对实践这一公司哲学的方法进行了量化。除了开源硬件和数据中心,Facebook 的工程师已经发布了一千万行以上的开源代码,而且已有 350 个 GitHub 的活跃项目正在生产。这种开放性已经成为招募到顶尖人才的本质要求。「顶尖科学家们都得想去哪里工作?」Candela 问道。「他们希望能够与想法相近的人一起工作。那么他们是如何知道我们拥有和他们想法相近的员工的呢?因为你可以看到我们的人正在做些什么,你可以看到他们正在发布什么,你可以明白他们正在试图解决的问题、以及他们是如何解决这些问题的。」


计算摄影学是 AML 最新成立的团队之一,它是在去年十月由 Rick Szeliski 和其他几位从 Microsoft Research 跳槽过来的同事们组成的。这支队伍将聚焦于类似稳定视频这样的项目,包括三百六十度视频、帮助人们更好的自拍、以及在手机上管理视觉内容。


「我们来到 Facebook 是因为照片在这,数据在这」,曾领导过 Microsoft Research 的交互视觉媒体团队的 Szeliski 说到。「这里像一个充斥着各种事物的庞大仓库,可以让我们进行分析研究。我们可以每天接触像素、取悦用户,使他们更加愉悦并拍摄更多的照片、分享更多的事物。所以这不仅是因为照片在这,更是因为照片在这流动、交汇、传递、分享。」


「流程(Flow)」是一个在 Facebook 经常听到的词。部分原因可能是源于 FBLearnerFlow,一个由 AML 创造的端到端的工程流水线——某种意义上它是一个测试和分享机器学习的杀手级应用程序(killer app),尽管就目前看来它仍然只被内部使用。它是一个知识库,Facebook 里的任何专注于 AI 或机器学习的人都可以在里面发布自己的成果,以便其他工程师在她们的项目中使用。


「试想我们有一个新的垂直广告业务,专门在即时文章中投放富媒体广告,而那个团队并没有很多机器学习方面的专家」,亲切友好的 Candela 用他浓重的西班牙口音对我说道。「所以『那些』工程师可以去『Flow』里浏览整个公司里每一个实验和产品原型,他们可以从中抓取一些模块‘并为他们自己的目的使用这些模块。我总是鼓励大家去恳求、去借、去偷。你并不需要重新发明已经存在的东西。」


Flow 也是一个在可控环境中测试新特性的平台。「这才是最美妙的地方」,Candela 说道。「这是一个将你从研究一路带入实际试验的地方。如果我们正在做一个有 1% 的人参与的试验,并且结果看起来不错,那么,我们就会将它投放到 100% 的人群中去。」


如此广泛的用途也正是为什么流程(Flow)已经被四分之一的 Facebook 工程师使用的原因,而不仅仅是那些人工智能的工程师。


Flow 也是 Facebook 在内部践行开放性的完美代表——不是将研究结果藏起来,而是让所有人都能看见。


Facebook 的长短期双重研究机制,已经在人工智能和机器学习社区赢得了不少口碑,但这仍不足以保证它能成功实现Zukerberg、Schroepfer 以及公司大力宣扬的十年愿景。


有许多问题会导致它的失败,隐私问题是其中最明显的一个。当 Facebook 的用户们意识到这家公司正以何种程度分析他们发布的每一条消息、每一张照片,并深入挖掘他们的生活时,他们或许会开始撤回消息。


同样地,还存在一个财务问题:Facebook 的最高管理层和董事要在什么时间点,看到他们在人工智能方面投入的回报呢?Schroepfer 坚称,Facebook 的管理层并不担心 FAIR 或 AML 的投资回报率。「我认为根据这两支团队已经完成的工作,他们已经为未来五到十年内的回报打下基础了」他说道。「我们不会太过担心投资回报率(ROI),因为或许一两个项目就可以满足需求。」


Facebook 如何利用人工智能帮助盲人「看到」照片


新的人工智能技术可以解释照片内容,比以前提供更多的语境(context)。不过,仍有很长的路要走。


但是,考虑到领导人物——LeCun, Candela, Schroepfer 以及其他人——如此强调开放的关键本质,如果情况发生变化,他们放弃了这一开放哲学,会出现什么情况?


「如果他们放弃了这一哲学,就像以往许多公司做的那样,或许会失去研究领域的前沿位置。」 Yoshua Bengio 说,「当公司处在某点,比如情况不太乐观时,自然会出现一种趋势,迫使研究人员追逐短期利益,这会伤害到实验室利益也会损及公司自己的远大前程。」


Benjio 补充说,难点在于任命意志力强的人,比如 LeCun,充当研究人员和产品部门人员之间的缓冲器,确保研究不屈从于追逐短期利益的压力。但是,「未来仍然面临挑战(对 Facebook 来说),因为总会有追求短期利益的压力。」


即使 LeCun 也承认,情况会在毫无预警的情况下发生转变。


「还没人强迫我们证明自己存在的价值,」 LeCun 说,「但是,几经产业研究实验室的兴衰,我确实知道,除非你能说出个道道来才能长久维持下去,比如这是我们正在为公司所做的事,这是为什么我们会花那笔钱。」正是出于这些原因,LeCun和Candela 才会如此小心翼翼地,以最大化成功可能性的方式经营他们的实验室。


Schroepfer 说,「你越清楚一个组织是做什么的,做的事情越少,那么,这个组织做起事情来,效果就越好。所以,如果你让它做十件事情,这个组织可能只能做好三件,搞砸其他七件。所以,最好希望他们选对要做的三件事。反过来,如果说这个组织只做一件事,你就可以看清楚他们是怎么做事的。我们有两个基本不同的问题要解决:面向未来的研究和找到将之应用到现在产品的方法。」


那意味着要创造有效的方式可以在全组织内分享 idea。「我们梦想的情景,我们正在为之努力的情景」Candela 说,「就是建立起这样的流通机制,(AML)的成员会加入FAIR,」反之亦然。


这已经在上演了。Candela 说, 公司面部识别小组创立于 FAIR,然后搬到了 AML,因为他们的工作和产品越来越相关。计算机视觉小组也是这样,不过,他们的头儿 Manohar Paluri 仍然「脚踏」两边。


另一方面,Candela 讲了一位和 AML 机器翻译团队一起工作的研究人员的例子。他「对用神经网络做研究,然后将研究运用到机器翻译方面,很有激情。因此,他关注的是推动最先进的科学研究,然后他去了FAIR」


LeCun 说,许多由一个小组搭建的基础框架流向了另一个小组。比如,DeepText  就是 AML 直接完成的,但是研究工作源于 FAIR,当时他们想要搞清楚如何使用卷积网络以及其他深度学习技术,给文本分类和理解文本。当他们确实取得这类进展时,Facebook 对将成果束之高阁毫无兴趣。比如,公司的开源代码博客的一篇博文就详细解释了 DeepText,这就是证据。


Facebook 人工智能黑客马拉松的秘密


Facebook 第 50 届黑客马拉松关注的领域有四个,不过,在扎克伯格的影响下,人工智能成为焦点。


「两边的好处,你都占了。」Paluri 说。「你确实是在学术界发表成果,参加会议,积极为科学做出贡献。同时,你还见证着你从事的各种工程和科学工作正影响着数十亿人。」


有些人可能会担心,如此开放会存在商业风险,但是,LeCun 对这样的想法嗤之以鼻。让外面的人用他们的代码工作,Facebook 可以从中收益,因为如果他们做的好话,公司可以雇佣这些人。或者简单采用他们的改进成果就可以了。


「其他人使用我们的技术,这没什么,因为技术价值几乎不可能从自身得到说明。」LeCun 说。「正是在利用技术的过程中,基于我们的市场定位,我们才能发现它的价值。我们拥有庞大的社交网络商业帝国。因此,如果我们发明了一种能够应用到这方面的技术,那么,我们就会成为最快利用这一技术的人。」


另一方面,他补充说,「如果我们没在其他人之前利用它,那就是我们自己的错。」


产业
暂无评论
暂无评论~
返回顶部