可以说,这几所大学有着最赞的计算机科学课程:卡耐基梅隆大学、麻省理工学院、加州伯克利以及斯坦福。这些地方,分别是吴恩达获得学士学位、硕士学位、博士学位和执教12年的地方。 吴恩达是人工智能界的标杆,实至名归,他甚至还没到40岁。2011年,他成立了谷歌大脑,一个因谷歌强大的计算能力和大量的数据而大放异彩的深度学习项目。当计算机分析了许多的YouTube截屏并能够识别出一只猫时,谷歌大脑普大喜奔地迎来了它最重要的成就之一。(《纽约时报》以「需要多少台电脑才能认出一只猫?16,000台。」为标题加以报道。)吴恩达自己解释道:「值得注意的是,系统自己发现了『猫』这个概念。没有人告它什么是猫。这是机器学习的一个里程碑。」 吴恩达波澜不惊中流露出一丝愉悦。他侃侃而谈事业生涯中的种种错误和挫折,那些他读不懂的论文。他每天穿着一样的蓝色牛津衬衫。当同事提起他和现任妻子那套可爱的机器人主题订婚照时,他既害羞又自豪。他的妻子是外科手术机器人专家Carol Reiley。(注意照片中他的蓝衬衫!)
面对面时,他比任何人的声音都要轻柔,但这并不妨碍他成为一个颇受欢迎的演说家。2011年,当他把自己斯坦福大学机器学习的课程视频挂到网上时,有10万人注册听课。不到一年,他又联合创立了 Coursera,这是迄今最大的在线课程平台,合作伙伴包括普林斯顿、耶鲁以及中国和欧洲的顶尖学校。尽管所有的课程都免费开放,但这是家盈利企业。吴恩达曾说过:「对内容收费将是一种悲剧。」
然后,去年春天,发生了一件不得了的事情。吴恩达宣布他将离开谷歌,并逐渐淡出Coursera的日常运作。中国科技巨头百度雄心勃勃斥3亿美元巨资筹建研究实验室,沿着谷歌硅谷总部的路子投身人工智能,吴恩达则是这个项目的头儿。 一如从前,在百度吴恩达也试图让计算机以惊人的准确性识别音频和图像,而且是实时的哦。吴恩达认为,99%语音识别准确度将给人机交互和操作系统的设计带来革命性变化。与此同时,吴恩达还将助力百度服务数百万搜索用户,数字生活对他们而言还是崭新的。「(在中国)你会收到一些在美国不会出现的问题。」吴恩达解释道:「比如说,我们会收到这样的问题『百度你好,我上周在街角的店里面吃面了,超级好吃的。你说这周末他们会打折么?』这种问题。」吴恩达补充道:「我们在努力回答这些问题。」Elon Musk 和Stephen Hawking都对高级人工智能对人类的潜在威胁敲响警钟,但吴恩达不这么看。「我不研究如何防止人工智能变得邪恶,就像我不研究如何治理火星人口过剩一样。」吴恩达说,人工智能要发展到出现类似于意识的东西还有好几十年呢(或者更久)。与此同时,目前还有更为紧迫的问题。机器学习带来计算机能力的提升正在取代长久以来人类从事的一些工作。这一趋势只会加速,吴恩达呼吁决策者准备好应对(随之而来)的社会经济后果。
在加州桑尼维尔百度新成立的实验室,我们与吴恩达就Sophia——一个从形形色色的人群中获取人生经验教训的职位投递项目进行了讨论。他向我们解释了为什么他认为「追随你的激情」是一个糟糕透顶的职业建议,同时也分享了自己在教学创新上的策略;吴恩达还谈论了他的失败经历和一些有益的习惯,他读过的最有影响力的书以及他对于AI前沿的最新看法。
Q:最近,你说过:「我见过有人通过学习而变得更具创造性。」可以解释一下么?
A:问题是这样的,一个人究竟如何创造出新点子?它是不是那些天才不可预知的一种孤立行为,比如Steve Jobs(史蒂夫·乔布斯)那种某些方面很特殊的人?还是说,创新可以被传授,具有系统性? 我相信创新和创造力可以被传授。我们有办法让人们进行系统性创新或者系统性地变得有创造力。在百度,我一直运作着一个有关创新策略的工作坊,其中理念就是,创新并不是那些天才随机而不可预知的行为,恰恰相反,它是一种可以非常系统化地创造出前所未有事物的行为。 在我自己的人生经历中,无论何时,当不确定下一步该怎么做时,我会进行大量学习和阅读,与专业人士交谈。我并不知道人脑究竟是如何工作的,但是,我发现它几乎就有这种魔力:当阅读足够多或者与专业人士充分讨论后,也就是说,当输入足够多时,新点子就会开始涌现。很多我认识的人似乎都有过这种体验。 当对最新水平了然于胸时,你就会停止随机挑选创意。在挑选过程中,你变得深思熟虑,知道如何结合这些想法。当你想出新的点子或者排除修改这些点子时,你会很细心。 现在,还有一个挑战——你将如何处理这些新的想法,如何有策略地将点子转化为有用的事物?这完全是另一件事了。
Q:能否谈论一下你的信息获取习惯(information diet),你如何进行学习?
A:大量阅读,与他人大量交谈。在我看来,最有效的学习和获取信息方式有两种:阅读以及同专业人士交谈。我在这些方面花费了大量时间。我kindle里只有区区一千本书,我很可能已经阅读了其中三分之二。 在百度,我们有一个阅读兴趣小组,大概一周读半本书。实际上,我在百度加入了两个阅读小组,每一个都是一周读半本书。我是唯一一个参与了全部读书小组的人吧(笑)。我最喜欢的活动就是周六在家里读书。
Q:能谈一下早年教育对你的影响吗?父母有没有做过一些对你影响至远的事情,而这些事情又是大部分父母不会去做的?
A:六岁时,父亲给我买了一台电脑,帮助我学编程。很多计算机科学家都是从很小的时候开始学习编程,所以这也没什么特别,但是,很庆幸我是其中之一,很小就能拥有一台计算机学习编程。 不同于老套的亚洲父母,我的父母很放松。无论什么时候我在学校里取得好成绩,我的父母都不会大惊小怪,他们的反应确实让我觉得有点尴尬,所以,我习惯隐藏好成绩(笑)。我不喜欢向父母秀成绩单,并不是因为成绩糟糕,而是他们的反应。 另外,非常幸运,我能在很多不同的地方生长和工作。我在英国出生,香港和新加坡长大,美国上大学。为了个人学术研究,先后从卡内基梅隆大学、MIT、伯克利获得学位,然后去了斯坦福。 我非常庆幸走过这些地方,遇到一些顶尖人才。AT&T Bell Labs这个世界顶尖的实验室刚成立,我就在那里实习,之后到了微软研究院,有机会见识到大量不同的观点。
Q:你的教育经历或早期职业生涯事情中,有没有一些你本来会有不同选择的事情?以及可资他人借鉴的教训?
A:我希望我们的社会能够给年轻人一些更好的职场建议。我认为,那一句「追随你的激情(follow your passion)」就不是一句好的职场建议。实际上是一个糟糕透顶的职业规划建议。 你热爱驾驶,并不必然意味着你就应该渴望成为一名赛车手。在现实生活之中,「追随你的激情(follow your passion)」实际上被修正为「追随那些不仅是你的专业,而且你也对之饱有热情的事情。」通常,你首先要擅长某件事情,然后你才对于它充满激情。我认为,几乎所有人都能变得擅长任何事情。 所以,在我考虑如何渡过一生,我想做什么工作的时候,我参照了两条标准。第一,是否是有机会学到东西。这个项目能让我学到新鲜有趣同时也有用的东西吗?其次,潜在影响。世上有无数有趣的难题,世界上也有无数重要的难题。我更偏爱关注后一种难题的人。 很幸能自己总能找到宝贵机会,从事那些既具有很大潜在影响,也给自己带来极佳学习机会的工作。如果年轻人能够最大地优化这两件事,通常会有极好的职业生涯。
Q:你是否会主要根据受影响的人数来定义这个影响事件的重要性?
A:不,我并不认为数量是唯一重要的因素。显著地改变数以亿计的人类生活方式,我认为这是我们非常渴望去达到的一个影响程度。这也是一种确认我们做的事情并不仅仅只是有趣,同时也具有影响力的方式。
Q:你之前谈起过一些失败的项目。你是如何对待失败的?A:好吧,这样的失败经常发生,所以,这会是一个很长的故事(笑)。数年之前,我曾经在Evernote上列过一个单子,尝试记录下所有开始做却没有结果的项目。有时会比较幸运,在一个完全意想不到的方向上,项目被我攻克下来了,当然,更多的是运气而不是技巧。 但是,我做了一个清单,列出了所有曾经研究但是没有任何结果的项目,或是没有成功的项目,或是那种与我们前期付出根本不成比例的项目,之后我尝试根据失败原因归类它们,试着做一个严格的事后清算。其中一项失败是在斯坦福的时候,受大雁V字形编队飞行启示,有段时间,我们试图让飞机按这种编队飞行,以此理解节能。空气动力学的理由十分可靠。所以,我们花费了大概一年让这些飞机自动飞行,接着,让它们编队飞行。 但是,一年后,我们意识到,根本无法充分精准地控制飞机来理解节能。现在来看,如果一开始就考虑到位置条件,我们就会认识到,这些小型飞机根本无法实现我们的研究目的。风力能将飞机刮得远远,偏离编队飞行时的精确位置。这是我过去经常犯的一种错误,在做项目的时候,先做第一步,再完成第二步,紧跟着做第三步,之后你意识到第四步由始自终没有办法实现,还好这种错误现在少了很多。我在策略创新的工作坊也谈过这个例子,它给我的教训就是尽量在项目早期消除风险。 我现在能更好地在早期识别和评估风险。现在,每当我说「我们应该在早期降低项目风险」之类的话时,每个人都会点头认同,因为这是显而易见可以做到的。但问题是,当你真正处在这种情况下需要攻克一些新项目的时候,这就很难被应用到你现在正在做的项目上。 因为这是一种战略决策技能。在我们的教育体系下,我们很善于教授事实和步骤,就好比菜谱。你怎么烹饪一道传统意大利肉酱面?当然是依照菜谱来做。我们很善于教授事实和菜谱。 但是,创新或创造力是一种至关重要的技能,你每天早晨醒来都处在一种别人没有过的独一无二的境况下,你需要在完全独一无二的环境下做出好的决策。在我看来,教授这种战略技能的唯一方法是通过案例,你需要看成百上千个案例。当看过足够多的案例后,人类的大脑会不断地学习、吸收那些能让人做出好的战略决策的规矩和准则。 通常,我发现做研究的人需要花好几年才能参透那些案例并从中吸收到那些行事准则。所以,我正在这里进行一些实验性的探索,试图构建一个创新战略的「飞行模拟器」。在这里,你不用花五年时间去参透案例,我们会在一个短得多的时间期限内给你许多案例。 就像飞行模拟器一样,如果你想学会驾驶一架波音747,现实情况下,你需要驾驶好几年,或者好几十年才会遇到一次突发紧急情况。但是,在飞行模拟器里,我们可以在很短地时间内为你模拟各种紧急情况,让你更快地学习。这类项目就是我们现在正在探索的。
Q:在这个实验室刚成立时,你提到你在职业生涯的很长一段时间内一直没有意识到团队文化的重要性,而后来才逐渐开始认识到它的价值。这几个月来,关于如何树立正确的团队文化,你有悟出什么吗?
A:很多组织都有明确的团队文化口号,比如「我们彼此给予力量」等。当你喊出口号时,每个人都点头认同,谁不想给予自己的团队伙伴以力量呢?但是,当他们五分钟后回到办公桌时,他们真的这么做了吗?对人们来说,将抽象的口号化成具体的行动是很难的。 在百度,我们针对团队文化做了一件少有企业做的事,至少我还没听到有其他组织做这个尝试。我们做了一套测试题,在题目中向员工描述特定的情形,问题是这样的——「你在某种情况下遇到某件事,你会怎么做?A,B,C或者D?」 没有人在第一次答题时能得到满分。我认为以测试题带来的互动,让团队成员对假设的情形做出具体的回应,是我们连接抽象文化和具体行动的方式,如果你的团队伙伴对你做了某件事,你会怎么办?
Q:有哪些书对你的知识拓展产生过显著影响?
A:最近我在思考我会推荐哪些书给那些想要去创新、去创造新事物的人。第一本就是Peter Thiel的《从0到1:开启商业与未来的秘密》,这本书很好地对创业和创新作了一个概述。 我们经常把创业分为B2B(「企业对企业」,即企业的客户是其他企业)和B2C(「企业对消费者」)。B2B方面,我推荐《精益创业(The Lean Startup )》。 B2C方面,我最喜欢的一本是《跨越鸿沟(Crossing the Chasm 》,视角虽然狭窄一些,但是给出了快速创新的具体策略。虽然它所述范围有些狭窄,但在它所涉及的那些部分写得非常好。 B2C方面进一步细分,我最喜欢的有两本。一本是《Talking to Humans》,这本书篇幅很短,教你怎么通过跟用户交流来发展和用户的同理心。另一本是《妙手回春:网站可用性测试及优化指南(Rocket Surgery Made Easy)》。如果你想创造出重要的、客户关系的产品,这本书会教你了解用户的不同手段,无论是用户研究还是用户调研。 最后是《创业维艰(The Hard Thing about Hard Things )》,它虽然有点黑暗,但涉及了关于组织建设的很多有用知识。对那些正试图做出职业抉择的人,有一本很有意思的书,叫《So Good They Can’t Ignore You》,在如何选择职业路径方面给出了很有价值的观点。
Q:你有没有一些有帮助的日常习惯呢?
A:我每天都穿蓝色的衬衣,不知道你有没有发现。(笑)是的。生活中最重要的杠杆力量之一就是你养成有用习惯的能力。 当我与研究人员和有志创业的人们聊天的时候,我告诉他们如果你们坚持阅读论文,比如每周认真地研读几份文章并且坚持两年的话,两年之后你已经学到了很多(option2: 两年之中你会收获很多)。这是对你长期发展的一项极好的投资。 但是这种投资,例如你花了整整一个周六学习而不是看电视,没有人会拍着你的背告诉你做得不错。很可能你周六全天学习并不会让你在下周一的工作更有成效。这种努力的短期回报极少甚至基本没有,但它真的是很棒的一项长远投资。这确实是成为一名优秀研究人员的途径,你必须大量阅读。 希望依靠意志力坚持(学习或其他长远投资)的人几乎从来没有成功过,这是因为意志会消沉。我反而觉得喜欢创造习惯的人– 你知道的,每周都学习,每周都努力地工作– 这些才是最重要的。这些人才是最可能成功的一群人。 对我来说,我的习惯之一就是每天早上跟着一个应用健身七分钟。我发现每天早上做同一件事会容易很多因为你需要做的决定少了一个。我的衣橱里全是蓝色的衬衣也是出于同样的原因。我以前其实有两种颜色的衬衣,蓝色和品红。我觉得那样需要做的决定太多了。(笑)所以现在我只穿蓝色的衬衣。
Q:你敦促决策者们花时间思考一个被计算和机器人消减了很大一部分人力工作的未来图景。你有什么解决方法吗?
A:这是一个非常难的问题。计算机擅长于机械重复的工作。所以到目前为止,机器擅长于使之自动化的是每天都需要重复作业的任务。 现在这可能是光谱上的几个点。(比如)流水线上的工人们数个月重复着同样的程序,现在机器人已经可以做这样的工作了。中级的挑战比如开卡车。卡车司机每天都做着相似的事情,于是计算机也在试着做到这一点。这比大多数人想象的困难,但是没准自动驾驶可能是下个十年会发生的事。然后,更加高级的任务,比如放射科医师每天需要查看同样类型的X光片。同样的,计算机在这样的领域也能一显身手。 但是我觉得,在很长一段时间里,人类会比机器人更擅长从事那些非机械的、非重复性的、社交性强的任务。我们的很多工作都需要每天做不一样的事。接触不同的人,安排不同的事情,用不同地方法解决问题。目前这些任务对于计算机来说是很难完成的。 我们面临的挑战是,当美国从农业经济转向工业和服务型经济时,人们从一种程序化的工作,比如务农,转向另一种程序化的工作,比如制造业或者在服务中心工作。大部分人口都做了这样的转换,他们找到了其他的工作。但是,他们的大部分工作还是平常且重复的。 我们面临的挑战是,需要找到一种(规模大小)可变化地传授从事非例行、非重复性工作方法的路子。从历史上看,我们的教育系统并不谙于此道。顶尖大学只能为少数人提供这种教育。但是,绝大多数人还是要从事不但重要而且例行重复的工作。这是我们教育系统面临的难题。 我觉得问题能解决。这也是我一直在考虑教育创新战略,也就是教授创新策略的原因。我们需要让很多人能够从事非例行、非重复性的工作。教授创新和创造力的策略,还有飞行模拟仓,会是实现这一目标的办法。我们还没有想出具体办法,但是,我对此表示乐观。
Q:你曾经说过,你曾经说过,「工作上,中国的工程师比硅谷的工程师要努力地多。硅谷初创公司的工程师工作真的很卖力。在一家成熟的公司里,我没见到初创公司和百度那样的工作强度。」你觉得原因何在?
A:我不知道。这两处的工程师个人都很棒。差别可能在于公司。百度的工程师团队偏于非常灵活。 更不用说感谢中国互联网经济现状,我认为,挑战各种设想,一切待价而沽,会有更大的意义。中国互联网生态系统很有活力。每个人都看到了巨大机遇,每个人也看到了巨大竞争。情势一直都在变化。新的发明在诞生,大公司会突然有一天进入一个全新领域。 给你个思路。在美国,如果FB打算开发一个全新的网页搜索引擎,感觉会有点奇怪。为什么FB要做搜索引擎?这真的很难。但是,在中国,这种事情不会那么不可思议,在那里,更多的假设会认为,这会是新的创造性商业模式。
Q:似乎是一种不同管理文化,在那里,你能迅速作出重要决定并让这些决定保持聪明高效还没有混乱。百度是否在以一种独特的方式运作,你觉得这种方式特别有助于它的成长?
A:天哪,好问题。百度将决策过程往下推到很远的地方。员工有很多自主性,他们也会非常具有战略性。我非常欣赏公司,特别是管理层的一点是他们对世界和竞争有着非常清晰的视野。 管理层会面时,我们同整个公司交谈的方式不会故作声势。 「我们在那一点上,干了件伟大的事儿。我们对那些事情感到不高兴。这个进展顺利。这个进展不顺利。这些是我们应该着重强调的。让我们检视犯的错误」很明显,这里没有虚张声势,我觉得,这给公司需要创新和专注的领域,提供了一个伟大环境。
Q:相对其他问题,你会更加倾向于关注语音识别的问题。在你所面临的问题中,解决了哪个问题就能引领语音识别技术精准性的巨大飞跃?
A: 我们在为语音识别打造机器学习系统。我们正在使用的一些机器学习系统其实已经有数十年的历史了。但近几年才开始真正初见成效。 这是为什么呢?我通常用建造火箭飞船来作比较。火箭飞船本身就是个庞然大物,还需携带一吨燃料,两者都需要非常巨大的空间。燃料多,火箭小,飞不起来;引擎大,燃料少,可以起飞,但上不了轨道。可见,巨型引擎和大量的燃料都是必须的。 机器学习现在才有所起色,是因为我们终于有了可以建造巨型引擎的工具——巨型电脑,这就是我们的火箭引擎。而燃料就是数据,我们终于获得了所需的大量数据。 社会数字化为大量数据的产生创造了可能,并且我们制造数据已经有一段时间了。但是,仅仅是最近几年,我们才能够建造足够大的火箭引擎来消化这些数据燃料。所以建造更大的引擎,获取更多的数据是我们实现语音识别手段中的一部分,但不是全部。
举个我们做过的事情,有点技术性。从哪里获取用于语音识别的大量数据?我们做的事情之一就是提取语音数据。其他小组可能会用到几千小时的数据,而我们使用100,000小时的数据。比起学术作品中能够读到的火箭燃料,我们需要数据燃料可要多得多。 接着我们会做另一件事,假设我们有一张你的音频剪辑,我们会在你的音频中加入一些背景噪声,仿佛音频是在咖啡厅录制的。我们合成了一段听上去好像你在咖啡厅说话的音频剪辑。通过合成在有大量背景情况下你的声音,这就使我们的获取的数据翻了好几倍。我们用这种策略来为我们的机器也就是我们的火箭引擎制造更多的数据。关于语言识别还有一个重要的事实:大多数人不理解95%精确度和99%精确度的区别。95%的精确度意味着每20个字里就有一个错别字,每次在手机上使用语音识别时都不得不回过头来纠正错别字,是件很痛苦的事。 而99%则完全不同,如果可以达到99%的准确度,语音识别就会变得可靠,一旦管用,你就能一直使用它。所以,这4%的差别并不仅仅是4%的渐进改善,而是一直用和几乎不用的天壤之别。
Q:那么,现在阻碍我们达成99%精确度的困难是什么呢?
A:我们需要更大的火箭引擎,还需要更多的火箭燃料。这两项仍在限制语音识别技术的发展,我们需要同时发展这两方面。我们仍在努力突破极限。