作者:熊光的朋友

洪小文:微软亚研院不缺人才, 黄埔军校永远是「现在进行时」

作为微软公司在美国以外最大的研究机构,微软亚洲研究院自 1998 年建院以来,历经了李开复、张亚勤、沈向洋、洪小文四任院长,培养了数十位学术大牛与近百位科研骨干。

今年是微软成立 20 周年。

作为微软公司在美国以外最大的研究机构,微软亚洲研究院自 1998 年建院以来,历经了李开复、张亚勤、沈向洋洪小文四任院长,培养了数十位学术大牛与近百位科研骨干。

与此同时,作为 IT 业界的「黄埔军校」,从微软亚洲研究院出来的人才几乎占据了中国科技圈的半壁江山。

而作为微软亚洲研究院的现任院长,洪小文曾在十几天前的一封致敬信中回忆自己与研究院结缘并为之付出职业生涯的大部分时光的整个过程,也详细列举了迄今为止这家基础研发机构在技术方向取得的重大突破。

但在他的眼中,微软亚洲研究院对全球科技界最大的影响与启示莫过于「基础研究对一家公司的重要性」。

他很佩服比尔盖茨当年不但想成立研究院,而且是成立一个研究院去专门做基础研究,因为他看到如果计算机界的基础技术不往前走,高科技能够得到更多的商业机会就一定会变少。

「现在做应用的有,『割韭菜』的有,但做基础研究的很少了。也不能说每个公司都应该做基础研究,但是我觉得一个公司发展到一定地步,在业界处于领先地位,都应该做一些东西。」

除了能为微软的各种应用及产品层指明方向,微软亚洲研究院还是业界名副其实的「黄埔军校」。洪小文觉得这是对微软亚洲研究院的一种褒奖,就像清华、北大、哈佛跟剑桥这样的学校,他们永远不怕招不到好学生。

「你可以把它看作是一种毕业机制,有人才走,也有人才源源不断地流入。如果只是人才流失但又培养不出新的人才,那才是最可怕的事情。而我们是『现在进行时』,不是『过去式』。」

而对于中美之间关于「AI 竞争」的说法,洪小文认为一些报道过于片面。因为本来人类社会就是有竞争,又有合作的。作为科技工作者应该以平常心看待:

「其实我们在民间,包括学术界、工业界,其实更多强调的是合作关系。不要因为 AI 红,就把 AI 炒得好像是 AI 是造成中美贸易战的起因。AI 何德何能可以造成一场战争。」

以下是基于采访整理的对话内容:

问:微软亚洲研究院做的是非常前沿的、基础的研究。在成立的时候,同时代的外企,包括 IBM、朗讯他们其实也在中国有研究院。你觉得是什么可以让微软亚洲研究院没有成为一个非常面向市场的研究机构?而是做最基础的核心研究?

洪小文:我想首先这个东西还是要谢谢微软公司,以及我们的 CEO 萨提亚,当年成立研究院的时候我的老板 Dan Ling(凌大任)跟 Rick Rashid,再到比尔盖茨。我觉得是因为他们的远见,没有微软对长远研究的支持就没有我们。

首先这个基础研究,我觉得在今天,到底什么东西该发展,什么应该自主研发,其实大家忽略了一个重点,那就是基础研究,我希望你们能够多报道的是基础研究,没有东西是一触可及的,万丈高楼从地起,基础研究是最底层,最基本的东西。

我们说站在巨人的肩膀会看得更远,我们人类历史做出的成果都要感谢前人,不只是要感谢计算机,更要感谢物理、化学、更基础的数学等等,人类文明就是这样发展起来的,这叫基础研究。基础研究这个盘子太重要了,没有人从石头蹦出来一个 idea 可以单独存在。

以 AI 为例,人工智能现在红得不能再红了,红透了。但是,人工智能这个字眼早在 1956 年就出现了,没有这 60 多年走过的路,怎么会有今天的 AI。

AI 也有过冬天,AI 冬天的时候,大家都不投资 AI。我当年研究生是做 AI 的研究,我们毕业的时候都不敢讲我们做 AI,做 AI 都找不到工作,我们讲做语音识别,做计算机视觉,不要跟 AI 沾边。现在跟 AI 无关的都要跟 AI 沾边。

所以,我跟大家解释基础研究的重要性,而且基础研究这 60 多年来,有无数多的研究,而且很多研究是在微软亚洲研究院成立之前就有的,因为我们微软亚洲研究院才 20 年,微软整个研究院成立到现在也不到 30 年。包括我的导师,那时候 1966 年,是很寂寞的,毕业还要躲着不要做 AI。

所以,基础研究就是这么回事,今天我们会讲到爱因斯坦,讲到牛顿。即使爱因斯坦都说,我的工作都是基于前人的东西。所以,这就叫基础研究。

我讲这么多意思就是说,基础研究、基础科学如果没有往前提升,就没有高科技,没有计算机,没有这些东西。所以,为什么我说其实我是鼓励你们,多去学校报道,因为学校做的很多是基础研究。对于公司来讲,你开一个公司,说做一个东西要 60 年以后才有结果,大部分都说我现在不要投资,开公司的人这样想是很合理的。

但是,微软在 1991 年的时候,当时我们还是一个小公司,1991 年是什么样的概念,Windows 还没有出来,Office 也没有,只有一个东西叫 DOS。所以我们很佩服比尔盖茨当年不但想成立研究院,而且是成立一个研究院做基础研究,要参与基础研究,因为他看到如果计算机界的基础技术不往前走,高科技能够得到更多的商业机会一定会变少,所以他知道基础研究的重要性。

基础研究需要做,但是公司也得做,历史上,IBM 也好,或者朗讯、贝尔实验室,都是做基础研究,现在都报道得少了。

所以,研究院是在那个环境下成立的,我们跟人家的差别就在这里。即使今天回看全世界,真正有公司愿意花大把金子去做,甚至鼓励别人去做,还跟学校合作做基础研究的公司没有多少了。

做应用的有,「割韭菜」的有,当然我们是说好意的「割韭菜」,不是恶意的「割韭菜」。我觉得也不能说每个公司都应该做基础研究,但是我觉得一个公司发展到一定地步,在业界处于领先地位,都应该做一些东西。所以,也因为这个微软才有后来的研究院。

而且在研究院做基础研究,你就要放权,意思就是要由下往上,基础研究一定要由下往上,基础研究不是说政府,或者学校某个领导 60 多年前说,我要做 AI 了,不是。

当时为什么说 John McCarthy,他召集了一些教授来开个会,说我们决定做 AI,要怎么做。所以基础研究一定是由下往上。所以,这是为什么微软亚洲研究院从第一天开始就是由下往上,让对未来最有愿景的人来这边,给他们放权,让他们去做。

所以,我继续回答你这个问题,不要说是 20 年前,即使今天有多少公司愿意这样去做,都值得思考。所以越多公司愿意去谈做基础研究,我觉得都是好事,我觉得这里也奠定了微软亚洲研究院成功的背景。所以,我们从第一天就不是只是从牟利的角度,或者从产品的角度。

当然去做这个研究院,我觉得定位已经很不一样了。今天如果有人告诉你说,我做研究院的目的就是要百分之百有产出,要留住那个东西,我只能说他可以做,但是这个东西并不是我们所谓讲的最前沿的研究、前瞻性的研究。

当然公司不可能说我只是搞一些人来做基础研究,不需要获得任何益处,这当然也不可能。这也是为什么我觉得微软亚洲研究院有利的地方,如果我们只讲基础研究,我们可以去学校,学校自由,只要有经费,爱做什么做什么,可以做一百年以后的事情。

公司不一样的地方是说,因为我们也了解计算机是一个很应用型的技术,并不是数学、物理、化学,不是真的完全基础科学。

所以,尤其今天更不要说大数据。一个真正的创新,尤其老百姓能够了解的创新,最后一定是他们摸得到,碰得到的东西。就是一定在产品上能够帮助他们,这也是你们报道的,这个也很重要,因为你真正能够改变这个世界的还是要通过产品,产品也包括很多东西,包括你说万有引力这个东西有什么道理,他可以发展火箭,可以上月球,这就是应用,人征服了宇宙,可以去月球,这就是应用,物理上是这些万有引力的推算。

所以任何东西都有应用,如果你没有到应用层面,这个科技只是在初始阶段。

所以像我,还有微软亚洲研究院绝大部分的员工,为什么到微软亚洲研究院不到学校去,就是因为我们可以跟产品部门一起用产品的模式去改变这个世界,去让我们的用户享受到。

所以,微软做研究院,一方面我们做最基础,由下往上的研究,同时当我们有任何成果,我们可以在最快的时候跟我们的产品部门合作,我们不做产品,我们跟产品部门合作,让产品受益于我们的技术,包括 AI、生产力的工具,像 Windows、Office、Xbox 各种举不完的例子,这就是我们很特殊的定位。

问:微软亚洲研究院其实刚开始建立的时候,条件并不是非常好,当然现在有很多公司也建立研究院,他们的条件比过去是好太多了。你们当时一直走过来,在这个过程中,有没有想过它为什么做得比较好,有哪些经验尤其值得今天其他公司建立研究院的时候可以去考虑的?

洪小文:当时的条件看你怎么看,不能说不好,甚至于从今天角度来看,可能很好。首先,微软给我们的资源从来没有少过,首先感谢微软,当时给我们的资金是不缺的,绝对没有什么不好。你可以说,任何人,任何公司,当初决定在这里做,一开始要放多大,这个问题应该放在当时跟今天都一样,今天成立一个新的东西,任何东西都有一个正像反馈的东西,你做得好,我就长得越大。

总不能说,我一开始放一万个人去做,所以这个到不能说当年条件不好。所以,我觉得微软给我们的支持从来没少过,这个条件来讲。

但是,你可以说当年的条件在中国的确,20 年前的中国跟今天不一样了,当年在中国能不能做实际工作的研究,当时是一个问号。

但是,今天所有国际顶级的会议都有中国的论文。所以,微软亚洲研究院第一个标杆,第一个成就,就是说我们证明了,我们跟中国一起走到国际的舞台,证明了我们可以做。所以,这是我们很了不起的一件事情。这个条件只能说不一样,这个其实在当时是一个挑战,也是一个好的方面。因为大家对我们的企盼不知道应该怎么企盼。

今天标准高了,你当然可以做这个,大家往下一个做什么东西,甚至于说,今天中国成立公司,这跟中国成立公司也很像,当年在中国成立的这些新的公司,今天你就要跟 BAT 去比,所以环境有这样的不同。

除此之外,当年还有一个我们其实是得利的,微软亚洲研究院当年要做技术,要做最前沿的科技,又有最自由的环境,也仅此一家,当时除了学校以外没有什么科研单位。

所以,当年人才的竞争比较少,今天选择多了,一个大学生还没毕业,就有多少人要招你。有国内类似 BAT 这样的公司,有国内这些独角兽,还有国外的公司,国外 Facebook、Google 等,国内、国外都成长起来了,需要大量的教师。

所以,现在来讲,一个优秀的学生,现在我们的竞争跟以前不能比了,当然我们还是很欣慰,还是有很多的学生,很多的员工愿意选择我们。所以,时空背景不一样,好和不好各有利弊。

问:中美之间的 AI 竞争我看过一篇文章,他觉得现在 AI 竞争让中国和美国之间,有点扭转了像以前那么紧密的连接,无论学术界也好,还是工业界也好,觉得这种竞争会导致大家越来越疏离,因为大家都知道合作会好的,你怎么看待中美在这个所谓的 AI 领域这种趋势。这种竞争的走向如何?

洪小文:我觉得这个氛围不是很健康的,很多这种报道,其实我们这个社会,这个世界除了中美还有很多国家,中美加起来人口也没超过一半。中国好像占 1/4 人口,再加上美国占 1/3 可能都不到。所以,除了中美还有其他国家,我们置其他国家于何处?

其实人类社会是又竞争,又合作的。包括你们媒体之间也是有竞争,但你们也合作,我们将心比心,在社会上,不能总是每天说这一家和那一家比,这个世界真的不是这样,我们还有很多东西是合作的。

我们回到 AI,AI 60 年来,每天都在那边讨论 MIT 对斯坦福么?不是的。AI 60 多年来更多的是合作。所以,学术上本来就是合作,更不要说站在巨人的肩膀上看的更远。

所以,你刚才说中美合作,的确在科技上的合作非常多,而且这都是好事。不要讲国家,我们看看企业,现在也有很多文章都在比较公司,但有没有同比性呢?大家其实各有优势,在不同的方面都很强。

我觉得特别从出版界,包括写书、写文章,我们该怎么去看待这个东西。这事实上是要平常心看待,你说中国跟美国有没有竞争?当然有竞争,贸易上当然有竞争,今天中国生产的东西,或者中国要做的这个东西当然要超过竞争对手,每个人都要这样,但是不会因为这样,就变成我要超你,你要超我。我们要以平常心看待。

所以,我更希望从这个角度去看,其实我们在民间,包括我们在学术界,甚至在工业界,我们其实更多强调的是合作关系。

所以,我觉得其实是很多东西大家在社会上都可以扮演更多的力量。更不要说 AI,AI 只是某一个技术,你如果说大家真的 care 公司跟公司,国家跟国家之间的竞争,那是其他所有东西的总和,尤其说贸易,贸易里面 AI 只是占这一块,还有别的,比如金融业、生命科学、医药等等各个东西。

所以,我觉得不要因为 AI 红,把 AI 炒的好像是 AI 造成中美真的要打贸易战,要真的打 AI 战,我觉得是我们所有从事 AI 的工作者,包括公司,包括写文章的媒体,写书的都要负责任的,AI 何德何能可以造成一场战争。对不起,我的回答可能很不传统。

问:2018 世界人工智能大会上,沈向洋副总裁说微软亚洲研究院要在上海成立一个分院,同时跟上海仪电合作,这个大概什么时候会落地,以及为什么会选择上海?

洪小文:第一,微软亚洲研究院这 20 年来都一直在北京,我们第一次走出去,我们是不轻易做这样的事情的。

我们当然也是看到有一个机会,一个是我们成立分院在上海,另外我们跟仪电做一个新的尝试,叫微软-仪电人工智能创新院,我们希望做最后一里路的 R&D,因为微软一直是一个平台公司,我们高科技遇到的机遇叫数字化转型,等于所有公司不管在哪一行都要善用数字化,善用云计算,善用 AI,善用这个东西帮助你做数字化转型。

意思就是说,从某个角度来看,每家都会变成数据公司,都必须要善用数据,每个都要变成软件公司。微软也因为这些获益,因为我们是做平台的公司,事实上我们服务的对象最广。

而且我们不做什么应用,这个在报道上是吃亏的,因为报道就是应用层面的多,你说微软做不做无人车,好像没做,微软做不做互联网金融,也没有做。

事实上微软是在后面帮助每个公司让他们做这个,因为我们不做应用,反而这些公司告诉我们现在最喜欢跟微软合作,因为跟微软合作,微软不会来抢他们的饭碗。

但是,在这方面我们发现,特别是人工智能,最后一里路的创新还没有那么容易。所以,为什么微软我们希望叫做把 AI 可以彻底给它普及化。

我们一方面要做普及化,当然很多人等不及,在一些不同的领域里面,我们决定说我们有很多机会可以跟这个领域的领军公司,我们的伙伴一起做一个最后一里路的创新,我们可以拿我们的技术,特别是 AI 技术,跟行业里领军的公司,结合他们的行业的知识,加上他们的数据结合,做最后一里路的创新。

所以,我们基本上特别是创新院就是做这个东西的。而且在这个过程,也是让 AI 普及化,在这个上面所做的一些对 AI 技术的培训、认证的工作,因为不是每个公司都有 AI 储备的人才,怎么让他们能够懂足够的 AI,能够把这个东西做到他们的专业的产品里面去。所以,这个是我们在上海成立创新院的初衷。

尤其昨天主席讲长三角一体化会变成国家的政策,我们也看到上海的商业,而且我们本来非常多的伙伴公司、客户在上海,然后加上上海政府领导,所以我们三方的合作,我们真的很看好这个。

然后你讲落地时间,我们已经积极在落地了,但是具体的地点,上海市政府在帮我们筹划一个地点,我们正在盖,真正到落成、装修好,可能要到明年暑假,但是因为我们上海也有既有的地点,微软也好,或者仪电也好,我相信即便没有揭牌,大部分就可以弄起来了,所以基本上在明年,明年就会把这些东西给落实,我们是充分的期待,把这个新的研究院,以及创新中心做好。

问:第六期的长城计划,以及跟往期相比,主要的差异在哪儿?

洪小文:我们从 2002 年开始到现在跟教育部,基本上把我们跟中国高校合作的所有东西都合在一起,变成叫做「长城计划」。

到现在刚好做了五期,我们开始做第六期,其实我们会做这个东西,因为时代的变化很大。

一方面,就算你工作的项目没有变,但是做的东西会变。比如说,我们就讲课程,以及我们与研究的合作。刚刚讲到 AI 的落地,还有 AI 最后一里路的创新,里面包括这些平台,然后开源,特别是开源。

我们已经开始跟四个学校,中科大、北大、浙大、西交大,我们跟四个学校做了新一代人工智能开放科研教育平台,这个东西已经开始有一些成就。

所以,我们很希望利用这个开放的平台,一起来跟中国的高校,做科研,做教育,发展出一些课程,甚至相关配套的一些东西能够推动,特别在学术界的发展以及教育上面能够得到更好的实现。

所以,这只是个例子,我们还与教育部在新工科方面有合作,因为 AI 的普及性,将来怎么教 AI,怎么教计算机专业,怎么教其他的学工程,学理科的,甚至普及到中小学,我们也在做新工科的一个探讨。

那么,我们还有计算思维,甚至于怎么把计算机编程,因为这些跟 AI 都是相关的。所以,这只是一个例子。我们这次跟教育部推出第六期未来会有更多的信息给你们报道,我们已经有一些很初步的很大的这些想法了,很多东西也开始在落实了。

我想不断希望透过「长城计划」把现在高校里面他们最关心的一些方向跟项目能够发挥我们微软在业界的力量,一起合作把这个东西做好。

中国是一个非常好的环境,一方面我们跟学校 20 年来的伙伴关系,给我们奠定了一个很好的合作基础。

同时中国也很需要,教育部叫新工科其实是蛮好的,因为这一波的这些 AI 为主的这些创新,一方面需要像我们做研究的,一方面跟公司,跟工业界的实用非常相关的,这些东西跟学校的参与,因为毕竟公司不是教育单位,学校也不是工业界,更不要说学校的学生 99% 毕业以后都是到工业界服务,所以让他们继续保持他们的相关性,这样学校训练出的学生可以更容易的进入到工业界,工业界也高兴,从国家角度,这些人也可以学以致用,不会造成脱节。

所以,在这些方面,我们继续对教育部的合作充满了很大的热情跟信心。

问:人才教育会成为未来科研发展的基础吗?具体应该是怎么做?是产学研结合吗?

洪小文:对,其实你看我们 MSRA 20 年来做的事情,人才是很大的一块,因为有人才有科研。这个道理太简单了,两方面:

第一方面,科研永远是靠人的脑袋,而不是靠人多,所以人才非常重要,人才的培养才会有好的科研。

第二,学校就是培养人才,工业界,今天高科技占了这么大的比例,20 年前我们就知道,我们知道有更多人投入高科技,所以一定需要学校能够培养更多,更适合未来的这些人才。

所以,为什么我们跟学校在人才方面的合作是非常重要。我想发展 AI 更不要说了,AI 的人才很缺,所以怎么样培养 AI 的人才,人才永远是发展一个技术产业,今天叫 AI,如果把 AI 换成一个芯片,也是一样的,这些高科技的东西都是靠人的好的思维和人的好的脑袋想出来的东西,跟人才绝对是脱不了关系的。

问:微软被称为「中国 AI 人才的黄埔军校」,你觉得他怎么样能够吸引这些一流的人,而且现在有很多竞争在,怎么样持续的再吸引研究院员,或者是优秀的人才也好,你觉得为什么他会成为新的土壤?

洪小文:昨天我发表了一篇文章,文章里面我特别提到这个东西,因为每次讲到「黄埔军校」,刚开始是五味杂陈,很多人讲微软留不住人才。

后来我彻底想清楚了,这件事情你们今天在谈,甚至五年前,甚至更早,十年前就有人这样谈,现在还有人这样谈。所以,这个东西不是过去时,至少是现在进行时,你们学中文的应该学过这个东西。

所以,这是一个褒奖。为什么?如果我们只是单纯的留不住人才,很容易就变成过去时,人才如果流失,又不能培养新的人才,这肯定是像真正的黄埔军校,最后都不存在了,是过去时了。

但是我们这件事情显然是现在进行时,现在还在发生,代表什么?我们可以源源不断的培养人才,要不然不可能做成这样的事情。所以,至少显现出下面几层意义。

第一,我们的确有人才走,但是这很自然,其实你看高科技业,不管是 BAT,美国的 Google,人才流动非常大,不是只有微软这样,都是这样。这代表这个领域非常的红火,大家都要争取最好的人才,其实反映的是这个事情。

所以,人才流失一直都有,但是一定还有好的人才加入我们,而且好的人才在我们这边培养,而且在中国,我们雇的大部分其实都是应届毕业生,应届的这些博士生。而且我们的人才进来,还可以培养他,几年以后变成将才,有的人走了。这代表我们培养的机制很正确,要不然也培养不出来,我告诉你这个结果,我想你会同意。

所以,我很欣慰,我们其实有一套机制,有点像学校,你也知道全世界好的学校,哈佛、MIT、剑桥、中国的清华、北大,学校里面你要了解学生毕业就走了,这些学校为什么好?他了不起的地方是他走了还会有人,好的再进来。然后又培养出来,又很好,所以继续很好。

所以,从这个角度,我们很像学校。我是很正面来看这件事情,如果是这样,其实说句老实话,你知道清华、北大、哈佛跟剑桥,它永远不要怕招不到好学生。

所以,你这样想,我就最后觉得人家这样想我们都是褒奖。所以,这是好事,我们要正确的看这件事情,虽然每个离开我们的人,我都希望他不要离开,但是你不能挡住别人。所以,我把它看成一个正面的事情。

现在说为什么。其实道理很简单,我们肯定科研做的好,比如说,我就问你,今天你是学生,或者将来儿子、女儿长大了,要去报考哈佛、清华、北大,人家问你,为什么要送小孩去,或者你儿子、女儿为什么要去清华、北大、哈佛?哈佛好,你一定会这样说。

这个不是我自己老王卖瓜自卖自夸,而且这个是一定的。所以,一定是我们任何时刻,现在我们所做的研究,我们做的这些东西肯定得到大家的肯定,没有想加入一个做不好事情的人。

第二,这个地方好,我进去以后可以提升,学习到东西。我们曾经看到一个人跳槽,其实你看到的是一个「果」,大家从个人角度来看,其实每个年轻人,包括你们,你们在座的这么年轻,我不知道你们加入了多少公司,你今天在这个公司,只要会长期待下去,你肯定在这个公司觉得有所提升,你也学习到东西了。

尤其今天这个国家,这个世界,你今天大学学的东西,或者今天学的东西,五年以后,十年以后都落伍了,还要重学。所以,我们要不断学习,提升自己,觉得每天都更充实,每天我觉得市场价值更高,就是学习,感觉上你有所增进,而不是到一个地方我只是贡献。

比如今天有一个人雇你去,你是贡献了,但是自己没有成长,没有你的同事可以刺激你想新问题,你这个想法很好,让我学习到一个东西。

所以,我们的这个环境,我们出去的这些人,都很怀念在微软亚洲研究院那段时间,为什么?因为他们觉得在微软亚洲研究院他们得到成长了,这个很重要。就像一个哈佛的一个清华、北大的学生,大一进去的时候大四出来,一定觉得他学到很多东西,他成长了,他毕业之后还会怀念清华、北大,还会怀念哈佛,所谓的校友会,我们叫院友会,还愿意回来,以当年是清华、北大的学生为荣,因为他当年在清华、北大得到了成长。

包括你今天如果对你的公司很满意,我相信你将来离开的这个公司的时候,你会觉得我在这个地方得到了成长,你一定会推荐给下一个人。

问:其实微软在智能研究上是比较前沿的,在您看来,这波因为在神经网络深度学习方面兴起的这些创业公司,尤其是中国的公司会面临的市场机遇有多大,又有哪些困境?

洪小文:每一行有每一行自己的甘苦。创业公司跟科研公司还不待一样,没有一个创业公司说我的生产就是技术,历史上其实从来没有发生过。就算发生了,他也一定要卖这个技术。

因为你有投资者,投资者要看到产出,要能够赚钱,要能够成长,或者看到用户量增加,很清楚。所以,创业公司他的目标是得到商业,商业上可以是钱,真金白银,可以是用户,可以是数据。所以,他们要争取的是那个。

所以,他们遇到的挑战大部分也是那个,当然技术也有挑战,如果你能做到那个东西,全世界只有你可以做,这是很难的。

说句老实话,深度学习,尤其科技,好的东西大家就可以去学习,大家就可以去用,今天全世界有哪一个人可以讲出这个东西只有我可以做。

当然,他们有很多挑战,当然是技术的挑战。但是你说技术公司,技术好不一定是商业获胜的那一方,你们是年轻人,你们都没有用过磁带,你们都没看过,历史上太多例子了。就是技术好的那个不一定赢。这就是很无情的,商业就是这样,商业就是商业。

问:市场机遇呢?

洪小文:市场机遇就不应该问我了,我们真的不做市场。我觉得市场这个东西,而且更不要说还有运气,你这个创业公司他有他的甘苦,尤其东西还没有出来,他们很努力,真正把东西做出来,做成功了,事后来讲都很容易,在那个当口,都不是那么简单。

问:微软亚洲研究院肯定是个一流的科研机构,你觉得为什么可以产生那么多的成绩,能不能说一下你的秘密所在?

洪小文:其实我后来在那篇文章里面写说,人才正确、文化正确、单位组织正确,其实我是很诚心的。

第一,我们的母公司微软好,能够很健全的活着,甚至有增长。有了这个以后,这个公司还要给予我们机会,要能够看到基础研究,长期研究的重要性,这个组织要好,单位要好。

然后,人才好。我们要挑最好的人才,我们在选人才、培养人才肯定有我们独到之处,特别是能够从长远来看。因为今天中国这个社会,大家看到短期的成功,没有看到长期的耕耘,长期的耕耘是非常重要的。包括学校,教育是百年大计,很多人说要办学,你说今天的清华、北大、哈佛能够成为好学校,大家看到的是长期的耕耘。今天办一个学校,办一个公司,三年之内超英赶美,很容易讲,但做起来大概没有那么简单的。

所以,人才正确、文化正确,我觉得文化真的很重要,我是鼓励,像这个问题你应该多去访问我们的研究员,因为你今天问我,我是一个研究员的领导,我怎么领导他们,研究员希望有宽松的环境,当然这是文化。

当然文化里面不是自由吃草,给大家自由发挥,我们怎么有奖惩的东西,我们还是要有正向反馈,一个好公司有好产品,大家愿意用,他就可以赚更多钱,放更多研发。

我们这儿也一样,好的研究员做好东西,要得到鼓励。所以,文化上非常重要。所以,我觉得这些东西把握住了,说起来容易,但做起来不是那么容易。

我可以举例,现在很多人都说要做一流的科研,我还看过一个科研的负责人说,我们今天做这个科研百分之百能够转化成有用的东西,我可以告诉你,如果讲这样的东西,大概是做不到的。

我想你们也听过,爱因斯坦也好,或者富兰克林也好,科研是 99 次的失败加上最后 1 次的成功。你今天要做大项目,一定要跨大的脚步,要能够容错。

如果要求你百发百中,你射的一定是很近的,你射的远不可能百发百中。所以,文化上真的要很清楚,这个拿捏不是那么简单的。

因为大家都要好东西,我也要好东西,但是就有点像,大家都看过《伊索寓言》,一个金鸡会下金鸡蛋,杀了以后永远没有金鸡蛋出来。

所以,你怎么去拿捏这个,这就是文化。这些文化怎么去拿捏,我们是非常相信,我们讲了很多原则性的东西,我也欢迎你们跟我们的研究员做更多的交流。

所以,我真的觉得做一个研究不容易,原则的东西我都讲了,但是真正能够做到,每一天就是这样去做,包括我在判断一个项目。

举个例子,今天如果你是我的研究员,你跟我说,你别来烦我,一年之内我给你结果。我说好,你就去做。一年以后你跟我说,不行,还要一年,再给我一年。我说好。

一年以后你又跟我说,还不行,再给我一年。我怎么办?

你不能说一年又一年,但是很多时候最后那半年就要出来,作为一个领导你怎么办?

所以,对那个东西还是要有相当程度的了解,不能永远给他机会,那不就是放牛吃草吗?如果三年到了,不给你支持了,哪这么简单?所以,其实很多大的决定不是那么简单的,我们其实都是在对未来进行判断,有些东西你看好,有些东西你不看好,但是有些东西你不看好,最后会出大结果,所以你怎么平衡。

所以,其实科研这个项目不容易,真的是要长期的投入,要有长期的眼光,要做正确的判断。我觉得把时间拉远,今年 20 年了,我们可以讲微软亚洲研究院做的很好,肯定十年前我做的决定,不能说每一个,但是大部分决定可能也蛮对的,否认的话,我看好的最后都不成,留下一些比较差的人。我不看好的全部都跑掉了,也不行。

所以,把时间拉远很公平,看出来是这样,但是站在里面的时候是最难的时候,所以怎么能够耐得住寂寞。

所以,科研到最后,你能够耐得住寂寞,能够有耐心,然后最后把这个时间走完,我觉得事后来讲很公平,但是站在里面,真不是那么容易。所以,原则性的东西好好讲。所以,说穿了,你也很难公式化。

其实说句老实话,你说研究院,包括媒体里面也有比较成功的,我相信一定也走过这样的路。各行各业也都有这样。今天能够最后做成的,最后回过头来看一定有一段故事,有一段经验大家可以分享,但是这个东西,就好像说成功是不是可以复制?

你如果问我,一些精神,一些原则可以传授,但是没有一样成功是可以百分之百复制的,因为时空背景都不一样。

问:如果将人工智能分成上下半程,有一种说法说,上半场是数据、算法、软件,下半场就会包括硬件和实体,对这种说法您怎么看?

洪小文人工智能也走 60 多年了,你怎么说现在是上半场。我换一个角度去看,人工智能还是有太多神秘的面纱?什么叫人工智能?你告诉我什么不是人工智能?我应该反问你,量子计算是不是人工智能?有人说量子计算跟人工智能好像很有关系。

你想想什么东西不是人工智能,其实很难想出来。人工智能在学术界上事实上有比较严格的定义,事实上如果我告诉你,你们几年前有一个东西叫数字挖掘,从数字去挖掘里面的洞察这些东西,你会觉得数字挖掘是不是人工智能

其实,数字挖掘在学术上不是人工智能,有人觉得很奇怪,数字挖掘也是里面有智能的东西把它挖掘出来,所以你们怀疑是正确的,但是在学术上会分各种不同的学科,不是一个学科。

数字挖掘是 database,数据库的那些人搞出来的。人工智能是另一帮人搞出来的,这两个东西当然有交集,但是不同人搞出来就是不同的东西,像物理跟化学之间,有一个叫物理化学,还有化学物理,但是毕竟它们是不同的学科。

对老百姓来说什么叫人工智能?因为人工跟智能,今天有一个想法很好,你说它是一个智能的想法,是一个聪明的想法,假设我们两个怎么写一篇文章,怎么办一个郊游,突然一个好的 idea,我说很智能的 idea,这就叫智能。

好的东西,好的想法,你想到了,我没想到就是智能。今天我们一起想解一个问题,不管是什么问题,你想到了,我没想到,我一定会夸奖你好聪明。

人工什么意思?今天几乎所有的这些好的算法、想法,我们尽量的让它用计算机去实现,就可以帮我们做事情,不用我们自己去做,因为所有的 idea 我们人也可以去做。

我们现在像云计算这些东西,写一个编程,让计算机去做,比如现在调度这些人,包括比如北京指挥交通,今天哪一个时候红灯应该亮,也可以派人指挥,也可以写一个程序指挥。如果写一个程序指挥,那就是人工,因为不是人去做。

所以,人工智能基本上所有高科技好的东西都叫人工智能。一般老百姓说,这个一定有智能,一看用计算机硬件、软件这些程序去实现,那就是人工智能了。

从这个角度来看,显然一百年以后,我们肯定会用计算机做很多事情,从这个角度来看,人工智能应该不会退去,因为我们永远会想出新的 idea,永远会有计算机做更多的事情。

你刚刚讲的数据也是,这样讲所有东西都是人工智能。这个我们在业界叫做数字化的转型,就是说,靠数据跟计算的能力,配合现在深度学习等等去做的这一套的东西,我们叫做数字化转型。

我只能说这套东西才真正是上半场,因为这里各行各业可以用的太多了,我们可以举太多例子,而且这个东西也没有泡沫,肯定要继续走下去,原因很简单,其实人做很多决定靠的不是大数据,我们甚至靠的是少数据或者无数据,人的很多智能是这样的。

我常常举的例子是爱因斯坦,当年他想到引力波这样的假说的时候根本没有数据,因为一百年以后,勉强用仪器才测到一点一点影子,人很多时候的假说,各式各样的假想就是一个没有数据,先说对不对,后来被证明了。所以,人的智慧很多是这个。

但是,大数据的智慧事实上人永远看不了那么多数据,我今天收集那么多数据,这对人的智力是一个加分的。比如你说下棋,他能够自己跟自己下,他看的很多数据,人怎么可能下那么多盘。所以,这些东西是可以帮助人的。

所以,大数据为主的这些智能,能够帮助做数字化转型,这个我觉得只是在上半场,有很多的机会。但是,人也不要妄自菲薄,人的这种小数据、灵感、idea,爱因斯坦为了找到宇宙中的定义想到引力波这个东西,我都不知道怎么想出来的,所以,这个方面我觉得还会有什么进展。

所以,我们也不用担心。如果你说人类的智能,或者机器能不能模仿人类智能,我告诉你,连影子都没有,不要说上半场,根本没有开始打,所以还是有很多这样的机会。

问:您有一张照片是研究院成立第一天拍的,有开复老师,当时他们在做什么工作,当时成立第一天的场景是什么?

洪小文:1998 年中国的确跟现在有很大的不同,你们在座可能很多还没有出生。1998 年我记得非常清楚,我在文章里面写背着机器做 Demo,还把腰给闪了,就是 11 月 5 号,现在在瑞吉酒店,在建国门那里,那个地方还在。

其实当时可以说仓促成军,为什么叫仓促成军呢?当时微软中国销售部门,和我们所谓现在的 R&D,当时也没有 D,有一个 office group,有一些小的 group 做本地化的工作。

所以我们是历史上可能仅有的,通常跨国公司,不要说跨国公司,全世界公司一定先做产品,然后有销售部门。微软 1975 年成立,到 1991 年 16 年才决定要成立研究院。

因为公司小,说要投资,这个 make sense,当时一个公司有三个部门,销售部门,卖今天的产品,赚今天的钱,产品部门要赚明天的钱,研究部门就是为未来技术做储备,不做产品,所以,要赚后天的钱。

如果今天的钱和明天的钱还没有赚到,所以不可能去赚后天的钱。所以,没有一个公司是先做 R 的,一般跨国公司,包括你说今天 BAT 到海外去,第一个是先去搞销售,能够赚钱,再看看能不能做当地开发的一些产品,然后才会放一个研究院在那边。微软倒着做,先做研究,然后才有开发。

大家知道比尔盖茨先生,1995 年结婚,我有机会带他到这边蜜月,我想他当时真的是看到中国蓬勃发展的机会。第二,他看到中国有这么多聪明的学生,而且学生又这么愿意做高科技、科学、工程这方面的东西。

他在 1995 年的时候就想,那时候我们研究院成立四五年,他觉得研究院要扩充。当时他就跟我的老板商量说,我们研究院要扩充。当时我的老板跟他说,我们来翻倍扩充。结果我们 Bill 说不对,3 倍,其实这是很了不起的。

你老板跟你说,你的部门要扩充,然后你说好,翻一番,你老板说翻一番不够,翻三倍,基本上就是这样的一个时间点。你要翻 3 倍,他们马上就想到,翻 3 倍不能只在美国扩充,在美国可能翻 1 倍,所以他们想要到海外扩充。

所以当时想到欧洲,所以 1997 年成立了剑桥研究院,当时 Dan Ling 先生,他是一个华人,虽然在意大利出生,在美国长大,他当然也是建议中国,加上比尔盖茨也看到中国的机会,所以他们决定在中国,基本上就是这样的背景。

当时很了不起,跟大家分享两件事情。

第一,这么早微软,尤其从最高层,比尔盖茨就看到中国的发展机会,所以比尔盖茨到今天也是中国的老朋友,昨天你们也看到他跟主席和主席的夫人见面。

第二,更了不起的,Bill 他在那时候就看到,虽然当时的中国跟今天没法比,但是他看到过去一百年这个世界的创新大部分是靠欧美在做,特别是从二战以后,很多担子都在美国身上。他说中国,刚好我们讲到中美,比尔盖茨先生这种情怀真了不起,他到很后来才跟我讲这个东西,我当时没想到这个点。

他当时跟我说,中国占了全世界 1/4 人口,对于未来的发展中国应该要负担至少 1/4 的创新,这样全世界也会更好。

问:我想问一下关于微软亚洲研究院今年成立 20 周年,想知道您觉得在这 20 年里,微软亚洲研究院有哪些比较重要的技术节点?

洪小文:我讲几个点。微软第一个节点就是说,在我们发表第一篇 SIGGRAPH 的 paper,SIGGRAPH 在计算机界有很多最好的论文,每年收的数量都是少于 100 篇,80 篇。在微软亚洲研究院之前,中国的论文在大部分这些会议上比较少入选。

微软亚洲研究院很大一个程度是跟着中国一起走到国际一流的计算机行业的这些顶尖会议的舞台上。因为我们几乎所有的 paper 都是跟学校的学生跟老师合作。所以,我们第一篇能够上 SIGGRAPH 当时非常难,这证明了我们可以做世界一流的科研。

然后到的 2004、2005 年,SIGGRAPH 大会上的 paper 我们占了 10%,10 篇里面有 1 篇都是从微软亚洲研究院出来的。从第一篇零的突破,到我们一个单位占全世界 10%,非常了不起。也因为这样,这是非常重要的一个点。这是 SIGGRAPH 这个例子,然后我们相对应的计算机视觉也在那时候也类似的这样就起来了。

所以,大概就在 2001 年第一篇,2005 年达到一个 10%,在 SIGGRAPH。所以,一开始我们发展起来,我们叫做多媒体,跟计算机图形学,视觉有关的。

第二个我们发展起来的是跟搜索、数据挖掘有关的,尤其我自己而言,我 2004 年来中国,我当时看到搜索,今天当然大家觉得搜索很普遍,当时在微软事实上还没有开始做搜索,我已经看到做搜索的重要性。所以,我们在微软亚洲研究院开始做很多搜索的一些工作,因为研究员得打第一炮。

我记得从 2007 年到 2011 年连续五年,我们在世界第一流搜索最顶尖的学术会议上我们是每一年都占 10%,刚刚说 SIGGRAPH 有一年达到 10%,搜索是连续五年,在搜索最红的时候,跟 Google 打的最火热的时候,我们是每一年都占全世界的 10%,10 篇有 1 篇是我们的。

我个人当然觉得非常欣慰,等于标志着我们第二个旗帜,而且搜索里面包括了数据挖掘自然语言理解等等。

同时,我们也成立了一个搜索技术中心,在 2005 年我们成立的,而且一开始是研究院的一部分,我还亲自领导,到 2007 年,当时沈向洋是院长,因为搜索做的太好了,我们把沈向洋贡献到搜索部门了,所以他离开了微软亚洲研究院,我就接院长了,所谓搜索技术中心到今天变成我们的互联网工程院接近 2000 人的规模。所以,2005、2007 年这个点又是一个节点。

到后来我们再做系统跟 Network,大概在 2009 年到 2013 年左右,我们做系统 Network 我们在国际一流会议,那更难,做系统跟 Network,国际上顶级大会收的 paper 更少,很多一年只收 20-25 篇,我们也做了突破,也是跟着中国一起走向世界的舞台。

系统跟网络通常报道的少,因为它是属于后台的技术,很难 Demo,每一个你们现在看到了不起的,不管是社交网络,不管是搜索,不管是什么云,后面都是靠系统跟网络支撑的。所以这是一个非常了不起的点。所以这又是一个节点。

最后讲到今天,今年 AI 这么红,而且今天每个人都喊做 AI 了。但其实以前做 AI 的大部分公司都不存在,我们做 AI 至少从 1991 年到现在 20 几年了,我们做的最久。

今年我们在机器阅读理解,第一次达到人的水平。我们的机器翻译也达到人类的水平,我觉得这些东西,尤其今天是多少人做,全世界每个公司都在做,今天在座的我们还要继续保持,得到技术上的领先,这肯定也是一个节点。

更不要说我们这样领先已经快三年了,两年多以前我们的图像识别,拿到世界冠军第一次超过人的水平。语音是在去年 2017 年超过人的水平。

我们不断领先,可能还有别的人会继续超过,学术就是这样,但是能够总是做到第一个,还是很有代表性的。更重要的是说,我们做了 20 年了,还不断在创新,我相信未来一定还有无数的创新的例子可以跟大家分享。

补充几个 AI 突破的具体信息如下:

1、2015 年 1 月,微软亚洲研究院开发的计算机视觉系统在 ImageNet 挑战赛中首次超越了人类物体识别分类的能力。同年 12 月,微软亚洲研究院设计发明的 ResNet(残差网络)以前所未有的神经网络深度,在物体识别等技术方面再次实现了重大突破。

2、2018 年,在由斯坦福大学发起的 SQuAD 文本理解挑战赛榜单上,微软亚洲研究院的 R-NET 和 NL-NET 模型分别在 EM 值和 F1 值上率先超越人类分数。

3、2018 年 3 月,由微软亚洲研究院与微软雷德蒙研究院共同研发的机器翻译系统在 newstest2017 的中-英测试中,达到了可与人类媲美的水平,这是首个在新闻报道的翻译质量上可比肩人类的翻译系统。

产业洪小文微软亚洲研究院
1
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面,智能多媒体,大数据与知识挖掘,人工智能,云和边缘计算,计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的研究,助力微软实现长远发展战略。通过与微软产品部门紧密合作,微软亚洲研究院将众多创新技术转移到了微软的核心产品中,如Office、Windows、Azure、Bing、Visual Studio、Xbox Kinect以及小冰、Cortana和Microsoft Translator等人工智能产品。

https://www.msra.cn/
沈向洋人物

微软全球执行副总裁,美国工程院院士。

洪小文人物

微软公司资深副总裁,微软亚洲研究院院长。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

暂无评论
暂无评论~