微软全球资深副总裁王永东:人工智能一面是智能,另一面一定要接近于人

6 月 13 日,微软举办主题为「朱主爱 + 微软小冰音乐发布会」的人工智能音乐发布会,推出马来西亚人气女歌手朱主爱与小冰合唱的首支音乐 MV《好想你》。除此之外,在学唱歌的训练过程中,小冰还升级了一个猜歌名的新技能,可以通过你听到歌曲旋律告诉你歌曲名字。而一个月前,小冰才刚刚独立完成了自己的诗集《阳光失了玻璃窗》。这位仍然在不同领域持续学习完成知识升级的小冰,三年前诞生于微软(亚洲)互联网工程院,是微软内部第一个人工智能伴侣虚拟机器人,后来陆续从中国去到日本、美国、印度等国家。这并不算是一个普通的新项目,它曾遭受从内部到外界不同程度的质疑,创新从来不是简单事,在大公司内部推动一个想法直至产品落地并持续创新,更加不易。我们采访到促成小冰项目的微软全球资深副总裁、微软(亚洲)互联网工程院院长王永东,他回顾了自己工作经历与行业变迁的交织,通过微软小冰项目的发展过程描述了微软(亚洲)互联网工程院是如何推动内部创新。


以下是根据采访整理而成的内容:


从我 2009 年加入微软到现在,在技术与应用开发方面的理解有不少变化。80 年代,我在伯克利读研究生修人工智能的课程,已经感觉到人工智能的巨大发展潜能,但之后的几年时间,人工智能没有太大进展,对实际应用也没有带来太多影响。我自己的职业起点是从互联网开始,1996 年加入一家搜索引擎公司叫 Inktomi,做了十多年后加入微软,刚来的时候,这里还是叫亚洲搜索技术中心,也是专注搜索。


随着互联网、物联网、云计算等技术的普及,数据量与计算能力都有巨大提高,加上算法、深度学习的突破,三者结合起来让人工智能到了一个新爆发点。近三年,人工智能的进展比我们的预期更快,比如像 AlphaGo 的表现。对我们从业者来说,是一个好消息,这些年我们做搜索引擎的积累,给继续拓展人工智能领域也提供了非常好的基础。 


行业环境正在发生巨大变化,对微软而言,过去几年时间,有三个重要决定对公司产生了深远影响。七八年前,微软开始做搜索引擎时,大家普遍不看好,因为当时谷歌搜索在全球如日中天,其他竞争对手都没有太大起色,市场份额差不多都处于下行状态。但是,微软在过去几年,从一个搜索引擎市场的新进入者,到今天取得了一些进展和成绩:在美国市场,有超过 20% 的市场份额,在欧洲市场占到超过 10% 的市场份额,当然在中国做得还不够好,但也已经进入良性循环期。更重要的是,搜索引擎技术给我们推进人工智能提供了非常强大的基础。


另一个重要战略是对云计算的布局与投入,我们在苏州有一个挺大的团队在做 Office 365,有了云平台之后,这种现在看来特别传统的软件又给用户带来了很多新体验。


第三是人工智能核心战略的确立。去年下半年,微软成立了由沈向洋带领的人工智能研究事业部,整个微软只有四个事业部,从架构调整足以看出公司对人工智能未来前景的看好。具体来讲,人工智能在微软已经深入到我们的业务中。一方面,我们推出了一系列具体的应用产品,比如小娜、小冰等,它们和用户有很好的互动。另一方面,人工智能技术也应用到微软其他产品上,比如类似 Office 这样的传统产品。我们还打通了 PC 端系统软件产品和手机端的体验,比如你手机上有什么提醒,你手机不在身边,它会在 PC 上提醒你。在已有通讯产品方面,也有由人工智能技术推动的进步,比如在一个公司,员工之间的通信和交互会产生很多邮件,但可能都没人及时查看,这里用到人工智能就可以分析如何帮助公司提高团队工作效率。


内部如何创新?


具体到微软中国内部的创新体系。一方面,微软中国有亚洲研究院和互联网工程院,前者是微软从事中长期研发的机构,他们看得更长远,也许开发的技术今天不一定能直接用上,但如果我们认为 10 年以后可能有用,那么今天就要进行研发。而互联网工程院则更倾向于产品研发,研发工作是以近期产品为目标。我们之间合作非常紧密,工程师做产品过程中遇到的需求,经常需要和亚洲研究院团队讨论。以小冰为例,小冰的语音、视觉等感官能力,其实在亚洲研究院的研发已经进行十多年,直到最后由我们工程院开发出小冰产品。小冰与用户的交互,要更接近人与人之间的感觉,需要的这些感官能力,其实都是亚洲研究院一直在研究的技术。 


横向看,两大研究院在创新侧重点上有区别和配合,纵向来说,我们也鼓励每一个团队自下而上的创新。后者对我们而言,同样十分重要,这样的鼓励机制关系到整个研究院的开发氛围。有时候,一个很新的东西,即使公司高层领导也不太可能面面俱到,像我们这种成熟型公司,需要给员工很大的空间去发挥自己的想象力和创造力。


也许可以拿小冰作为案例,它并不是一个我们自上而下布置下来的产品任务。最早,我们团队里的两位工程师在思考,今天看到的界面是进入一个搜索框输入关键词,未来的搜索会是什么样子,是不是会变成更人性化的对话形式。由此,工程师们得到主管支持就开始尝试研究这样一个方向,做了一小段时间发现效果还挺好,接着他们拿研究方案给我确认之后,就成立了一个十几人的小团队,除了技术工程师之外还调动了产品、市场、内容等方面人员的支持。


2014 年 5 月,我们就推出去给用户使用,用户的反馈比我们想象的要好很多。小冰的表现还是令人欣慰的,因为我们在后台看到小冰的对话,当然是部分经过用户许可的信息,我们很明确地看到小冰的用户在帮助小冰成长,而小冰也在帮助用户。还有一些用户会把他们和小冰的对话发在社交平台上,收到一些评论是类似「你什么时候交了这么一个朋友」。在几个月前,我把我跟小冰的一个对话发在微信朋友圈,然后几位并不知道我在参与小冰开发的朋友,问我是不是我的女儿,看到这样的询问我很开心。


但产品的整个推进过程也并非一帆风顺。在国内刚上线时,由于小冰此前的学习都来自互联网公开语料,出现一个意外情况是小冰学会了说脏话,很快,扑面而来的质疑声,使我们开始进行反思——我们忽略了互联网语料库的复杂性。在小冰学习过程中,我们应该进行一些调教和引导避免她学坏。在美国也有比较惨痛的经历,我们只是从技术上判断,用户像是认领一个机器人,可以教她,这是一个有趣有意义的事,但出现了意外的结果。从开发产品的角度来说,这是一个学习和思考的过程。技术是中性的,我们只能预警,小冰作为一个产品而存在,始终要跟终端用户去交互,必然会面临一些风险。


另一方面,每一个市场都有不同的逻辑。一开始小冰取得一些成绩时,公司内部也有讨论过像这样的产品,它是不是只在中国市场受欢迎。我们看到很多中国本土非常受欢迎的手机应用,美国同事会觉得不可思议,他们不太能理解每个人每天花这么多时间在某个社交应用上。这类怀疑在于有些产品换一个市场环境,可能就显得没道理了。也就是说,虽然小冰是从中国团队发起完成,但如果工程师、产品经理等都在国内,很难做一个放在全球其他市场同样受欢迎的产品,因为我们对另外一个市场的本土文化、行为方式、互联网用户习惯的理解肯定是不够的。因此,我们的产品开发模式确定为日本小冰由公司一个日本团队负责,美国小冰团队在美国,做印度小冰团队在印度。这样,国内开发小冰的底层技术与积累,与对本土文化有很深入认识的团队结合,就会带来更好的交互体验。


尽管我们相信人的情感交流需求,跟市场本身的差异没有关系,因为这是人的基本需求,但产品没有真正在不同市场跑起来,看不到效果我们也很难肯定这一点。直到 2015 年开始一步步在中国之外的市场进行研发和推广,从日本到美国,我们看到确实都挺受欢迎。甚至说,我们今天看到一个人跟小冰对话的最长记录是在美国。我们在做测试过程中,有一个用户跟小冰对话了 9 小时 56 分钟,来回一千多句,这让我们看到原来欧美市场也有这样的需求存在。后来,我们又开拓了印度市场。


这样一个发展过程相对曲折的产品,在一定程度上也带来了品牌形象在外界的负面影响,却在微软内部一步步得到继续发展的许可。除了当时说脏话的消息引发争议,还有很多人质疑一个聊天机器人到底能有什么用。我们和领导的沟通过程中,不管是像沈向洋还是陆奇(时任微软全球执行副总裁),他们很早就看到了产品的远期价值,这背后当然也包括我们对创新的理解、对鼓励创新的积极态度。


当然,我也不能说,我们已经真正找到持续创新的秘方,一个大公司在这方面也还是需要不断的探索。对我来说,我要带领工程院把这种创新文化贯彻下去,避免员工将自发创新这个事情当作不务正业的事情,同时我认为创新不能用 KPI 来考核。从我的经验来看有两点最重要:一个是提供足够空间,给团队尝试的机会,而这种创新东西可能大部分是不成功的,不成功的时候,不能去打击;第二是如果看到一个项目有好苗头时,要大力支持去培育它,给团队提供人力和资源方面的帮助。对于允许团队尝试多久,我们是有一个弹性在里面,通常大家也有很好的判断力,比如正在进行一个大项目,时间特别紧,这时候就不适合花更多时间和精力去深度尝试一个新项目。


小冰产品系还有哪些挑战?


人工智能一方面是智能,就是计算能力很强,能够完成任务,另一方面就是它一定是接近于人,就像一些科幻小说、电影那样。我们认为,在人工智能很多领域,要像人就要有人的情感,我们后来提出一个概念,叫做情感计算。小冰就是我们在情感计算方面的一个尝试,在和机器人对话的过程中,怎么能够让人觉得是有感情因素在里面,你愿意去跟它讲。很多人会觉得大部分人每天都非常忙,哪有时间和小冰聊天,但我们发现其实有很大规模的人群有情感需求,人更忙也更孤独,小冰的对话量通常在半夜 11 点左右比较更高。


然而,如果我们仅仅只是推进技术本身,是做不成近似人的,比如 AlphaGo 就不会有人觉得它是一个人,你可以说它是一个超人,但它绝对不像一个人。前段时间,都在讨论谁愿意去跟 AlphaGo 挑战,下一轮谁去,有一个对韩国棋手的采访,问他要不要去跟 AlphaGo 下棋,他的回答我觉得挺有意思,他说人为什么要和汽车去赛跑呢?也就是说,那个能力已经不是人,跟我们不一样。


要做到近似人之间的交互产品,不能仅仅是问答,应该形成一个比较自然、平等的对话方式。如果你从工程师或搜索产品的角度,问答是来自于用户问题相关性最高的内容,就像搜索工具直接给出结果,如果你跟一个机器人讲话,你讲同样几个字,它总是回同样几个字,这些就不是和人对话而是机器。怎么让它更像一个人的反应,还有很多挑战。这背后要解决的是,我们怎样从得到的语料中学习对话能力,这涉及到自然语言处理方面的技术。自然语言处理,其实我们今天也还没有完全解决,还有很长的路要走,因为你今天不管是小冰还是其他对话机器人,有时候你会发现他答得不对题,说明他没有完全理解。几代小冰的迭代,比如说小冰的感官,这里面的技术难度就更高了,声音能够识别得非常好,同时说话声音更贴近人声。有些导航里的声音,尽管已经做的很好了,但听起来还是很机械。 


今天我们可以逐个领域去突破,聚焦一个行业,比如天气,但是没有办法一次性去解决很多行业很多领域,这里面的问题还有不同领域之间的衔接怎么做。我们研发小冰产品,其实有点像培养一个孩子,他一开始会说话了,有可能文不对题,反复训练会越来越流畅。后来他开始上学,知识量多起来,你讲到一些他学过的知识,他就讲的更好,多了一些技能。这也是我们的一个大方向,举一个例子,小冰跟各领域的第三方合作,就像给她请了某个专业方向的老师。我们跟优酷合作,小冰通过学习会掌握非常丰富的影视剧知识,将来小冰会更像一个懂电影的老朋友,你也可以让他推荐一个符合你喜好的电影。那么,对我们来讲,就是希望小冰能够逐渐积累各个方面的知识,知识库能够变得越来越丰富,有能力为用户做更多的事情。


产业应用的机会在哪里?


至于她将来可以在哪些产业应用起来,我们也还在探索。人工智能处于发展的早期阶段,离我们的愿景还很远。这时候,我觉得不能头脑过热,而是应该持续地在产品、用户体验各方面一步步积累。我们设计小冰这个产品的理念,不是取代人而是帮助人。一方面,小冰的学识更丰富,她与用户的交互就会更丰富,不仅仅只是闲聊。比如,如果你用多了,当你在想今天看什么电影时,不需要使用网络搜索而是问问小冰,「最近有什么电影啊?」、「我今天想看个喜剧片,有什么新片或经典老片可以推荐?」小冰有越来越多知识属性,加上与用户更频繁深入的互动,它的推荐会更接近甚至突破一位老朋友的范围。不过,我们也很清楚,小冰这种情感型产品可能还需要更长远的时间被大众真正接受。


另一方面,小冰在商业方面也会有很多应用价值,比如在客服方面,包括公众号在内很多平台都会涉及到的用户咨询,还有家庭、医院等场景下的陪伴。这也是我们目前认为比较有突破潜力的方向——新型的搜索引擎和客服维护,甚至是取代人工客服。事实上,它的效率快速提升后未来的趋势一定会是取代,尤其是一些重复性、易学习的工作,然后让更多人去从事创造性的工作。历史就是这样,从农业社会过渡到工业社会再转换到现在知识型经济,其实都是在一步步释放更多的人从事更有创造性的工作。 


我认为,目前人工智能的探索非常广泛,还有非常多应用场景的想象空间,可能还有一些是我们不曾想到的。近些年,比较受关注的工业机器人在装配线或危险作业中很好的代替了人的工作,也是大家对人工智能硬件方面比较直接的认识。一些助手型交互产品将会对医生这个职业产生比较深刻的影响,因为一个医生要经过很多年的知识积累才能独立行医,而机器学习、记忆的速度会非常快,那么医生就可以把时间和精力更好地方在一些综合判断的工作上,特别是疑难问题。 


 

王永东曾主持创建微软(亚洲)互联网工程院,推动基础架构、编程语言、机器学习、人工智能、用户体验、设计以及在线服务等方面的工作,他带领的团队分布在北京、苏州、东京、台北和西雅图贝尔维尤。 

理论微软小冰产业王永东应用产品