编者按:自然科学一直以来追求的简单之美在人工智能领域似乎正面临着挑战,目前深度学习等主流AI技术趋向复杂和庞大。微软亚洲研究院副院长刘铁岩博士和他的团队一直致力于寻找机器学习中简单而美的规律,提出了对偶学习、推敲网络等重要技术突破,这些突破的背后,是刘铁岩博士“灵感驱动”的科研工作和前瞻的行业洞见。本文授权转载自微信公众号“北京青年周刊”。
刘铁岩博士,人工智能领域的国际知名学者。现任微软亚洲研究院副院长,国际电子电气工程师学会(IEEE)会士,国际计算机学会(ACM)杰出会员,美国卡内基梅隆大学(CMU)客座教授,英国诺丁汉大学荣誉教授,中国科技大学、中山大学、南开大学博士生导师。
刘博士的研究兴趣包括:机器学习、信息检索、数据挖掘等。他的先锋性工作促进了机器学习与信息检索之间的融合,被国际学术界公认为“排序学习”领域的代表人物,在网络搜索和计算广告学等方向取得了卓越的学术成果。近年来,刘博士在博弈机器学习、深度学习、强化学习、分布式机器学习等方面也颇有建树,发表了二百余篇学术论文,被他引近两万次,并多次获得最佳论文、最高引用论文奖。
“大到天体运行,小到微观世界。所有的规律都逃不出几个公式,若干个参数,一直以来自然科学所追求的正是这种简单之美。可是,目前主流的人工智能技术(深度学习)则有些背道而驰,它从来没有试图寻找如此简单而美的规律。”
我们坐在位于中关村的微软大厦14层的会议室,眼前正在说话的是人工智能领域的国际知名学者刘铁岩博士,他戴着黑框眼镜,身着一丝不苟的蓝色衬衫,正在描述对科学之美的体悟。他的说话方式是缓缓道来且条理明晰,为了让在场的人加深印象,他还会加上适当的手势以作辅助。
前段时间,刘铁岩所带领的微软亚洲研究院机器学习团队与自然语言计算组的同事,以及微软雷德蒙研究院的同事一起参与了在通用新闻报道数据newstest2017的中-英测试集上进行的机器翻译的研究。
为保证结果的可信度,该团队聘请了外部双语评估员,他们对比了微软团队的翻译结果与两组独立翻译的人类译文,评定结果为:微软机器翻译取得了至少和专业翻译人员相媲美的效果。
图为中-英新闻翻译能力的过程。
还记得震惊世界的AlphaGo大战李世石,一场人工智能与围棋世界冠军的超级对弈,被全人类通过网络直播共同围观。从此,人与机器的较量拉开了观战的序幕,也吸引了各大科技研究组织、知名企业乃至国家的广泛关注。
刘铁岩作为微软亚洲研究院副院长,同时也是一名人工智能领域的资深研究员。在他看来,现阶段的人工智能领域更像是一个黑匣子,所有人都在慢慢寻找它的边界,试图触碰它的内核,这个领域的研究一直在路上。
与刘铁岩的采访时间是几经交涉才明确下来的。对一直潜心于技术研究的他来说,加之相关管理工作傍身,日常的忙碌是可想而知的。果不其然,在与刘铁岩进一步的交谈中得知,他的日常行程几乎是无缝衔接。
早上七点多到公司,刘铁岩有两个小时的“充电”时间,这是雷打不动的。在这段完全属于自己的时间中,阅读文献是刘铁岩的充电方式,而后随着同事陆续到岗,刘铁岩也开始了自己的日常工作。
团队成员、合作伙伴、实习生、访客,不同的面孔,不同的会议,这些看似日常的安排都会成为刘铁岩技术创新的灵感源泉。他说自己是一位“灵感驱动”的研究员,“很多研究都不是苦思冥想得来的,相反是来自灵光一现的豁然开朗”,其中就包括两项促成了前文提到的中英翻译领域重大突破的独创关键技术——对偶学习和推敲网络。
起初,刘铁岩的团队发现很多的人工智能任务都是对称出现的,比如中译英与英译中,语音识别与语音合成等,这成为了“对偶学习”的灵感之源。而推敲网络的“推敲”二字则来源于人类阅读、写作时的一种行为方式,任务完成之后,并不当即终止,而是会反复推敲,逐步完善。根据这样的灵感启发,团队成员开始设计相应的机器翻译模型,并不断运行试错,直至最终取得突破性结果,站在媒体的聚光灯之下。
这两项技术的突破性意义不言而喻,语言沟通的障碍一直存在于人类社会中,如果可以打破语言障碍,无疑将有助于全人类的交流。但刘铁岩也表示,应该客观地看待这项成果,它是严谨的“学术论文”,表明在特定数据集上,在一定的标准之下,机器翻译取得了突破性进展,并不能说“机器翻译已经全面超越人类”。
对偶学习:解决对标注数据的依赖。利用人工智能任务之间存在的天然对称性(中-英翻译vs英-中翻译,语音识别vs语音合成,图像处理vs图像生成),建立机器学习的天然闭环,从而达到弱监督甚至无监督的学习效果。
谈及目前人工智能,或者机器学习领域,刘铁岩表示还有很多挑战需要解决。比如,几乎每一类机器学习进程都离不开“数据”的支撑。“如果没有燃料,机器学习这艘航空母舰也飞不起来。所以,我们经常将‘机器学习’叫做‘数据驱动的人工智能’,因为数据确实是极其核心的存在。”也正是因为目前的机器学习过分依赖数据,所以,如何减少对数据的依赖也成为亟待攻破的难题。
刘铁岩团队发明的对偶学习正是一种可以解决此问题的新型学习范式。它利用人工智能的对称性,可以为模型训练提供有效的反馈信号,在缺乏有标签训练数据的时候,也可以实现高效的学习。对偶学习不仅可以助力中英互译这类数据充足的学习任务取得提高,对小语种互译这类缺乏训练数据的学习任务也是大有用武之地。
刘铁岩形象地将目前主流的深度学习技术比喻为一个“黑盒子”,但是大多数人并不关心它的构造及原理,只是关心它的功能以及如何使用。这个黑盒子到底如何运作,尚未尽在人们的掌控之中。
由于缺乏可解释性,在很多关键性领域,例如医疗和军事,深度学习技术的应用还需要非常谨慎。刘铁岩的团队近期在符号学习、知识图谱自动推理等方面进行的有益尝试,其目的正是要解决这方面的问题。
每天晚上的九点钟,刘铁岩会准时出现在孩子的床边,这是父子二人的睡前故事时间,此时应该是刘铁岩最放松的时候。刘铁岩讲的故事并不是故事绘本或童话,而是涉及相对论、量子力学、天体物理、化学、生物等较为艰涩难懂的知识。刘铁岩将它们用通俗易懂的方式讲给孩子听,就成为了他口中的“科学故事”。据他所说,孩子总是听得津津有味。在我诧异于此的时候,刘铁岩说到:“研究员的后人可能都这样。”
刘铁岩在黑龙江长大,高中之前的日子都是在那片黑土地上度过的。他有着东北人天生的豪爽,也不否认自己从小就是学霸,是那种“一直都是第一”的类型。采访当天,正值高考第一天,回想起当年自己填报志愿的场景,刘铁岩深叹这是一次“阴差阳错”的经历。
在刘铁岩高考的时候,计算机教育尚未普及,高中开设的计算机课程更像是兴趣班,而且主要是教大家使用数据库。在填报志愿的时候,他特意去咨询了学校的计算机老师,向他请教计算机专业的发展前景。可是,老师对计算机专业的了解也十分有限,认为计算机就是一门“操作性”技能,学术价值不高,建议考虑其他学科。
于是,刘铁岩报考了清华大学的电子工程系,并且以全省英语考生最高分的成绩考入了清华大学这个录取分数线最高的专业。
谈及在清华大学本、硕、博连读的学习生活,刘铁岩的回答很热血,“在清华大学的学习,让我打下了坚实的数学基础、练就了很强的实操能力,以至于我什么方向都敢尝试,即使转型也不怕”。我想,这也是“三清”(清华毕业的学士、硕士、博士)毕业的刘铁岩在微软亚洲研究院三次转型的动力所在吧。
说起来也许是冥冥中早已注定。虽然当年填报志愿的时候,刘铁岩没有选择计算机专业,但是博士毕业之后,进入了微软亚洲研究院,却开始了长达15年的计算机科学领域的研究之路。
研究院的自由氛围为他提供了一个理想的学术环境。在微软亚洲研究院,他从博士期间所从事的信号处理方向的研究转入了信息检索领域,开始了对互联网搜索的探索。后来,他被搜索背后的经济规律所吸引,又开始研究计算广告学和算法博弈论。
而第三次转型,他则进入了人工智能和机器学习的核心领域。谈起最近这次转型的动因,刘铁岩的表述透露着一位研究员的伟大愿景,“因为人工智能这个领域能够对各个行业产生更加本质且广泛的影响”。
在很多人眼中,科学研究的周期一般都十分漫长。在研究伊始,从获得研究灵感到将其付诸实践,创造出原型系统需要多久时间呢?刘铁岩回答:“其实并不需要很长的时间。”
那么,大量的时间消耗在哪个步骤中呢?
“其实,从第一个原型系统产生到最终形成完善的体系,并且对其他领域产生辐射作用,这是一个相当漫长的过程。这需要研究人员清楚地了解研究雏形和实用技术之间的差别,通过不懈的努力,把研究成果扶上马、送一程,最终转化到产品之中。”
刘铁岩带领的机器学习组的研究员们都是多面手,既能够发明让人眼前一亮的新技术,又懂得如何和产品部门、合作伙伴共同协作,让这些技术落地生根,产生更大的影响力。
我们身处的人工智能的第三次浪潮和深度学习的进展密不可分。但深度学习本身并不是一个全新的概念,它的成功主要归功于三大因素——大数据、大模型、大计算
如今,在微软必应搜索引擎、广告系统、Windows操作系统、Azure云计算平台、Xbox游戏机、微软小冰聊天机器人等诸多产品中,都有着来自刘铁岩团队发明的人工智能技术。
微软亚洲研究院是一个工业研究院,拥有很多微软产品线的资源,这不仅为研究人员的技术提供了用武之地,也为研究思路的产生提供了丰富的“刺激信号”。
2017年,微软亚洲研究院成立了“创新汇”,旨在用微软的人工智能技术去帮助中国的传统产业做数字化、智能化转型。这也为刘铁岩团队的人工智能技术开启了新的出口。
当人工智能技术遇到量化投资、资产配置、风险控制、需求预测、路径规划、物流调度、基因工程、精准医疗等,会碰撞出怎样新的火花呢?
近期,刘铁岩正在负责这些领域对外合作的相关项目。刘铁岩分析说,人工智能赋能传统行业大有可为,它可以帮助金融行业更加充分地利用海量数据、处理市场的动态变化、分析和预测投资人的行为、对投资组合进行优化;可以帮助物流和运输行业利用供应链信息和海量数据对需求和供给进行更加准确的预测、利用强化学习使路径规划更加灵活地适应环境的动态变化和更好地处理非线性的业务逻辑;可以帮助医疗健康行业进行更加快捷和准确的基因测序、发掘出基因和免疫信息与疾病之间的对应关系、做更加精准的诊断和药物研发,等等。
癌症一直是人类最需要迫切解决的医学难题之一,近两年微软亚洲研究院的研究员通过利用人工智能领域中的计算机视觉和机器学习技术来辅助医生对病理切片中的癌细胞进行识别和判断
与来自传统行业的合作伙伴一起进行联合研究,为研究员们打开了通向更多领域的方便之门。“我们的研究员接受到了更加广泛和多样的刺激信号,开始了解这些产业,了解用户需求,这远比闭门造车要高效很多。人工智能是一个飞速发展的行业,也是逆水行舟,不进则退的行业。
现在,人工智能的应用范围非常广,为了发明更好的人工智能技术,我们需要跟合作伙伴共同去探索可以与人工智能应用相连接的领域。在实际问题的驱动下,形成抽象的学术问题,发明相应的技术,再反哺应用落地,这是一个良性的研究循环。”刘铁岩如是说。
Q:《北京青年》周刊 A:刘铁岩
Q1:你曾经说人工智能的深度学习过度复杂又过度简单,如何理解这两个反义词?
A:我们说深度学习过度复杂是因为它没有去试图探究世界的简单之美。我们这个世界存在着本质的规律,看起来很复杂的世界,背后往往是被几个二阶的偏微分方程所支配。然而现在主流的人工智能技术并没有去深挖这些简单而深刻的规律,而是用非常复杂的模型去拟合数据的复杂表象,以繁治繁。
我们说深度学习过度简单,是因为它试图用一种单一函数拟合的学习模式来处理各种复杂的问题。它忽略了人类智能本身的复杂性和多样性,比如人类的语言系统、知识传承、社会分工、群体智慧等,都远远超出了一个简单的函数拟合的范畴。
Q2:你在与各个领域的合作伙伴商谈时,他们对于人工智能的态度如何?
A:他们对于人工智能的态度都是十分正面的。合作至今,人工智能不仅提升了我们的研究,也让合作伙伴看到了人工智能技术的巨大潜力。我们在智能投资、智能物流领域取得的突破性进展为合作伙伴带来了巨大的经济利益,也为他们的未来发展提供了强有力的保障。
同时经过合作,他们也了解到人工智能的能力范围,人工智能不是去抢他们员工的饭碗的,而是帮助他们的员工更加高效地工作。这对于破除“人工智能威胁论”起到了非常积极的作用。
Q3:在你看来,人工智能扮演了一个怎样的角色?
A:人工智能是一种工具,不是生命体,它本身不会思考,没有自主意识,说得直白点,其实就是一群聪明人编写的复杂程序。人工智能在计算力、记忆、模式识别等方面与普通人相比有明显的优势,但是在创造性、推理决策等方面,还远远没有达到人类的水平。因此,我们所提倡的是人机协作、人机共进化,让人工智能和人类取长补短,共同进步。
刘铁岩所在的微软亚洲研究院人工智能研究团队与东方海外航运携手合作,运用深度学习(Deep Learning)和强化学习(Reinforcement Learning)技术,优化现有的航运操作。东方海外航运每月需处理和分析超过3000万条船舶数据,应用人工智能技术及机器学习服务,有助于进行船期表和泊位活动的预测分析。据悉,此次合作预计每年为东方海外航运节省1,000万美元的运营成本。
Q4:听说你带领的实习生团队有一个很特殊的文化?
A:是的,我们的团队有一种“吵架文化”,就是在头脑风暴过程中不相信权威、 不有所保留,简单直接地表达自己的观点,我一直坚信真理不辨不明。
Q5:在这个团队中会有人员选择的标配吗?
A:在实践中,我发现了做研究的一个黄金组合。我们的实习生很多元,有来自各个高校、不同专业的学生,而不同专业的学生各有特色。比如,物理或做电子专业的学生直觉非常好,他们有很强的对实际问题进行数学建模的能力;数学专业的人非常严谨,可以对数学模型进行分析和理论论证;计算机专业的学生实现能力很强,可以对模型进行大规模的实现和验证。一个由电子或物理专业、数学专业、计算机专业的学生所组成的项目组,通常会发生强烈的化学反应,做出单方面任何一种人都做不到的了不起的事情。
Q6:目前你也在高校带学生吗?
A:是的,但我觉得自己并不是严格意义上的老师。我和学生们的关系更像是合作者。我是那种压抑不住内心想要去表达自己看法的人,所以给同学们直接的刺激信号可能更多一些。
如今的互联网把世界变平了,国内国外的学术环境没有太大差别,比我们读书的那个年代好太多了。在这么好的学术环境下,学生们如果能够更加珍惜、更加努力,那么他们的成长速度一定会比我快5年,甚至是10年,一定会取得比我大得多的学术成果。作为他们的导师和合作者,我拭目以待!