字节跳动李航博士入选2019 ACL Fellow,成为第五位入选华人学者

近日,2019 ACL Fellow 名单出炉,字节跳动李航博士入选,成为 ACL 第五位华人 Fellow。

以人类语言为研究对象的「自然语言处理」(Natural Language Processing,NLP)是人工智能最重要的研究方向之一。在自然语言处理领域,ACL 是世界上影响力最大、也最具活力的国际学术组织,成立至今已有 57 年历史,会员遍布世界 60 多个国家和地区,代表了自然语言处理领域的世界最高水平,ACL 会士(ACL Fellow)则是在本领域取得突出成就的ACL会员。

当地时间 11 月 25 日,ACL 公布了 2019 年度的 ACL Fellow共计 6 位,其中包括字节跳动人工智能实验室总监李航博士,由此成为第 5 位当选 ACL Fellow 的华人学者、第 2 位大陆科学家

ACL 会士评选委员会在对李航博士的评语中写道:

「他对信息检索,特别是排序学习做出了基础性贡献,在深度学习对话生成方面做出了突出贡献,并且促进了中国自然语言处理(NLP)的发展和商业化。」

此外,今年新入选的 ACL Fellow 还包括哈佛大学 Higgins 自然科学教授 Barbara Grosz、多伦多大学计算机科学教授 Graeme Hirst、爱丁堡大学信息学院自然语言处理教授 Mirella Lapata、日内瓦大学计算学习与计算语言学教授 Paola Merlo 和德国海德堡理论研究所、海德堡大学计算语言学系「荣誉教授」Michael Strube。

2019 年度唯一入选华人学者

李航博士现任字节跳动人工智能实验室总监,北京大学、南京大学客座教授。他是 IEEE 会士、ACM 杰出科学家、CCF 高级会员,研究方向包括信息检索自然语言处理,统计机器学习,及数据挖掘

学生时代,李航博士曾在日本求学多年。他硕士毕业于日本京都大学电气工程系,之后又在东京大学取得计算机科学博士学位。而且,他取得博士学位仅用了四年。

博士毕业后,他曾先后担任日本 NEC 公司中央研究所研究员、微软亚洲研究院高级研究员与主任研究员、华为诺亚方舟实验室首席科学家、主任。2017 年,李航博士宣布从华为离职,加入字节跳动。

从本次 ACL Fellow 的增选结果中可以看到,李航博士不仅是今年入选的唯一一位华人,还是唯一一位业界代表。这和他的学术成就密不可分。

李航博士一直活跃在相关学术领域,曽出版过三部学术专著,并在顶级国际学术会议和顶级国际学术期刊上发表过上百篇学术论文,包括 SIGIR、WWW、WSDM、ACL、EMNLP、ICML、NeurIPS、SIGKDD、AAAI、IJCAI 等。他在 Google Scholar 上的被引量超过 19000 次,h-index 高达 65

他和同事的论文获得了 KDD 2008 最佳应用论文奖,他指导的学生获得了 SIGIR2008、ACL 2012 最佳学生论文奖。

李航博士还在顶级国际学术会议和顶级国际学术期刊担任许多重要工作,如大会程序委员会主席、资深委员及委员、期刊编委,包括 SIGIR、WWW、WSDM、ACL、NAACL、EMNLP、NeurIPS、SIGKDD、ICDM、ACML、IJCAI 等。

对于普通机器学习入门者来说,李航博士的名字也并不陌生,他所编写的《统计学习方法》一书,可谓是机器学习入门的宝典,今年 5 月份刚上线了第二版。这本书包含了包含了众多主要的监督和无监督学习算法与模型,是了解机器学习最好的教材之一。前段时间,清华大学深圳国际研究生院的袁春教授还为这本书制作了相关课件

历届华人 ACL Fellow

自 2011 年开始评选 ACL Fellow 以来,ACL 学会共迎来了 57 位会士,但包括今年入选的李航博士在内仅有 5 位华人学者,其余 4 位分别是香港科技大学吴德恺教授、新加坡国立大学黄伟道教授、谷歌高级研究科学家林德康百度首席技术官王海峰博士

2011 ACL Fellow 香港科技大学计算机科学与工程系吴德恺教授。

吴德恺教授系加州大学伯克利分校博士和多伦多大学博士后,之后于 1992 年加入香港科技大学任计算机科学与工程系教授。2011 年 12 月,他当选为 ACL Fellow,以表彰其「对机器学习和反向转换文法做出的突出贡献,从而将句法和语义模型整合到统计机器翻译范式中」。

2012 ACL Fellow 新加坡国立大学计算机科学系黄伟道教授。

黄伟道教授系德克萨斯大学奥斯汀分校博士,他的研究重点是自然语言处理信息检索,精通于语义处理和语义语料库的开发。他曾获得过 SIGIR 1997 和 EMNLP 2011 最佳论文奖,并担任过 EMNLP 2008、ACL 2005 和 CoNLL 2004 大会的程序共同主席。2012 年当选为 ACL Fellow。

2013 ACL Fellow 林德康教授。

林德康教授曾任加拿大 Alberta 大学计算机教授、Google 研究院高级管理科学家、Google 搜索问答系统创始人及技术负责人,奇点机智联合创始人兼 CTO,如今他重回谷歌担任高级研究科学家。林德康作为主要发明人申请了多项美国专利,在自然语言处理及理解领域发表 90 余篇论文,被引用 14000 余次,并多次担任计算语言最高学术机构国际计算语言学协会 ACL 的领导职务,包括:ACL 2002 程序委员会联合主席、ACL 2011 大会主席、ACL 北美分会执行委员等,并当选 2013 年 ACL Fellow。

2016 ACL Fellow 百度 CTO 王海峰。

作为百度集团首席技术官,王海峰负责百度搜索、语音搜索、图像搜索、信息流、手机百度、小度机器人、自然语言处理知识图谱、互联网数据挖掘等业务,并曾创始了百度语音、图像、推荐及个性化、深度学习、度秘等多个技术方向。由王海峰领导研发的百度翻译产品目前支持 28 种语言、756 个方向的自动翻译,并于 2015 年 5 月上线了全球首个融合神经网络机器翻译统计机器翻译模型的大规模在线翻译系统。其领导的「基于大数据的互联网机器翻译核心技术及产业化」还荣获了 2015 年国家科技进步奖,这也是我国互联网企业首次获得该奖项。

2016 年,王海峰当选 ACL Fellow,成为了首位获此荣誉的中国大陆科学家。会士评选委员会在对王海峰的评语中写道:王海峰在机器翻译自然语言处理和搜索引擎技术领域,在学术界和工业界都取得了杰出成就,对于 ACL 在亚洲的发展也做出了卓越贡献。

评选结果链接:https://www.aclweb.org/portal/content/acl-fellows-2019

产业字节跳动统计学习方法吴德恺黄伟道林德康王海峰李航ACL
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面,智能多媒体,大数据与知识挖掘,人工智能,云和边缘计算,计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的研究,助力微软实现长远发展战略。通过与微软产品部门紧密合作,微软亚洲研究院将众多创新技术转移到了微软的核心产品中,如Office、Windows、Azure、Bing、Visual Studio、Xbox Kinect以及小冰、Cortana和Microsoft Translator等人工智能产品。

https://www.msra.cn/
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
奇点机智机构

奇点机智成立于2014年11月,致力于通过机器智能改善用户体验,让人机交互更加简单自然。“小不点”是由奇点机智为安卓系统打造的智能应用助理,用户可通过对话的方式操控手机应用中的各项功能,目前可对200多款应用程序进行操作。“就一句话的事”,即可满足社交、娱乐、购物、支付、出行等需求。另外,用户可以根据个性化需求录制新技能,并可发布分享给其他用户,让“小不点”越用越智能。此外,奇点机智同时为应用开发者、运营者、产品者提供NI开发者平台,无需编码或调用第三方应用API,即可根据用户需求添加语音指令,极大提升产品体验。奇点机智曾获真格基金100万美元天使轮投资,以及襄禾资本/NEA 500万美元A轮投资;于2017年11月被评为“中关村高新技术企业”。

李航人物

李航,毕业于日本京都大学电气电子工程系,日本东京大学获得计算机科学博士学位。北京大学、南京大学兼职教授。曾任日本NEC公司中央研究所研究员,微软亚洲研究院高级研究员与主任研究员、华为技术有限公司诺亚方舟实验室主任,是《统计学习方法》作者。

林德康人物

林德康,Naturali 奇点机智联合创始人兼 CTO,曾任加拿大 Alberta 大学计算机教授、Google 研究院高级管理科学家、Google 搜索问答系统创始人及技术负责人,作为主要发明人申请了多项美国专利,在自然语言处理及理解领域发表 90 余篇论文,被引用 14000 余次,并多次担任计算语言最高学术机构国际计算语言学协会 ACL 的领导职务,包括:ACL 2002 程序委员会联合主席、ACL 2011 大会主席、ACL 北美分会执行委员等,并当选 ACL Fellow(该头衔是对 NLP 领域杰出人才的最高认可,目前仅有 4 位华人/华裔获得此荣誉)。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

图像搜索技术

图像搜索是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。图像搜索方法一般有两种:通过输入与图片名称或内容相似的关键字来进行检索;或者通过上传与搜索结果相似的图片或图片URL进行搜索。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

语料库技术

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为"body of text"。

统计机器翻译技术

随着统计学的发展,研究者开始将统计模型应用于机器翻译,这种方法是基于对双语文本语料库的分析来生成翻译结果。这种方法被称为统计机器翻译(SMT)

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

问答系统技术

问答系统是未来自然语言处理的明日之星。问答系统外部的行为上来看,其与目前主流资讯检索技术有两点不同:首先是查询方式为完整而口语化的问句,再来则是其回传的为高精准度网页结果或明确的答案字串。以Ask Jeeves为例,使用者不需要思考该使用什么样的问法才能够得到理想的答案,只需要用口语化的方式直接提问如“请问谁是美国总统?”即可。而系统在了解使用者问句后,会非常清楚地回答“奥巴马是美国总统”。面对这种系统,使用者不需要费心去一一检视搜索引擎回传的网页,对于资讯检索的效率与资讯的普及都有很大帮助。从系统内部来看,问答系统使用了大量有别于传统资讯检索系统自然语言处理技术,如自然语言剖析(Natural Language Parsing)、问题分类(Question Classification)、专名辨识(Named Entity Recognition)等等。少数系统甚至会使用复杂的逻辑推理机制,来区隔出需要推理机制才能够区隔出来的答案。在系统所使用的资料上,除了传统资讯检索会使用到的资料外(如字典),问答系统还会使用本体论等语义资料,或者利用网页来增加资料的丰富性。

香港科技大学机构

香港科技大学(The Hong Kong University of Science and Technology),简称港科大(HKUST),为东亚研究型大学协会、环太平洋大学联盟、亚洲大学联盟、中国大学校长联谊会、京港大学联盟、粤港澳高校联盟重要成员,并获AACSB和EQUIS双重认证,是一所亚洲顶尖、国际知名的研究型大学。该校以科技和商业管理为主、人文及社会科学并重,尤以商科和工科见长。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
加州大学伯克利分校机构

加利福尼亚大学伯克利分校,简称加州大学伯克利分校,又常被译为加利福尼亚大学伯克莱分校,位于美国加利福尼亚州旧金山湾区伯克利市,是一所世界著名的公立研究型大学。其许多科系位于全球大学排行前十名,是世界上最负盛名的大学之一,常被誉为美国乃至世界最顶尖的公立大学。

https://www.berkeley.edu/
语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

对话生成技术

对话生成是能经由对话或文字进行交谈的计算机程序任务。能够模拟人类对话,通常以通过图灵测试为评估标准。

推荐文章
暂无评论
暂无评论~