一鸣 张倩报道

ACL 2019 接收论文榜单发布,我们做了可视化分析

自然语言处理领域顶级会议 ACL 将于 7 月 28 日至 8 月 2 日在意大利佛罗伦萨举行。今天,ACL 2019 官方网站公布了接收论文列表,机器之心对今年接收论文的关键词等信息进行了可视化分析。

接收论文列表:http://www.acl2019.org/EN/program/papers.xhtml

在论文接收列表中,我们可以看到清华大学的孙茂松组共有 9 篇论文被接收,来自加州大学圣芭芭拉分校(UCSB)的王威廉组(William Yang Wang)有 8 篇论文被接收,全组共有 7 长两短;哈工大刘挺教授也有 3 篇论文入选。

香侬科技 CEO、人民大学信息学院副教授李纪为也有两篇论文入选了 ACL 2019。

论文数量爆炸式增长

今年 3 月,ACL 官方公布了今年大会收到的投稿数量——2906 篇,相比于去年的 1544 篇出现了大幅增长。除去撤回论文等,ACL 2019 共收到有效论文 2694 篇,包括 1609 篇长论文和 1085 篇短论文。

据统计,ACL 2019 共接收了其中的 765 篇论文,接收率为 25.8%(去除了 Student Workshop 论文)。相比于前两年 24% 左右的接收率,今年 ACL 的论文接收率略有上升。

近 20 年来 ACL 大会论文投递数量、评审人员数量和(高级)领域主席数量变化趋势图

信息提取与文本挖掘机器学习机器翻译领域提交论文数量最多

提交论文数量位列前三的领域与 ACL 2018 一致:

  • 信息提取与文本挖掘(占 ACL 2019 有效提交论文总数的 9.2%,去年该领域论文所占比例为 11.5%);

  • 机器学习(8.2% ACL 2019 vs. 7.4% ACL 2018);

  • 机器翻译(7.7% ACL 2019 vs. 8.3% ACL 2018)。

各领域提交论文情况。

接收论文列表可视化分析

各类论文数量统计

今年的 ACL 共接收了 765 篇论文,其中长论文 447 篇,短论文 213 篇,System Demonstration 论文 34 篇,student workshop 论文 71 篇。

各类 Paper 数量

各类 Paper 占比

关键词分析

通过对接收论文列表进行统计,机器之心找出了今年 ACL 接收论文的十大关键词,如下图所示。从图中可以看出,除了「neural」、「learning」、「machine」等常见高频词外,「embedding」、「question」、「generation」等相关子领域名词也成为了今年的热点关键词。

Top10 关键词占比

词云

机器之心对所有论文的标题关键词制作了词云,展示整体关键词的词频分布情况。


产业机器学习ACL 2019
相关数据
刘挺人物

哈工大人工智能研究院副院长,国内NLP方向领军人物。

相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

文本挖掘技术

文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程,产生结构化数据,并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性,新颖性和趣味性。

孙茂松人物

孙茂松,教授,博士生导师,曾任清华大学计算机科学与技术系系主任,现任教育部在线教育研究中心副主任、清华大学计算机系党委书记、清华大学大规模在线开放教育研究中心主任。

推荐文章
暂无评论
暂无评论~