Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

自然语言处理顶会CoNLL 2019最佳论文揭晓!

EMNLP和CoNLL大会堪称自然语言处理(NLP)领域的年度盛宴。

EMNLP和CoNLL大会堪称自然语言处理(NLP)领域的年度盛宴。

11月3日,EMNLP-IJCNLP 2019在中国香港正式开幕。

EMNLP是由国际语言学会(ACL)下属的SIGDAT小组主办的自然语言处理领域的顶级国际会议,在计算语言学类别下影响力排名全球第二。EMNLP每年举办一次,今年与IJCNLP联合举办。

据悉,EMNLP-IJCNLP 2019共收到有效投稿2877篇,录用683篇,其中长论文465篇, 短论文218篇,录用率为23.7%。其接收的论文覆盖了对话交互系统、信息抽取信息检索和文档分析、词法语义、语言学理论、认知建模和心理语言学机器翻译与句子级语义学、情感分析和论点挖掘、文本挖掘和NLP应用、文本推理等自然语言处理领域众多研究方向。

EMNLP2019接收的全部论文现已公布,地址如下:

https://www.aclweb.org/anthology/events/emnlp-2019/#d19-1

与此同时,另一个颇具影响力的会议CoNLL2019 也与 EMNLP同期召开,时间为11月3日-4日。

CoNLL是由ACL下属的 SIGNLL 主办的计算自然语言学习会议,本届大会共录用论文97篇。

CoNLL2019录用论文也已全部公布,地址如下:https://www.conll.org/accepted-2019

11 月 4 日,CoNLL2019最佳论文奖与特别奖相继揭晓。

(图片来自CoNLL2019官方推特)

最佳论文奖

How Does Grammatical Gender Affect Noun Representations in Gender-Marking Languages?

作者:Hila Gonen, Yova Kementchedjhieva, Yoav Goldberg(巴伊兰大学,哥本哈根大学,艾伦人工智能研究所)

论文地址:https://www.aclweb.org/anthology/K19-1043.pdf

语法性别如何影响性别标记语言中的名词表征?

论文摘要:多种自然语言为无生命的名词赋予了语法形式上的性别。在这些语言中,与标记了性别的名词相关的词会发生改变,以符合这些名词的性别。我们发现这会影响无生命名词的词向量表征,使得同性别的名词之间的距离比不同性别的名词之间的距离近。而“嵌入除偏(embedding debiasing)”方法并不能消除这种性别影响。我们展示了一种可以有效消除这种影响的方法,即在训练词嵌入向量的时候,将语法上的性别标记从其上下文中去掉。无论在单语环境中还是跨语言环境中,修正语法性别带来的偏差可以改进词嵌入向量结果。我们发现尽管可以去除语法上的性别信号,但是这并不是一件容易的事,只有仔细地运用面向语言的词法分析器,才能获得好的结果。

特别奖 - 受人类语言学习和处理启发的最佳研究论文

Say Anything:Automatic Semantic Infelicity Detection in L2 English Indefinite Pronouns

作者:Ella Rabinovich, Julia Watson, Barend Beekhuizen, Suzanne Stevenson(多伦多大学计算机科学系,语言研究部)

论文地址:https://www.aclweb.org/anthology/K19-1008.pdf

说“anything”:非英语母语人士使用英语不定代词的自动不当语义检测

面向第二语言学习者错误检测的计算研究,主要针对的是初到中级学习者的明显语法异常。而我们关注的是对各种熟练级别的非英语母语人士使用不定代词的细微差别的感知。我们首先提出了语法上的理论假设,并经验证了英语学习者使用不定代词所面临的挑战。接着我们提出并评估了一种检测异常使用模式的方法,证明了深度学习结构对于解决细微语义差别相关的问题是有前景的。

最佳论文荣誉提名

Analysing Neural Language Models: Contextual Decomposition Reveals Default Reasoning in Number and Gender Assignment

Jaap Jumelet, Willem Zuidema, Dieuwke Hupkes

论文地址:https://www.aclweb.org/anthology/K19-1001.pdf

On the Limits of Learning to Actively Learn Semantic Representations

Omri Koshorek, Gabriel Stanovsky, Yichu Zhou, Vivek Srikumar, Jonathan Berant

论文地址:https://www.aclweb.org/anthology/K19-1042.pdf

特别奖-最佳研究论文荣誉提名

Using Priming to Uncover the Organization of Syntactic Representations in Neural Language Models

Grusha Prasad, Marten van Schijndel, Tal Linzen

论文地址:https://www.aclweb.org/anthology/K19-1007.pdf

Large-Scale Representation Learning from Visually Grounded Untranscribed Speech

Gabriel Ilharco, Yuan Zhang, Jason Baldridge

论文地址:https://www.aclweb.org/anthology/K19-1006.pdf

CoNLL每年还会举办系列评测,这是自然语言处理领域影响力最大的国际技术评测,有力推动了自然语言处理各项任务的发展。

在今年8月举办的CoNLL-2019国际跨框架语义分析评测中,哈工大社会计算与信息检索研究中心(HIT-SCIR)取得了第一名的好成绩,这是SCIR实验室继取得CoNLL-2018国际多语言通用依存分析评测第一名后再次取得该国际技术评测的冠军。

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业自然语言处理CoNLL 2019论文
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

Julia技术

Julia 是MIT设计的一个面向科学计算的高性能动态高级程序设计语言,项目大约于2009年中开始,2018年8月JuliaCon2018 发布会上发布Julia 1.0。据介绍,Julia 目前下载量已经达到了 200 万次,且 Julia 社区开发了超过 1900 多个扩展包。这些扩展包包含各种各样的数学库、数学运算工具和用于通用计算的库。除此之外,Julia 语言还可以轻松使用 Python、R、C/C++ 和 Java 中的库,这极大地扩展了 Julia 语言的使用范围。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

词嵌入技术

词嵌入是自然语言处理(NLP)中语言模型与表征学习技术的统称。概念上而言,它是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。

语义分析技术

语义分析是编译过程的一个逻辑阶段, 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查,进行类型审查。语义分析是审查源程序有无语义错误,为代码生成阶段收集类型信息。比如语义分析的一个工作是进行类型审查,审查每个算符是否具有语言规范允许的运算对象,当不符合语言规范时,编译程序应报告错误。如有的编译程序要对实数用作数组下标的情况报告错误。又比如某些程序规定运算对象可被强制,那么当二目运算施于一整型和一实型对象时,编译程序应将整型转换为实型而不能认为是源程序的错误。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

词法分析技术

词法分析是计算机科学中将字符序列转换为标记序列的过程。进行词法分析的程序或者函数叫作词法分析器,也叫扫描器。词法分析器一般以函数的形式存在,供语法分析器调用

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

文本挖掘技术

文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程,产生结构化数据,并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性,新颖性和趣味性。

信息抽取技术

信息/数据抽取是指从非结构化或半结构化文档中提取结构化信息的技术。信息抽取有两部分:命名实体识别(目标是识别和分类真实世界里的知名实体)和关系提取(目标是提取实体之间的语义关系)。概率模型/分类器可以帮助实现这些任务。

语义学技术

语义学,也作“语意学”,是一个涉及到语言学、逻辑学、计算机科学、自然语言处理、认知科学、心理学等诸多领域的一个术语。虽然各个学科之间对语义学的研究有一定的共同性,但是具体的研究方法和内容大相径庭。语义学的研究对象是自然语言的意义,这里的自然语言可以是词汇,句子,篇章等等不同级别的语言单位。

语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

推荐文章
暂无评论
暂无评论~