Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱报道

把ACL论文「几乎一字不落」抄到AAAI 2021上,作者回应:属借鉴

AI 领域学术不端又来,一篇 AAAI 2021 论文涉嫌抄袭 ACL 2020 论文,有人还贴了查重结果。

几个月以来,学术圈不端行为屡被爆出,先是港科大硕士 ICCV 论文涉嫌抄袭,后有北理工硕士生「一字不差」抄袭顶会投稿;就在不久之前,有 B 站博主发视频称复旦大学重点实验室疑似抄袭美国教授的论文,并列出了一系列抄袭证据。

近日,又有知乎网友爆出一篇 AAAI 2021 与 ACL 2020 论文几乎完全一致:「文字部分几乎一字不落的重复。」

涉嫌抄袭的论文是 AAAI 2021 的一篇论文,论文为《 Multi-modal Graph Fusion for Named Entity Recognition with Targeted Visual Guidance 》。论文作者来自东南大学、苏州大学。

论文地址:https://www.aaai.org/AAAI21Papers/AAAI-2753.ZhangD.pdf

上述论文疑似抄袭了 ACL 2020 的一篇论文《 A Novel Graph-based Multi-modal Fusion Encoder for Neural Machine Translation 》,论文作者来自厦门大学等研究机构。

论文地址:https://arxiv.org/pdf/2007.08742.pdf

下面我们来看看这两篇论文存在哪些相似的地方。

两篇论文内容对比

首先,论文摘要(Abstract)和引言(Introduction)部分存在相似的地方,如下为两篇论文的摘要截图,通过简单的对比,我们可以发现摘要中存在大量相似的语句,只是替换了几个关键词:

AAAI 2021 涉嫌抄袭论文

ACL 2020 被抄袭论文

在论文主要贡献部分,涉嫌抄袭的论文也只是进行了简单的修改:

AAAI 2021 涉嫌抄袭论文

ACL 2020 被抄袭论文
在算法上也存在大量的相似性:

AAAI 2021 涉嫌抄袭论文

ACL 2020 被抄袭论文

为了更直观的对比这两篇论文,有人上传了两篇论文的查重结果对比:下图中,左侧为 ACL 2020 被抄袭论文,右侧为 AAAI 2021 涉嫌抄袭论文。结果显示,两篇论文存在 1.4K 相似词,有 13.4% 存在相同部分,4.4% 有小的变化,有 5.3% 的内容存在相关含义。

查重结果对比。图源:知乎 @sonta。

AAAI 2021 论文作者回应:属借鉴

此次抄袭事件在知乎社区引发了很多讨论,昨晚,涉嫌抄袭的论文作者之一、知乎用户 @魏素忠给出了正面回应:

在回应中,论文作者提出了几点:

  • 论文已明确引用《A Novel Graph-based Multi-modal Fusion Encoder for Neural Machine Translation》

  • related work 也提了联系与区别

  • github 仓库中说明了部分代码参考自 acl2020


此外,作者表示,ACL 2020 论文是做多模态机器翻译,AAAI 2021 论文是做多模态命名实体识别。两篇论文之间并不存在「抄袭」关系。

「方法部分参考了 acl2020 的论文。因此在 contribution 和 method 部分会有一些相似。但在其它部分,例如 motivation,introduction, graph construction, experimentation 都是自己针对我们 mner 任务设计。」

同时作者也表示:将会重新润色借鉴的模块,然后重新提交到 AAAI Proceedings。


作者提到,这篇 AAAI 2021 论文的代码已经开源,实验结果也能复现。但也有人反映,根据其 GitHub 中提供的代码并不能复现实验结果,而且作者并不回复 issue。


对于此事,你怎么看?
入门AAAI21ACL 2020学术圈不端行为
相关数据
机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

命名实体识别技术

命名实体识别(NER)是信息提取(Information Extraction)的一个子任务,主要涉及如何从文本中提取命名实体并将其分类至事先划定好的类别,如在招聘信息中提取具体招聘公司、岗位和工作地点的信息,并将其分别归纳至公司、岗位和地点的类别下。命名实体识别往往先将整句拆解为词语并对每个词语进行此行标注,根据习得的规则对词语进行判别。这项任务的关键在于对未知实体的识别。基于此,命名实体识别的主要思想在于根据现有实例的特征总结识别和分类规则。这些方法可以被分为有监督(supervised)、半监督(semi-supervised)和无监督(unsupervised)三类。有监督学习包括隐形马科夫模型(HMM)、决策树、最大熵模型(ME)、支持向量机(SVM)和条件随机场(CRF)。这些方法主要是读取注释语料库,记忆实例并进行学习,根据这些例子的特征生成针对某一种实例的识别规则。

知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
命名实体识技术

命名实体识别(英语:Named Entity Recognition,简称NER),又称作专名识别、命名实体,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,以及时间、数量、货币、比例数值等文字。指的是可以用专有名词(名称)标识的事物,一个命名实体一般代表唯一一个具体事物个体,包括人名、地名等。

东南大学机构
推荐文章
暂无评论
暂无评论~