Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

张倩报道

又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队

「他们并不是照抄文本,而是剽窃想法。」

昨天,有人在 reddit 上发帖称,IBM 苏黎世研究中心剽窃了自己的论文,而且还被 CVPR 2022 接收了。

这位发帖者写道:

我叫 Xianbiao Qi,是一位有十多年研究经验的计算机视觉研究者。我写这个博客是为了投诉一个严重的案例:IBM 苏黎世研究中心的员工蓄意剽窃我们的论文。他们并不是照抄文本,而是剽窃想法。


Qi 提到的疑似被抄袭的论文题为「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML(平安 VCGroup 为 ICDAR 2021 科学文献解析竞赛任务 B 提供的解决方案:HTML 表格识别)」,作者来自平安保险和平安科技,上传 arXiv 的时间是 2021 年 5 月份,2021 年 7 月份公布了代码,2021 年 9 月发布了 Tablemaster 预训练模型,2021 年 11 月发布了 tablemaster_mmocr docker 环境。论文中提到的竞赛是 2021 年 4 月结束的,由 IBM 的另一个团队主办。

论文链接:https://arxiv.org/pdf/2105.01848.pdf

如论文标题所述,这篇文章为 ICDAR 2021 科学文献解析竞赛任务 B(HTML 表格识别)提供了一套解决方案。具体来说,他们将表格内容识别分为四个子任务:表格结构识别、文本行检测、文本行识别和框分配。表格结构识别算法是基于一种鲁棒的图像文本识别算法 MASTER 定制的。PSENet 用于检测表图像中的每个文本行。文本行识别模型也建立在 MASTER 之上。最后,在框分配阶段,他们将 PSENet 检测到的文本框与通过表结构预测重构的结构项相关联,并将文本行的可识别内容填充到对应项中。
被指抄袭的 IBM 论文题为「TableFormer: Table Structure Understanding with Transformers(TableFormer:用 Transformer 理解表结构)」,上传 arXiv 的时间是 2022 年 3 月份,提交给 CVPR 的时间未知。
论文链接:https://arxiv.org/pdf/2203.01017.pdf
在这篇论文中,IBM 的研究人员提出了一种新的表结构识别模型,它从两个方面改进了最新的端到端深度学习模型(即来自 PubTabNet 的 encoder-dual-decoder)。首先,他们引入了一种新的目标检测解码器用于表格单元格。通过这种方式,他们可以直接从 PDF 源中获取编程式 PDF 的表格单元格内容,从而避免了定制 OCR 解码器的训练。这种架构上的改变带来了更精确的表格内容提取。其次,他们将 LSTM 解码器替换为基于 transformer 的解码器。

Qi 表示,IBM 的这篇论文剽窃了他们的方法论、预处理、后处理、可视效果、推理、系统级解决方案、代码、预训练模型等内容,但「为了不被抓住」,他们没有引用 Qi 等人的论文。
接下来,Qi 用十几张图展示了他认为 IBM 存在抄袭的地方。

Qi 展示的疑似抄袭点 1:方法论。他认为,IBM 的研究者抄袭了他们的想法,并重写了「贡献」部分,而且根据他们的图重新画了结构图。

Qi 展示的疑似抄袭点 2:预处理。

Qi 展示的疑似抄袭点 3:后处理。

Qi 展示的疑似抄袭点 4:推理加速方法

Qi 展示的疑似抄袭点 5:技巧。

Qi 展示的疑似抄袭点 6:文本行检测和文本行识别。

Qi 展示的疑似抄袭点 7:系统级解决方案。

Qi 展示的疑似抄袭点 8:可视效果。

Qi 展示的疑似抄袭点 9:误导读者。


在看了 Qi 给出的示例后,有人认为这些都是非常有力的证据,IBM 团队很难证明自己的论文是原创的,Qi 应该向 CVPR 程序委员会投诉。
不过,也有人认为,这些证据不够有力:「两个小组研究的是同一个问题,使用的是相同的公开数据,他们的解决方案也有相似之处。但这并不意味着一方照搬另一方。例如「疑似抄袭点 1」中所展示的内容就不是那么接近」。
目前,我们还没有在帖子下方看到 IBM 论文作者的回应。

不过,值得一提的是,这并不是今年 CVPR 曝出的唯一一件疑似抄袭事件。几天前,一位网友在 YouTube 上爆料说,首尔大学的一篇论文抄袭了十几篇其他论文,目前该论文作者已经出来道歉并撤稿。

或许,顶会论文在查重上面需要多下点功夫了。

参考链接:https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/
理论学术论文抄袭CVPR 2022
相关数据
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

推荐文章
暂无评论
暂无评论~