Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

杜伟报道

arXiv 论文的 idea 被人抄袭,又发表在了顶级 CV 期刊上,这时该怎么办?

2019 年发表在顶级 CV 期刊 IJCV 上的一篇论文被指与 2017 年的一篇 arXiv 论文存在明显相似的地方,其中包括最重要的模型架构。在这种情况下,向期刊编辑反映是否有用呢?如果没用,又该如何维护自己的权益呢?

在学术界,研究者将自己的论文上传至 arXiv 是一项常规操作,这样可以确立自己对论文 idea 的优先权,收到宝贵的反馈意见并及早获得引用等。但不幸的是,这样做有时会导致自己的 idea 被别人抄袭,更有甚者会被他人抢发在学术会议或期刊上。

近日,一位名为「u/CatCalm8947」的 reddit 用户就发现了这种情况。

该用户发现,2019 年顶级 CV 期刊 IJCV 发表的论文《A Spatiotemporal Convolutional Neural Network for Automatic Pain Intensity Estimation from Facial Dynamics》与 2017 年 12 月的 arXiv 论文《 Temporal 3D ConvNets: New Architecture and Transfer Learning for Video Classification 》存在着明显相似的地方。

图左为 2017 年 arXiv 论文,图右为 2019 年 IJCV 期刊论文。

arXiv 论文地址:https://arxiv.org/pdf/1711.08200.pdf

IJCV 论文地址:https://link.springer.com/article/10.1007/s11263-019-01191-3

2017 年 arXiv 论文的作者来自鲁汶大学、波恩大学、卡尔斯鲁厄理工学院和 Sensifai,主要提出了一种基于预训练 2D 初始化来加速 3D 深度神经网络(DNN)的方法,idea 简单直接;2019 年 IJCV 论文的作者来自奥卢大学,主要研究面部疼痛强度的自动估计,为此提出了一种用于视频人脸动态时空表征的 3D 深度模型,并介绍了一种使用预训练 2D 架构来训练 3D 卷积神经网络的跨架构知识迁移方法。

发帖者认为,IJCV 期刊论文使用了 arXiv 论文的 idea,并将其作为自己对痛疼评估应用的贡献。IJCV 期刊论文的主要 idea 早已在 arXiv 论文中得到了透彻地解释,但并没有将 arXiv 论文作为参考文献。

具体地,arXiv 论文中的一些图示直接被复制到了 IJCV 期刊论文中。如下图所示,两篇论文的模型架构涉及到了预训练 2D 网络到 3D 网络的转换。其中图上为 arXiv 论文中从预训练 2D 卷积网络到 3D 卷积网络的知识迁移架构;图下为 IJCV 期刊论文中跨架构知识迁移架构,其中 2D 预训练模型处理帧,3D 模型处理相同时间戳的视频序列,并且通过图像 - 视频对应任务学习中级表征。

发帖者不禁发问:这是否意味着我们不应该将自己的论文上传到 arXiv?遇到这种情况,我们又能做些什么呢?是否应该向能够采取行动的权威机构反映?

网友支招:应该联系期刊编辑,但意义或许不大

对于发帖者的疑问,网友纷纷给出了自己的建议,大多数认为应该向期刊编辑反映。有网友建议:「首先要做的是联系同行评审论文发表期刊(这里是 IJCV)的编辑,他们需要确保所有论文符合出版的真实性。所以,把 arXiv 论文链接发给他们,他们知道下一步该怎么做。」

不过,有网友认为应该或者可以联系两篇论文的作者,但意义不大。说实话,这也是机器学习在非计算机科学学科中名声不好的原因。绝大多数论文使用相同的网络和方法,并没有什么新颖之处。只要特征和输出不同,准确率很好,90% 的情况下会被认定为高质量等级(Q1)论文。在最糟糕的情况下,他们也只会在发表时修改参考文献罢了,仅此而已。

更有网友表示,arXiv 是一个存储库,任何人都可以在上面发表论文,并且无需同行评审。arXiv 对论文作者没有甄别的义务,不可避免地,一些论文的真实性或原创性存疑。arXiv 只是一个平台,而非正式期刊,所以声称自己率先在 arXiv 上发表了某篇论文对于保护作者权益是有限的。

因此,除了向作者告知两篇论文的相似之处,你其他的什么也做不了。他们可能已经知道事情是如何发生的,并了解一个人「借用」他人思路之后会采取哪些措施。

机器之心的读者们觉得应该如何处理这种情况呢?请在评论区给出你们的想法。

参考链接:

https://www.reddit.com/r/MachineLearning/comments/ojdmza/d_similarity_of_a_high_ranking_journal/

理论学术论文抄袭IJCVarXiv
相关数据
卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~