Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

小舟、陈萍编辑

疑似抄袭论文评分第一,字面歧义被指违背伦理,这届ICLR审稿怎么了?

学术顶会的论文接收结果通常是大家热议的焦点,但是否可以当作第二年投稿的参考标准?

深度学习顶级学术会议 ICLR 2023( International Conference on Learning Representations)审稿意见已出炉。对于论文作者而言,真是「几家欢喜,几家忧」。

根据官方统计,今年共计有 6300 份初始摘要投稿和 4922 份经过评审的投稿,其中经过评审的投稿比去年增加了 32.2%。在 4922 份投稿中,有 99%(4883)得到了至少 3 份评审,一共有超过 18500 份评审。

贴心的网友还为各位小伙伴爬取了本次审稿的得分排名,大家可以前去查看:

地址:https://docs.google.com/spreadsheets/d/1INZI9epkfBkPOlKuJFaffUCOKDns87Iqg4zovHnf-zs/htmlview#gid=625873159

上述链接一共统计了四千多篇论文得分情况,平均得分在 8 分以上的有 41 篇,超过 7 分的(8 分及以上的也包含在内)有 233 篇。根据一位推特网友的统计,假如你的论文要进入前 25%,需要至少 5.67 的平均得分。

若按照去年的录用率 32.3% 来看(论文接收总数 1095 篇,最终投稿量 3391 篇),预估今年会有 1556 篇被录用,得分最低约为 5.50 分。若按照 2022 年的录用数量来看(1095 篇),今年前 1095 篇论文约占总量的前 22.6%,最低均分为 5.75 分。

图源:https://twitter.com/micahgoldblum/status/1588899476781301760

今年的大会不论是投稿量还是接收量都创了新高。下图为历年 ICLR 接收投稿数量,可以看出投稿数量逐年增长。

审稿结果一放出,引来众多网友的吐槽。比起以往学术顶会,ICLR 2023 的审稿似乎争议更大。我们来看一下两个具体的审稿问题。


论文受到伦理质疑,被打 1 分

有投稿者就介绍了一个荒唐的评审结果:声称自己的论文遇到了审稿人的伦理质疑,指出论文中使用的某术语具有歧视性并给出了低分 1 分,作者这里为了双盲没有说明具体术语,而是举出了一个类似的例子:「马尔科夫链」的「链」与奴隶制相关,会冒犯到一些人。

随时该作者也说明了马尔科夫链只是一个虚构的例子,但在他的论文中也发生了类似的事情。至于到底是什么词让审稿人认为违背伦理,我们不得而知。

「我们从来没有想过这个词会冒犯别人,这个词有几十年的历史,并且有数百篇关于这个主题的论文。我们也咨询过别人,没有人会觉得被冒犯。话虽如此,也许这对某些人来说是冒犯的,只是我们不知道而已。」

抱怨归抱怨,作者也在尽力处理这件事,以便论文能够顺利进行。


评分最高的论文被曝抄袭

根据博主 Guoqiang Wei 统计的论文接收数据,所有论文中评分最高的一篇是《Git Re-Basin: Merging Models modulo Permutation Symmetries》。

图源:https://guoqiangwei.xyz/iclr2023_stats/iclr2023_submissions.html

论文地址:https://arxiv.org/abs/2209.04836

这篇论文提出了三种算法,首次展示了 CIFAR-10 和 CIFAR-100 上独立训练的 ResNet 模型之间的零障碍线性模式连接。这项研究表明深度学习中简单的 SGD 算法在高维非凸优化问题上也非常有效。

这篇论文迅速引起热议,Pytorch 的联合创始人 Soumith Chintala 也在推特上称赞:「将该思路用于更大的环境设置会有更大的收益,将扩展 ML 模型的开发,并在开源的联合开发模型中发挥巨大作用。」

但最近有人在该论文的 public comment 中指出这篇论文涉嫌抄袭,并经过详细推导证明它与先前的工作是等价的。

发表这份 comment 的 Sidak Pal Singh 是马克斯 · 普朗克智能系统研究所和瑞士苏黎世联邦理工学院的博士研究员。他的主要研究领域是深度学习理论、优化和因果表征学习

Sidak Pal Singh 犀利地指出 Git Re-Basin 这篇论文就是将先前的多项研究结合到了一起。他列举出之前的几项研究:

1. Ashmore, Stephen, & Michael Gashler. "A method for finding similarity between multi-layer perceptrons by Forward Bipartite Alignment." 2015 International Joint Conference on Neural Networks (IJCNN). IEEE, 2015.

2. Yurochkin, Mikhail, et al. "Bayesian nonparametric federated learning of neural networks." International Conference on Machine Learning. PMLR, 2019.

3. Singh, Sidak Pal, & Martin Jaggi. "Model fusion via optimal transport." Advances in Neural Information Processing Systems 33 (2020): 22045-22055.

4. Wang, Hongyi, et al. "Federated learning with matched averaging." arXiv preprint arXiv:2002.06440 (2020).

5. Tatro, Norman, et al. "Optimizing mode connectivity via neuron alignment." Advances in Neural Information Processing Systems 33 (2020): 15300-15311.

6. Entezari, Rahim, et al. "The role of permutation invariance in linear mode connectivity of neural networks." arXiv preprint arXiv:2110.06296 (2021).

并明确说明:

  • Git Re-Basin 论文中的算法 1 可证明与 OTFusion 基于激活的对齐方式相同。

  • Git Re-basin 的算法 2 和算法 3 与上述 [1,2,3,4] 中的方法高度相似。

  • 许多结果或观察结果已在过去的一些研究中以类似的形式展示过,在这项工作只是重新呈现了一下。

  • 该论文对一些已有研究的引用(例如上述论文 [3-5])没有准确地关联关键贡献。

值得注意的是,Sidak Pal Singh 本人就是上述论文 [3] 的第一作者。

Sidak Pal Singh 认为 Git Re-Basin 这篇论文严重夸大了研究成果。学术论文在先前工作的基础上进一步拓展本没有错,但如果弄虚作假,模棱两可地阐述论文贡献就是学术不端,应该被指责。

对于 ICLR 2023 的论文接收结果,你有什么看法吗?欢迎在评论区留言讨论。


参考链接:

https://twitter.com/peter_richtarik/status/1591408710366408706

https://www.zhihu.com/question/564681248

https://openreview.net/forum?id=CQsmMYmlP5T

https://guoqiangwei.xyz/iclr2023_stats/iclr2023_submissions.html

理论ICLR
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

凸优化技术

凸优化,或叫做凸最优化,凸最小化,是数学最优化的一个子领域,研究定义于凸集中的凸函数最小化的问题。凸优化在某种意义上说较一般情形的数学最优化问题要简单,譬如在凸优化中局部最优值必定是全局最优值。凸函数的凸性使得凸分析中的有力工具在最优化问题中得以应用,如次导数等。 凸优化应用于很多学科领域,诸如自动控制系统,信号处理,通讯和网络,电子电路设计,数据分析和建模,统计学(最优化设计),以及金融。在近来运算能力提高和最优化理论发展的背景下,一般的凸优化已经接近简单的线性规划一样直捷易行。许多最优化问题都可以转化成凸优化(凸最小化)问题,例如求凹函数f最大值的问题就等同于求凸函数 -f最小值的问题。

表征学习技术

在机器学习领域,表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前,机器学习研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点,它使得机器不仅能学习到数据的特征,并能利用这些特征来完成一个具体的任务。

Infor机构

Infor是一家跨国企业软件公司,总部设在美国纽约市。Infor专注于通过云计算作为服务交付给组织的业务应用。最初专注于从财务系统和企业资源规划(ERP)到供应链和客户关系管理的软件, Infor在2010年开始专注于工业利基市场的软件,以及用户友好的软件设计。Infor通过Amazon Web Services和各种开源软件平台部署云应用。

www.infor.com
相关技术
推荐文章
暂无评论
暂无评论~