Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

终于,NLP顶会ACL投稿不用匿名了

再也不怕大会投稿被占坑了?

对于自然语言处理领域的研究人员,最近有一条好消息。

近日,计算语言学协会年会(ACL)正式宣布,该系列会议论文投稿已取消匿名期,同时允许作者在投稿期间宣传自身工作。新规定直接适用于下一个审稿周期。
图片
今年的 ACL 是第 62 届,将于 2024 年 8 月 11 日至 16 日在泰国曼谷举行。自 2022 年起,ACL 启用了滚动审稿机制(ACL Rolling Review,ARR),每月设 deadline。需要注意的是,在上一个截止日期之前提交给评审流程的论文仍受旧匿名政策的约束。

大会声明链接:https://www.aclweb.org/portal/

据了解,ACL 会方是在最新一期工作组报告的建议下实行了新规的,新的政策也会对奖项产生影响。这一调整立即获得了研究社区的欢迎:
图片
在报告《Report of the ACL Committee on the Anonymity Policy》中,工作组指出自 2017 年起 ACL 实行的双盲评审规则成功地减少了匿名审稿期间可作为预印本的论文数量。ACL 2023 上有预印本的提交比例为 13.8%,而 ICML 和 ICLR(均对预印本没有任何限制)等机器学习会议的相应比例通常在 30% 以上。

虽然匿名在 arXiv 上提交预印版并不会破坏双盲评审,但根据 ACL 2023 审稿过程中收集的信息,91% 的投稿保持完全匿名,即审稿人无法猜测作者身份,可猜测作者身份的投稿(有预印本)比例为 4% 左右,相当于所有带预印本提交的论文的 30% 左右。

工作组认为,原有双盲评审政策显然已经产生了一些负面影响。作者可能会急于在匿名截止日期之前发布预印本,这会破坏预印本的质量。此外,由于作者必须等到论文接收后才能更新预印本,因此他们无法在匿名期间纠正错误或添加新结果,包括改变工作结论的结果。

禁止作者更正公共记录与科学研究的价值观格格不入。另一方面,选择不提交 arXiv 预印版的作者可能需要等待很长时间才能发表论文。在某些情况下,这会导致他们的工作被在此期间发表或预印的其他论文(通常是非 ACL 论文)抢先。

由于 AI 领域,特别是 NLP 领域研究节奏的加快,维持当前评审方式正在变得越来越困难。许多 ACL 作者指出,相对于许多不认同 ACL 方式的机器学习会议(如 ICML、ICLR、NeurIPS 和 AAAI),以及相对于自行发表的有影响力的行业实验室,当前的双盲评审使他们经常处于不利地位。这使得 NLP 社区变得支离破碎,ACL 会议面临着失去优秀作者、审稿人以及声誉下降的巨大风险。

新的政策旨在促进科学交流,作者仍然被鼓励在论文接收之前不要过度宣传工作(因为这可能会导致审稿人偏见而影响论文评分)。此外,不提交预印版或在社交媒体上提前宣传也可以提升论文获奖的机会。

此前,CVPR 的「社交媒体禁令」也出现了松动的迹象。

2023 年 11 月 25 日,作为 CVPR 2024 Publicity Co-chair 的 Kosta Derpanis 教授曾在个人推特上透露,CVPR 2024 关于投稿社交媒体宣传的立场有一些变化。
图片
根据 CVPR 2023 会议的投票结果,只要不提及 CVPR,作者可以在社交媒体上谈论他们已提交给 CVPR 的研究成果。因此,无论你是否向 CVPR 投稿,都可以在社交网络上谈论研究。你可以宣传自己发布的 arXiv 论文、在线进行演示等。但是,作者不得谈论研究目前正在 CVPR 审稿阶段。这既适用于社交媒体发布,也适用于与媒体的公开讨论。

鉴于 CVPR 2024 官方推特账号随后转发了这条动态,新规则变动的可信度大大提升。

CVPR 的社交媒体禁令起始于 2021 年。禁令颁布的背景,是马普智能系统研究所所长 Michael Black 提出的一项动议:审稿期间禁止在社交媒体上宣传论文,在 arXiv 上自动发布的预印本论文除外。

当时,这一动议引发了众多研究者的不满。图灵奖获得者 Yann LeCun 也公开表示:「这种行为会限制科学信息的交流,损害技术进步且违反道德规范。简而言之就是疯了。」
图片
不过这项动议最终还是高票通过。大会官方宣布,面向所有 CVPR 2022 的投稿作者,从 2021 年 10 月 19 日到 2022 年 3 月 2 日为社交媒体静默期。在此期间,任何由作者主动发起的对论文的社交媒体宣传都被视为违反政策。

值得注意的是,将论文放在 arXiv 上供专家进行早期分析,与在社交媒体上向广大受众进行宣传有本质不同,投 CVPR 的论文放在 arXiv 上还是被允许的。原因是 arXiv 论文并不是「已发表」,而应该被理解为「预发表」的状态。

这项操作的目的是解决同行评审中的偏见问题,但打击社区内交流会带来很多消极后果,而且同行评审中的偏见问题未必能真正改善。

或许是引发了太多反对的声音,如今机器学习领域,对于禁止社交媒体宣传的规定已有所缓和。
产业NLPACL
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

推荐文章
暂无评论
暂无评论~