Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱编辑

arXiv正式规定:预印本不允许以ChatGPT等工具为作者

从预印本平台、顶会到期刊,都无法接受 ChatGPT 这样的大模型成为「署名作者」。

ChatGPT,这款近期发布的文本生成工具,已经在研究界引起了热烈的讨论。它能写出学生作文、总结研究论文、回答问题、生成可用的计算机代码,甚至足以通过医学考试、MBA 考试、司法考试……

其中一个关键的问题是:ChatGPT 可以被命名为研究论文的作者吗?

现在,来自全球最大预印本发布平台 arXiv 官方的明确回答是:「不能」。


AI 没有署名权

在 ChatGPT 之前,研究者们早就在使用聊天机器人作为研究助手,帮助组织自己的思维,生成对自身工作的反馈,协助编写代码以及对研究文献进行摘要。

这些辅助工作似乎可以被认可,但说到「署名」,又完全是另外一回事。「显然,一个计算机程序不能为一篇论文的内容负责。它也不能同意 arXiv 的条款和条件。」

有一些预印本和已发表的文章已经将正式的作者身份赋予 ChatGPT。为了解决这个问题,arXiv 为作者采用了一项关于使用生成式 AI 语言工具的新政策。

官方声明如下:

arXiv 认识到,科学工作者使用各种工具来进行他们所报告的科学工作以及准备报告本身,包括从简单的工具到非常复杂的工具。

社区对这些工具的适当性的看法可能是不同的,而且在不断变化;人工智能驱动的语言工具引发了重点的辩论。我们注意到,工具可能会产生有用和有帮助的结果,但也可能产生错误或误导性的结果;因此,了解使用了哪些工具与评估和解释科学作品有关。

基于此,arXiv 决定:

1. 继续要求作者在他们的工作中报告任何复杂工具的使用情况,如仪器和软件;我们现在特别将「文本到文本的生成式人工智能」包含在应报告的符合方法论主题标准的工具中。

2. 提醒所有同事,只要在论文中签上自己的名字,他们每个人都要对论文的所有内容承担全部责任,无论这些内容是如何产生的。如果生成式人工智能语言工具产生了不恰当的语言、抄袭的内容、错误的内容、不正确的参考文献或误导性的内容,并且该输出被纳入科学成果中,这就是作者的责任。

3. 生成式人工智能语言工具不应该被列为作者,可参考 1。


「规则」的意义

几天前,《自然》杂志就公开表示,已经与所有 Springer Nature 期刊共同制定了两条原则,并且这些原则已被添加到现有的作者指南中:

首先,任何大型语言模型工具都不会被接受作为研究论文的署名作者。这是因为任何作者的归属权都伴随着对工作的责任,而 AI 工具不能承担这种责任。

第二,使用大型语言模型工具的研究人员应该在方法或致谢部分记录这种使用。如果论文不包括这些部分,可以用引言或其他适当的部分来记录对大型语言模型的使用。

这些规定和 arXiv 最新发布的原则十分相似,看起来,学术出版领域的组织们似乎达成了某种共识。

ChatGPT 的能力纵然强大,但其在学校作业、论文发表等领域的滥用已经引发了人们广泛的担忧。

机器学习会议 ICML 就表示过:「ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,这会带来一系列的责任归属问题。」

因此,学界开始探索检测 ChatGPT 等大型语言模型(LLM)生成文本的方法和工具。未来,检测内容是否由 AI 生成或许将成为「审稿中的重要一环」。

参考链接:https://blog.arxiv.org/2023/01/31/arxiv-announces-new-policy-on-chatgpt-and-similar-tools/

理论ChatGPTarXiv
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

推荐文章
暂无评论
暂无评论~