Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

奥特曼「草莓」模型跳票,OpenAI凌晨大新闻,把网友整懵了

GPT-5 大模型?不要太着急。

昨晚,很多人彻夜未眠,都在等待 OpenAI 的「大新闻」。

因为在本周三,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片。

图片

奥特曼虽然偶尔会发一些心灵鸡汤,但大多数的推文都是在宣传公司的产品,人们看法很快达成了一致——此中必有深意。

有人展开解读:四个红草莓,其中还有一个未成熟的青色草莓,这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗?

图片

奥特曼在回应网友时也在暗示,惊喜马上就来。

这激起了人们的好奇心,预测 GPT-5 发布的时间从草莓成熟所需要的 4 到 6 个星期,很快发展到了就在明天。

那就不用等了。今天凌晨,答案揭晓了。

OpenAI 发布了基于最新一代大模型 GPT-4o 的全面安全评估。

新发布的 GPT-4o System Card 是一份研究文件,概述了 OpenAI 在发布最新模型之前采取的安全措施和风险评估。

GPT-4o 于今年 5 月公开发布。在首次亮相之前,OpenAI 使用了一组外部红队或试图寻找系统弱点的安全专家来查找模型中的关键风险。

在如今的大模型领域,这是一种相当标准的做法。新的安全测试将更多的精力集中在 GPT-4o 的音频功能上,OpenAI 检查了一系列风险,例如 GPT-4o 可能会创建未经授权的某人声音克隆、色情和暴力内容或复制的受版权保护的音频片段(比如一段流行音乐)。如今结果的发布似乎意味着语音功能即将全面上线。

图片

值得关注的是,根据 OpenAI 自己制定的框架,研究人员认为 GPT-4o 新增的语音对话能力在整体上并不会显著增加风险,但个在别领域上具有「中等」风险。

具体来说,总体风险水平取自四个总体类别中的最高风险评级:网络安全、生物威胁、说服力和模型自主性。除了说服力之外,所有这些都被认为风险较低,研究人员发现 GPT-4o 的一些写作样本可能比人类书写的文本更能左右读者的观点 —— 尽管该模型的样本总体上并不更有说服力。

图片
图片

GPT-4o 是 OpenAI 推出的最新一代自回归全向模型,它接受文本、音频、图像和视频的任意组合作为输入,并生成文本、音频和图像的任意组合的输出。它在文本、视觉和音频方面进行端到端训练,这意味着所有输入和输出都由同一个神经网络处理。

OpenAI 表示,GPT-4o 可以在短短 232 毫秒内响应音频输入,平均反应时间为 320 毫秒,与人类对话中的响应时间相似。它在英文和代码文本上的表现与 GPT-4 Turbo 相当,在非英语语言文本上的表现有显著提升,同时 API 速度也更快、价格便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

OpenAI 发言人 Lindsay McCallum Rémy 表示,System Card 包括由内部团队创建的准备情况评估,以及 OpenAI 网站上列出的外部测试人员,即模型评估与威胁研究 (METR) 和 Apollo Research,这两家公司都在为 AI 系统建立评估。

图片

                               评估方式。

这不是 OpenAI 发布的第一个 System Card。此前,GPT-4、具有视觉能力的 GPT-4 和 DALL-E 3 也经过了类似的测试,研究结果也已发布。但 OpenAI 此次发布新版本 dSystem Card,可能是由于一直以来自身在安全方面被批评做出的应对。

许多人呼吁 OpenAI 需要更加透明,不仅应该公开模型、训练数据(如是否使用 YouTube 视频训练),还包括其安全测试的过程。在 OpenAI 和许多领先的人工智能实验室所在的加州,州参议员正希望通过一项法案来规范大型语言模型,其中包括限制公司如果其人工智能被用于有害方式,将承担法律责任。但 GPT-4o System Card 带给外界的最大信息是,尽管有一群外部 Red Team 成员和测试人员,但其中很多都依赖于 OpenAI 自己来评估自己。

与此同时,OpenAI 也宣布任命卡耐基梅隆大学(CMU)机器学习系教授兼主任 Zico Kolter 为公司董事会成员。Zico 的工作主要集中在人工智能安全性、一致性和机器学习分类器的稳健性上,专业知识涵盖新型深度网络架构、数据理解对模型影响的创新方法,以及评估 AI 模型稳健性的自动化方法。

果然网友们纷纷表示「不满意」。有人发问,你要发的「草莓」(可能的下一代大模型)呢?PS:果然没有草莓。

图片

图片

还有人表示,自己已经听了太多关于安全框架的东西了。

图片

更多人开启了对 OpenAI 的打趣。

图片

然而,在研究人员自己看来,OpenAI 的进展似乎远超预料。OpenAI 的联合创始人 Greg Brockman 刚刚发了推,表示我虽然刚刚开始休假,却好像已经错过了太多(Fear of Missing Out)。

「过去 9 年,我把生命都奉献给了 OpenAI,覆盖了我的整个婚姻阶段。工作对我来说很重要,但生活也一样。我觉得休息一下没问题,部分原因是我们的研究、安全和产品进展非常强劲。」

图片

不过与此同时,最近几天在 UC Berkeley 建立的 LYSMS 大模型竞技场中的 anonymous-chatbot 已被广范认为是 OpenAI 的新模型。

图片

我们或许不需要等太久。

参考内容:

https://openai.com/index/gpt-4o-system-card/

https://openai.com/index/zico-kolter-joins-openais-board-of-directors/

https://www.theverge.com/2024/8/8/24216193/openai-safety-assessment-gpt-4o

https://x.com/gdb/status/1821716026448633933

产业OpenAIGPT-5
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

推荐文章
暂无评论
暂无评论~