Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

李志飞带着大模型「序列猴子」来了:能力自测略低于GPT3.5

李志飞表示:经过测试,个人觉得自家大模型能够达到 GPT-4 一半的水平,略低于 GPT3.5。

大模型,绝对是当前整个科技领域的「皇冠明珠」。

自 OpenAI 发布 ChatGPT 以来,全球科技公司都开始了大模型技术抢滩之战。国外,微软、谷歌的竞争态势越来越激烈,不久之前亚马逊也发布 Titan 大模型入局这场战争。AI 社区也逐渐形成了基于大模型的生态,包括 AutoGPT 等产品。

而国内,经过小半年的酝酿,百度、阿里已经发布自己可以对标 OpenAI 的大模型,也有一批创业公司推出了自己的类 ChatGPT 产品。

早在 ChatGPT 爆火初期,出门问问创始人、CEO 李志飞就是高调入局 ChatGPT 的创业者之一,曾宣称要做中国的 OpenAI。

Talk is Cheap。今天,李志飞带着出门问问的自研大模型「序列猴子」登场,并基于「序列猴子」推出 AI 写作平台、AI 图片生成平台等多个 AIGC 产品。

图片

「序列猴子」大模型

作为 ChatGPT 的拥趸者,李志飞首先表示,ChatGPT 的出现让其深刻认识到 AGI 时代的到来,而大模型是目前看起来通往 AGI 的最靠谱的实现方式。

图片

对于大模型,李志飞提出了两种观点:

第一,大模型是一个序列模型。「今天的大模型让我觉得特别有潜力,因为它学会了快速学习一个序列。而今天的序列模型可以去做结构化建模,一旦拥有了这种方法论,我们就可以用它来做很多别的事情。」

第二,大模型是一个认知模型。「今天我们训练大模型用到的互联网文本其实是世界知识的映射,所以 GPT 远不止是生成一个文章,它还有自己的知识和逻辑。如果大家把大模型看成是一个认知模型,想象空间是非常大的。」

图片

基于过去数年在大模型、AIGC 领域的技术沉淀,今天,出门问问新一代大模型「序列猴子」终于面世。它的参数量在几百亿规模,目前具备语言、知识、逻辑、数学和推理能力,还有面向简单问题的规划能力。

为什么叫做「序列猴子」?相信大家第一次看到这个名字的时候都会感到好奇。

李志飞提到,数学家埃米尔・博雷尔在 20 世纪初提出了一个名叫「无限猴子」的定理。该定理描述了:如果一只猴子随机地敲打打字机,只要给予无限时间,几乎必然能够打出任何文字,比如莎士比亚的《哈姆雷特》。

出门问问这个大模型名字的寓意与「无限猴子」类似。同理,如果喂给机器猴子海量的文本序列,通过大规模算力的训练,它就会成为智能的「序列猴子」。

从过去这段时间的训练情况来看,李志飞表示,「序列猴子」在训练过程中已经展现出了「涌现」能力,目前正处于「顿悟」阶段,未来提升的速度会越来越快。

李志飞现场实测:没翻车

「序列猴子」到底怎么样?李志飞来了一场台上演示,且是那种真实的现场测试:

首先是一些常识问答:

图片

目前来看,「序列猴子」能够完成简单的逻辑推理。

输入「我现在餐厅点菜,它们有辣子鸡、蛋花汤、清炒空心菜、水煮基围虾、石磨豆腐,我不喜欢吃辣的,但喜欢吃虾,帮推荐三个菜吧」,结果是:

图片

接下来是一道数学逻辑题:

图片

根据不同的设定条件,序列猴子可以给出不同的回答:

图片

然后是阅读理解。为了考验序列猴子的阅读理解与多轮对话的能力。李志飞让张鹏替代他的角色,与序列猴子进行了多轮对话。在这个过程中,序列猴子都从之前的对话信息中准确提取出了新公司与旧公司的名称。

图片

还可以再加一点难度,比如这个:

图片

从图中也可以看出,「序列猴子」有着清晰的推理过程。

「序列猴子」和之前的对话式大模型相比如何?李志飞表示,经过测试,他觉得自家大模型能够达到 GPT-4 一半的水平,略低于 GPT3.5。

图片

基于「序列猴子」的 AIGC 产品矩阵

虽然如今一大批科技巨头、创业公司争相发布自家的通用人工智能大模型,但最终要考虑的问题还是如何落在应用与产品上。因此出门问问也要打造面向创作者的 Copilot。

伴随着自家大模型的露相,出门问问也发布了基于「序列猴子」的多项 AIGC 产品,包括写作应用「奇妙文」、绘画应用「言之画」、AI 声音平台「魔音工坊」、数字人视频制作与直播平台「奇妙元」。

李志飞表示,在未来,Copilot 将会无处不在。此外,没有一个行业不会受到 AGI 的影响。

图片

在发布会之前,机器之心简单体验了下奇妙文。

面向专业的文字内容生产领域,奇妙文特别设置了「市场营销」、「职场办公」、「新媒体」、「创意写作」四大版块。

图片

试用网址:wen.mobvoi.com

既然能写新闻稿,机器之心就尝试让它写下今天的发布会:

输入:「出门问问 CEO 李志飞今天发布「序列猴子」大模型,写一篇新闻稿。」生成结果还不错。

图片

此外,我们可以看到,针对每次生成的内容,奇妙文可以进行重试、续写、改写、风格转换、纠错甚至 AI 配图等一系列操作。

目前,「奇妙文」等应用已经开启了内测,感兴趣的读者可以去体验下。

随后,面向 C 端的出门问问语音助手「小问」也在这场活动上宣布了最新升级。这款个人 AI 助理最早诞生于十年前,升级之后,今天内测的「CoPilot - 魔法小问」添加了问答推荐、图像生成等新功能,仍可通过语音唤醒,类似于「Siri 与 ChatGPT 的结合体」。

面向 B 端,出门问问也开展了企业专属大模型的内测探索。基于「序列猴子」的能力,不同行业的企业都可以拥有定制化的对话式大模型。

图片

最后,对于「序列猴子」,你有什么看法?

理论李志飞
相关数据
出门问问机构

出门问问成立于2012年,是一家以语音交互和软硬结合为核心的人工智能公司,为全球40多个国家和地区的消费者、企业提供人工智能产品和服务。出门问问的使命是定义下一代人机交互,让人和机器的交互更自然。公司自主研发并建立了完整的“端到端”人机交互相关技术栈,包括声音信号处理、热词唤醒、语音识别、自然语言理解、对话管理、垂直搜索、智能推荐、语音合成、知识图谱等,并始终保持国际前沿技术水平。ToC场景推出了以智能手表TicWatch系列和无线耳机TicPods系列为主的可穿戴设备组合,ToB层面已为物联网、金融、电信、健康养老、餐饮、车载等企业级场景提供服务。

https://www.chumenwenwen.com/
参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

图像生成技术

图像生成(合成)是从现有数据集生成新图像的任务。

通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~