Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

杜伟、泽南原创

详细测完360智脑后,我们发现大模型终于被玩明白了

还记得三月底那时候,360 董事长周鸿祎现场演示自家 GPT 大模型的样子吗?

图片

国内大厂和初创公司都在搞自己的 ChatGPT,但拿出的结果各不相同。

在那个时候大家都在加紧赶工,连谷歌也不例外,360 在发布会上首次公开了「360GPT 大模型」,不是播放视频也没用固定问题,直接来了段实机演示,接受现场观众的提问。首次亮相的 AI 大模型有些回答令人满意,也出现了翻车的情况。那次发布之后人们好评居多:敢演示就是有点东西。

前几天再次看到的 360 大模型,已是多模态,且准备大规模落地的样子。5 月 18 日周鸿祎在世界智能大会上发表主题演讲,展示了两款大模型产品「360 智脑」以及 AI 生图工具「360 鸿图」

图片

其中,「360 智脑」直面智能搜索场景,体现了强大的理解力和推理力,在回答天津经济社会发展的相关问题时内容详实、条理清晰。而「360 鸿图」则是 AI 生成图像工具,画出了一张 2025 年天津滨海新区的图景。

图片

周鸿祎预言,未来中国不会只有一个大模型,每个城市、每个政府部门都会有自己的专有大模型,并与业务系统融合,变成各业务板块的「Copilot」。

转眼一个多月过去,给够时间,要和友商真刀真枪地比了,这个 AI 现在属于什么段位?有人透露说,情况不一样了,外部评测机构给出的定性是:综合能力全面领先。

在拿到内测资格之后,机器之心分别上手测试了 360 智脑和 360 鸿图,见识到了 360 大模型在 AI 对话和绘画两方面的卓越能力。简单来说,就像周鸿祎所说的:不管你是否喜欢 GPT,都要尝试用一用。

360 智脑:十八般武器样样精通


打开 360 智脑,对话界面如下所示。

图片

首先让 360 智脑做了一段简短的自我介绍,并获知了它的数据来源。

图片

看起来 360 智脑获取了互联网的数据,要想成为实用的大语言模型这很重要。

接下来,机器之心多轮对话、文学创作、总结改写、角色扮演、语言翻译、逻辑推理、数理推算、编程、垂直专业能力、价值观等多个方面对 360 智脑进行了全方位的测评。

多轮对话

多轮对话是大模型真正「像人」的重要标志。在这方面,用户可以与 360 智脑进行 20 轮次的交互,和新必应搜索一样。

图片

图片

图片

在以上每轮对话中,360 智脑都可以给出合理的回答。

文学创作

毋庸置疑,创作能力是每个对话大模型都要具备的重要能力之一,无论是生成诗歌、散文、剧本等等。360 智脑在这方面同样做得非常好。首先要求它以《那个男人来自地球》(经典科幻电影)为题,创作一首现代诗歌。

图片

接着让 360 智脑以好莱坞剧本的风格改写中国古装神话剧《新白娘子传奇》,可以看到巫师、神器、灵珠、妖怪、战士等好莱坞元素应有尽有。

图片

然后尝试让它写一篇对海明威小说《老人与海》的读后感,回答非常全面。

图片

最后测试一下写长文的能力。北京 2021 年中考的作文题目:有学者说,「读史使人明智」了解过去,可以让我们增长智慧,对现实生活产生新的思考。假如有一部可以跨越时间的电话,可以打给过去的任何人,你会打给谁?想了解什么?打完之后会发生什么事情呢?请你以「我挂断了跨越时间的电话」为开头,发挥想象,写一篇故事。

图片

AI 不仅进行了想象,也在结尾部分升华了主题,看起来有点套路。

总结、改文章

除了智能创作,360 智脑还具备出色的总结改写能力,比如将打乱的词语组成一个语序正确的句子。

图片

再比如从一个词的褒贬义分别造句。

图片

下面这段改写将春季与冬季的特征形象地描述了出来。

图片

角色扮演

对话大模型的一大特色是它能够充当各式各样的角色,并以这些角色的口吻来说话。先来看 360 智脑变身大四毕业生,在即将离别之际对过往岁月、老师、同学和舍友表达不舍和感激以及对未来的期许。

图片

图片

再来两个不一样的角色,让 360 智脑扮演面试官、著名物理学家阿兰・图灵,回答也恰如其分。

图片

图片

语言翻译

360 智脑具备多语言能力,可以处理多语言任务,包括中文、英文、日文、法文等等。那么是否具备译者的基本能力呢?我们先让 360 智脑翻译了经典诗作《当你老了》,结果来看还不错。

图片

再让它翻译成日文,整体意思没有出现偏差。

图片

同样地,360 智脑对中译英以及中文不同文体之间的翻译也能应付自如。

图片

图片

逻辑推理

360 智脑能否正确地回答逻辑推理问题呢?几轮测试下来,结果显而易见,它的头脑还是相当清醒的。

图片

图片

图片

图片

数理推算

大模型是否实用的一个重要方面在于它的数理能力,因此数理推算是测评必不可少的内容。首先是经典的鸡兔同笼问题,360 智脑轻松拿下。

图片

再来几道小学数学题,360 智脑同样可以给出正确的答案。

图片

图片

图片

编程能力

360 智脑也可以完成一些代码生成、检查和补全任务。

图片

图片

图片

垂直专业

大模型不仅要具备通用能力,还要有多样化的垂直专业能力,回答专业范畴内的问题(比如医学、天文地理、数学、影视、哲学等等)。360 智脑在这方面也做得很好。

图片

图片

图片

图片

图片

价值观

像人类一样,对话大模型也有自己的判断能力和价值观。从以下多个问答中,我们可以一窥 360 智脑的一些人格操守和价值取向,如没有性别歧视、在友情中重视信任和忠诚、不会为了钱伤害别人等等。

图片

图片

图片

360 鸿图:AI 润色释放你的想象力


在体验 360 智脑时,虽然它也可以文生图,但只能根据输入的简单描述语来生成图片,比如「一只蓝色的海豚」。

图片

但当输入一些关键词时,360 智脑就无法处理了,比如下面的失败示例。

图片

这时就要寻求更专业的 AI 创作工具了,那就是 360 鸿图,它能进行更专业的 AI 润色,使输入的简单描述词变成一段详细的场景描述,让你不再有想象力桎梏。在主题风格上,360 鸿图有 CG、写实、动漫和剪纸四种可选。

图片

我们先输入一个简单的提示词「太空飞船」,通过 360 鸿图的 AI 润色变成一段场景「太空飞船是一种能够在太空中飞行的交通工具。它通常由一个大型引擎、多个推进器和一个或多个座位组成,可以在宇宙中自由穿梭。在未来的世界中,太空飞船可能会变得更加先进和智能化,能够自主导航、执行任务并与其他智能设备进行交互。此外随着科技的不断发展,太空飞船也可能会被设计成具有更强大的能源储备能力,以支持长时间的星际旅行。」最终生成的 CG 风格图片如下所示,气势磅礴,科幻感十足。

图片

再变成剪纸风格,同样创意满满。

图片

接着输入提示词「雨中漫步」,AI 润色后的场景是「一对情侣手持伞,在雨天的街道上漫步,远处是粉色的樱花,花瓣随风飘落,雨水滴落在他们的伞上,湿润了地面,倒影映照出温馨浪漫的画面」。最终生成如下写实风格的图片,就像相机拍出来的一样。

图片

变成动漫风格后是下面这样的。

图片

360 鸿图还提供更细节的个性化参数设置。比如叠加不同的风格,包括插画、油画、摄影、水彩、素描和水墨画。如下图左为输入提示词「吃土豆的人」之后生成的剪纸风格图片,图右为叠加素描风格后生成的图片,风格切换自如。

图片

再比如还可以选择不同的艺术家风格,包括达芬奇、梵高、毕加索、莫奈、张大千、齐白石和吴冠中。下面是输入关键词「木屋与老人」并经过 AI 润色后,生成的动漫 + 梵高风格的图片。

图片

此外,360 鸿图还可以改变光线(如冷光、柔光、晨光、黄昏光)、景别(如俯视图、广角镜头、背景虚化、脸部特写)和渲染方式(虚拟引擎、OC 渲染、光线追踪、真实渲染)。总之一句话,360 鸿图可玩性太强了!

我们知道,OpenAI 最近已经给 ChatGPT 上线了官方 App,但目前,360 鸿图仅支持 PC 端体验。

下一步,颠覆生产力


看起来,360 的大模型已经能够完成很多任务,做以前 AI 做不到的事。让过去复杂、高成本才能完成的任务变得易于获取,这样的产品才是有意义的,大模型无疑让很多事变得轻松了起来。

360 一直以来都以安全领域的技术闻名,但在 AI 领域里,该公司也有着长期的积累。早在 2015 年,360 就成立了人工智能研究院,将计算机视觉自然语言处理等 AI 前沿技术应用于 IoT、安全大数据等领域,同时承接了安全大脑 - 国家级人工智能开放平台项目。

现在,GPT-4 已经是世界上「最聪明的人」,AI 正面临巨大拐点,比尔・盖茨认为 GPT 的历史意义不亚于互联网、个人电脑的诞生,黄仁勋说现在我们正在经历 AI 的「iPhone 时刻」。来到科技公司比拼大模型的时候,360 更是拿出了一套覆盖全面,技术过硬的方案。

在 360 智脑中,工程师们集合了 360CV 大模型、360GPT 大模型、360GLM 大模型、360 多模态大模型的技术能力,实现了语言理解、图像识别、自然语言处理问答系统领域的深度应用,这套系统可以全面升级生产效率,释放人们的生产动力。

图片

简单来说,所有的 App、所有的网站都值得用 AI 重塑一遍。而在技术的落地上,作为国内唯一拥有可与微软「全家桶」比肩的互联网全端应用矩阵的公司,360 坐拥 MAU 超 4 亿的 360 浏览器,产品覆盖全球 15 亿终端,360 智脑天生拥有大量应用场景。最先落地的搜索,已能提供可靠、完整、而且有创意的回答。

在大量无标签数据集上训练起来的 AI 算法,可以作为基础设施,成为很多行业应用的底座。未来,360 还希望将大模型与不同场景进行结合,推进在消费者、中小企业、政府等多领域的落地应用。

正如周鸿祎在世界智能大会上所说的那样,GPT 不仅仅是一个聊天机器人,也不是消磨时间的娱乐工具。它是一个提高生产力的工具,随着大语言模型和各行业的深度结合,很多领域将被颠覆。在未来两三年,这场 AI 工业革命的结果就会见分晓。
产业360鸿图360智脑
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

光线追踪技术

在计算机图形学中,光线跟踪是一种渲染技术,用于通过将光的路径跟踪为图像平面中的像素并模拟虚拟对象对光线的接收效果来生成图像。 该技术能够产生非常高的视觉真实感,通常高于典型扫描线渲染方法,但计算成本更高。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

问答系统技术

问答系统是未来自然语言处理的明日之星。问答系统外部的行为上来看,其与目前主流资讯检索技术有两点不同:首先是查询方式为完整而口语化的问句,再来则是其回传的为高精准度网页结果或明确的答案字串。以Ask Jeeves为例,使用者不需要思考该使用什么样的问法才能够得到理想的答案,只需要用口语化的方式直接提问如“请问谁是美国总统?”即可。而系统在了解使用者问句后,会非常清楚地回答“奥巴马是美国总统”。面对这种系统,使用者不需要费心去一一检视搜索引擎回传的网页,对于资讯检索的效率与资讯的普及都有很大帮助。从系统内部来看,问答系统使用了大量有别于传统资讯检索系统自然语言处理技术,如自然语言剖析(Natural Language Parsing)、问题分类(Question Classification)、专名辨识(Named Entity Recognition)等等。少数系统甚至会使用复杂的逻辑推理机制,来区隔出需要推理机制才能够区隔出来的答案。在系统所使用的资料上,除了传统资讯检索会使用到的资料外(如字典),问答系统还会使用本体论等语义资料,或者利用网页来增加资料的丰富性。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

推荐文章
暂无评论
暂无评论~