Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

今天,大语言模型革新百度搜索

别搜关键词了,百度搜索直接给你正确答案。

最近几天,一些最常用的工具正在被大厂重新发明。

ChatGPT 横空出世后,整个科技领域突然就开上了快车道:今年 2 月,微软推出的 AI 版必应,用最先进的大语言模型重构了搜索体验。

长期占据 AI 技术领先位置的谷歌也针锋相对,三个月内给自家对话人工智能 Bard 连续更新了两个版本,开放了大规模测试,并宣布即将转向全新的多模态机器学习工具 Gemini。

不仅如此,大模型落地的竞争也很快从搜索引擎延伸到了各种生产力工具上,昨天的微软 Build 大会上甚至出现了 ChatGPT 版 Windows 的身影。正应了那句话,「面向 AI 时代,所有产品都值得用大模型重新升级一遍。」

在轰轰烈烈的大模型实用化运动中,我们的工作生活方式或许将会发生大幅度改变,AI 正在像 90 年代的个人电脑一样转变成个性化、专属化的体验。

这也正好印证了今天在广州举行的 2023 万象・百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰的断言,AI「有机会成为人人可用又人人不同的通用生产力,从『AI 所见略同』到『AI 所见不同』,给每个人带来个性化、专属化的体验,从而真正走进 Personal AI 时代。」

图片

最先改变我们的无疑会是搜索引擎。百度集团副总裁、搜索平台负责人肖阳在万象大会的演讲中表示,得益于语义检索技术和大语言模型,搜索迎来了奇点,出现了代际变革。 

很长一段时间里,要想正确地使用搜索引擎,除了要找对检索工具,在关键字上也需要用到一些限定语法,有时候不同的内容还要在不同的垂直搜索里找。而大语言模型出现后,对话式搜索不仅可以寻找正确答案,还能自动帮你整理大量资料,并用对话的方式不断把结果改进成你需要的样子,在很多任务上都能帮你节省大量时间。

要在过去这还属于是愿景,但现在已经成为了现实,因为从今天起,搜索引擎成为了它该有的样子:

图片

它就是今天上午的万象大会上,百度拿出的全新 AI 搜索体系,肖阳现场演示了正在内测中的诸项新功能。

以往各种难倒搜索引擎的问题,现在已不再是障碍,还变成了高度自动化的体验,你要做的只是把要求写(说)在搜索框上,AI 就会自然地理解意图,并完成工作:

图片

这还只是新搜索引擎能力的一小部分。

用百度搜索,直接生成答案 

3 月 16 日上线的「文心一言」是百度对标 ChatGPT,竞争通用智能赛道的大语言模型,它大幅拓宽了国内对话类 AI 产品的能力边界,一直备受人们的关注。

随着内测范围的铺开,大家体验到了文心一言的能力,又开始期待起它商用落地后的样子,大语言模型加持的百度搜索会是什么样?这次大会上,百度展示了新版搜索引擎的三大新能力。大模型加持的搜索,为我们的体验带来了代际进步,从现在起,百度搜索已变得能听会看,能理解你的思路,用逻辑回答问题,还能做些以前不敢想象的事。 

首先,AI 让搜索引擎脑洞大开,思考能力大幅提升了。现在打开百度的网页版或者 App,右上角会出现 AI 图标:

图片

打开之后会出现 AI 伙伴的聊天界面: 

图片

看起来还是要多点击一下,其实如果无视对话按钮,而是在正中间的搜索框中输入一句话,或是一长段问题描述,百度也能在搜索结果第一的位置给出大模型生成的答案:

图片

现在,搜索引擎给出的结果不仅是大语言模型整理好的一段话,有回答有引用,而且还是多模态的,相关图片、视频都包含在内,你不再需要从搜索结果中浏览、花时间判断和总结了。对于一些相对简单,却没有现成答案的问题(比如东帝汶面积等于几个通辽?),AI 可以展示逻辑推理和计算能力,直接输出可用的结果。

如果是开放的多答案问题(如做一个不用鸡蛋的蛋糕,是否有替代的方案?),百度 AI 搜索可以把多个符合要求的答案整合在一起,同时列出引用和选择依据,让结果满足需求,更加值得使用。

又如果你问到的内容在视频里(比如某车型评测中有关续航的部分),搜索引擎也可以自动定位到视频的相关位置方便查看。

图片

这种能力被称为「极致满足」:不论是多复杂的问题,你都可以在搜索结果的第一条里面获得相对全面的解答。

图片

据大会介绍,现在百度搜索每天的问答需求中,有 70% 是能达到首条满足标准的,半年前这个比例只有 40%,更好的效果反过来提升了需求,现在百度搜索上每天新增的问答需求超过了 3000 万次。

有时候,我们要的不只是一个答案。在让搜索内容更加丰富、准确之后,百度又提出了全能的「AI 伙伴」,让你用最直接的方式获取人工智能的能力。

图片

通过 AI 伙伴,人们可以用自然语言,或者直接是语音作为输入,并获得准确详细的搜索结果。AI 不仅会像你课堂做笔记一样在生成答案中标出重点,列出引用链接,调用其他工具和服务完成任务,也能接受你的进一步追问或者指正。

图片

再进一步,AI 伙伴也可以根据你的意图生成图片、进行文案写作,在不同任务上起到具体作用,如在旅行时可以担任导游,写作业时可以成为老师。

语言模型第一次让我们体验到 AI 有了高智商,但在更深入的任务上,我们需要的不仅仅是探索和陪伴。以往面对搜索引擎输出的结果时,人们会对准确性有些顾虑,毕竟不论 AI 算法有多准,始终只是概率统计的结果,算不上专家意见。这个时候,百度全新构建的 AIBOT 解决了问题。

图片

与 ChatGPT 的插件类似,通过 AIBOT 功能,百度与第三方技术提供商进行了合作,让搜索可以自动接入特定能力。目前亮相的 AIBOT 覆盖创作、商业、机构、服务和品牌等多种类型,它们可以利用专业领域知识直接回答你的问题。

如果你需要专业的回答,AIBOT 可以在对话中和你进一步解释: 

图片

百度表示,随着合作机构的增加,这样简洁高效的功能还会越来越多。

简而言之,在搜索这件事上,以往那些需要我们反复查找,切换应用的行为统统被省去了。李彦宏曾经在内部演讲中分享过一句话,「有最好交互界面的公司,才能拥有与人交互的权利」,看起来百度已经朝着这个目标前进了一大步。

AI 搜索,进展神速

让领先的 AI 技术走出实验室,成为人们日常生活的一部分,是百度这么多年来一直在做的事。

深度学习爆发以来,百度一直押注 AI 技术,最近更在 AIGC 领域不断取得好成绩。早在四年前,百度推出的大语言模型文心 1.0 版,参数量就突破了一亿,万众瞩目的文心一言在两个多月的内测时间里吸引了 15 万企业申请内测,超过 300 家生态伙伴在 400 多个具体场景上取得了测试成效,应用方向包括生产力、知识管理、智能营销等领域。

自 3 月以来,文心一言经历了多个大版本的迭代,通过对推理能力和四层架构的端到端优化,企业服务的高频场景推理性能已经大幅提升了 50 倍。

最终,这款大模型被应用在了百度最核心的搜索业务上。如果说 ChatGPT、文心一言这样的大模型是在让 AI 变大,那么现在改变格局的搜索重构,就是在让 AI 变小,让它变得人人可用。

产品的代际变革也离不开生态,百度正在对搜索生态进行全面的升级和焕新,发布「奇点计划」,包括四个部分:优质内容联盟、创作者 AI 共创、权威数据智库和智能 BOT。

图片

正如何俊杰所说的那样,「具备变革能力的新技术,往往会以我们意想不到的速度和方式彻底改变生产力。人工智能技术就在以这样的方式和速度改变一切。并且,技术革命一旦开始,就会『倍速播放』。」

图片

从帮助人们找信息的工具,进化到直接解决问题的伙伴,搜索这个 AI 原生的应用,正在从最根本的角度改变我们的思维方式。

赶上这场变革的第一步,就是上手尝试一下,成为率先掌握 AI 的人。

产业百度
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

图生成技术

根据给定信息信息生成图表。

推荐文章
暂无评论
暂无评论~