Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

打工人遇见大模型:外面的世界已经这样办公了吗?

在办公场景中,制作 PPT 是最常见的工作之一。工作汇报、产品发布、活动策划、专业讲座等都需要使用 PPT。

传统的 PPT 制作过程枯燥琐碎,耗费时间、精力。特别是将 word 格式的报告文档转换成 PPT,要花费大量时间阅读文档内容、梳理要点,还要精心排版、调整字体图片等等,并且改动 word 文档 PPT 就要重新梳理调整。

有没有一种可能,做 PPT 这件事可以自动化?

在大模型的加持下,百度文库做到了。百度文库在接入文心一言后已从「文档搜索工具」全面重构成「一站式智能文档平台」,涵盖 PPT 智能生成、文档智能生成、智能编辑、智能辅助阅读等多个功能。

图片

例如,对下面这篇文章,上传 word 文档,AI 就能根据文档内容迅速生成一份直接可用的 PPT。

图片

图片

早在今年 3 月,百度文库就宣布接入「文心一言」,并开启用户内测。8 月 31 日,百度文心一言正式向公众开放,作为行业首个「一站式智能文档平台」,百度文库的「PPT 智能生成」等文档创作功能在开放首日就迎来超 200 万人次体验。

为了收获「一站式」的智能创作体验,我们对百度文库新上线的 AI 功能进行了全面的测试。

PPT 智能生成

最近几年,制作 PPT 越来越卷,各种 PPT 神器受到大家追捧。但这些制作工具需要按其要求使用,有时甚至会把 PPT 的制作复杂化。

为了把制作 PPT 简单化、自动化,百度文库文档助手推出了两种 PPT 智能生成功能:一句话直接生成 PPT 和上传 word 生成 PPT。

输入主题直接生成 PPT

随着生成式 AI 取得进展,行业内出现了一些 AI 生成 PPT 的工具,其中大部分工具的主要功能就是输入主题生成 PPT,例如 Gamma。

为了衡量百度文库的生成效果,我们用「生成一个关于恐龙的历史的 PPT」这句话,对 Gamma 和百度文库进行了测试和对比。

Gamma 首先生成了一个内容大纲,但最终生成的 PPT 只有 7 页,没有目录的展示页:

图片

且 PPT 内容简单,排版格式也比较单调:

图片

                              Gamma 输入主题生成 PPT 效果示例。

同样的语句,百度文库首先也是生成内容大纲,但是比较详细,包含两级内容要点:

图片

最终百度文库生成的 PPT 共 24 页,从恐龙的特征、演化到恐龙研究的概况,内容丰富完备,排版多样美观,几乎可以直接使用,生成效果和实用价值远超 Gamma 等 PPT 工具。

图片

                                百度文库「输入主题直接生成 PPT」效果示例。

上传 word 生成 PPT

相比于输入主题生成 PPT,将 word 文档转换成 PPT 难度更大。

一方面,解析一句话是模型根据话题进行扩展;而解析一篇文章需要从文章本身的主次结构出发,分析全文的重点要点、行文逻辑、内容风格,对文章进行充分的理解和解构,才能生成合乎文章逻辑、完整丰富的 PPT。

另一方面,word 文章的质量往往是参差不齐的。有的文章内容非常简单,需要 AI 模型在生成 PPT 的过程中加以丰富;有的文章内容复杂、专业,需要 AI 模型提炼总结,可能还会用到大模型的知识储备。这对大模型的能力提出了更高的要求。

此外,PPT 中通常需要一些配图,输入主题生成 PPT 只需根据主题找到合适的图片;而根据 word 生成 PPT,配图要符合文章主题、段落大意,还要与文章风格适配等等,限制较多。

为了测试百度文库将 word 文档转换成 PPT 的能力,我们上传了一篇题为《智能家居技术的前沿发展》的文章:

图片

                                  《智能家居技术的前沿发展》word 文档部分截图。

百度文库的文档助手还是先根据 word 文档的内容生成了一份详细的大纲:

图片

点击「生成 PPT」,选择模板后生成了一份 36 页的 PPT:

图片

图片

总体上讲,这份 PPT 内容丰富、排版美观,整体带有与文章相符的科技感。人工制作这样一份 PPT 可能至少要花费数十分钟,但 AI 加持的百度文库只用了大约 30 秒。

具体来说,PPT 在 word 文档的基础上扩展了很多内容。以「智能照明」为例,word 文档中的内容只有短短数行文字:

图片

                                  word 文档中关于「智能照明」的全部内容。

而在百度文库生成的 PPT 中,「智能照明」部分首先介绍了智能照明控制系统和智能照明器具,其次阐述了智能照明市场的规模和发展趋势,然后指出智能照明系统的优势和不足,最后展望了智能照明技术的发展趋势和面临的挑战。

图片

我们发现,百度文库生成的 PPT 中包含了很多 word 文档以外的信息。这就需要百度文库借助「文心一言」大模型,对 word 文档的内容进行深入解析,并生成知识型内容。此外,PPT 中的配图也很符合 word 文章的主题 —— 智能家居,这也需要利用大模型强大的理解能力。

生成带有图表的 PPT

数据图表是 PPT 中常见的一种内容形式,它能够对相关成果进行量化展示,直观清晰。为了测试百度文库能否生成含有数据图表的 PPT,我们在文档助手的对话框中输入需求:「生成一份 A 智能家居公司的财报分析 PPT」。

文档助手还是先生成一份 PPT 大纲,值得注意的是,大纲中不仅有财务数据及分析的内容,还有公司的基本介绍和行业的趋势展望。这说明文档助手了解财报分析 PPT 的常见用途是什么,并且知道财报分析需要哪些专业数据,例如利润、资产、现金流、总营收等等。

图片

在生成的 PPT 中,文档助手为不同的财务数据生成了不同类型的数据图表,包括柱状图、折线图、数据表格等,并且每张图表均有文字解读。

图片

例如,总资产详情数据页面包含一张总资产柱状图、一张总资产同比增长率的数据表和一段对总资产变化情况的分析文本。其中,同比增长率是根据总资产数据计算得来。在人工制作财报分析 PPT 时,同比增长率等数据需要单独计算再添加到 PPT 中,而百度文库的文档助手借助 AI 大模型直接生成了全部数据。

图片

如果我们需要对文档助手生成的 PPT 加以修改,也可以直接让文档助手帮忙操作,例如修改 PPT 的主题色:

图片

如此一来,制作一份 PPT,从需求到成稿大约只需几分钟,办公效率提升的不是一点半点。

动动嘴生成 PPT

最后,我们发现上述所有功能在百度文库 app 上均可使用,并且还有一个额外的功能:动动嘴就能生成 PPT,即在移动端百度文库 app 上我们可以直接语音输入需求,文档助手就能完成生成 PPT 的任务。

图片

例如,我们语音描述需求:「生成一个介绍玫瑰花的 PPT」,百度文库 app 生成 PPT 的全过程如下视频所示:

文档智能生成

有了 word 文档,AI 可以生成 PPT,而 word 文档也可以直接 AI 生成。

我们知道,大语言模型最擅长的任务之一就是文本生成,AI 辅助文本创作也是当前大模型最常见的应用方向之一,特别是在办公场景中有着广泛的应用前景。

作为一站式智能文档平台,百度文库已经上线「生成大纲」、「头脑风暴」等多个面向文本的功能,在百度文库中新建文档就可以直接使用这些 AI 功能。

图片

AI 帮你写

为了测试从头开始创作文本的能力,我们用百度文库拟了一份「编辑招聘文案」。

如下图所示,智能生成的结果符合招聘文案格式要求,包括公司简介、职位描述、岗位要求、福利待遇、应聘方式、公司地址几个方面,并根据「编辑」这个具体的岗位展开介绍职位描述和岗位要求。只需根据具体情况调整部分信息就可以实际使用。

图片

然后我们又测试了百度文库的英文写作能力,用中文输入需求:「写一篇英文作文,题目是《秋》」。百度文库生成的文章从秋天的景象写到秋天人们的行为活动,行文流畅、词汇丰富。

图片

写大纲

与招聘文案、电子邮件等办公文本不同,撰写知识型介绍文章往往需要搜集资料、写大纲等前期准备工作。百度文库作为一个收录大量知识型文档的平台,在 AI 写大纲这个功能可以根据用户提供的主题迅速列出文章的大纲框架。

例如,我们用「茶」这个主题测试了百度文库的「写大纲」功能,生成的大纲框架中包括茶的历史、分类、制作、品鉴、文化、未来几大部分,每部分又细分出几个小节。

图片

头脑风暴

除了拟大纲和写作,在实际的工作生活中,文本创作最关键的一步是寻找思路。基于文心一言大模型的生成能力和百度文库丰富的文档储备,「头脑风暴」这个功能可以为用户迅速找到多个角度。

例如,以「洗发水产品营销方案」为例,「头脑风暴」功能迅速给出了「品牌故事」、「目标市场分析」、「产品特点」、「价格策略」等多个思路。

图片

当然,这些功能也可以在文档助手中直接使用,例如在对话框中直接输入需求:「帮我写一篇产品促销活动策划方案」,文档助手的生成结果如下图所示:

图片

整个文案共包括目标市场分析、促销目的和目标、促销策略制定、促销活动内容、促销执行方案、促销预算和资源需求、促销效果评估和总结七个部分,覆盖了活动策划的各个方面。

值得注意的是,百度文库生成的文本质量很高,完备且详细,这源于百度文库超大规模的高质量文档资源。多年来,百度文库收录内容总量已突破 12 亿,这让百度文库文档助手在智能文本编辑方面具有独特的优势。

在实际工作中,活动策划、工作报告等文案撰写是极为常见的日常工作。人工完成这些工作可能需要数天时间,而百度文库的文档助手可以又快又好地完成这些任务。看来,只要尽可能详细地描述写作需求,我们就可以用 AI 辅助完成很多工作任务,工作效率将呈数量级提升。

智能编辑

相比于从头开始创作文本,大模型在编辑文本方面并不擅长。这是因为大模型的生成是比较随机的、生成文本长短不一,而文本编辑要求对文本做出准确、细致的调整,并且往往有字数限制。

当前,大模型在表述完整性和严格字数限制之间,很难做到平衡。模型在训练过程中学习到的知识会影响其输出的字数,而大模型本身输出内容的多样性要求,可能会导致输出不稳定。因此,将大模型应用于文本编辑具备一定的挑战性。

我们发现百度文库目前已经上线多个智能编辑功能,克服了一些技术难点。在百度文库中编辑文档时,选中文档中的段落就会自动弹出「AI 智能编辑」按钮,点击会出现一个 AI 编辑文本的功能菜单,可以对文本进行润色、修订、总结、缩写、扩写、改变语气等。

图片

我们尝试对一段文本进行 AI 润色,结果如下图所示,一段文本被丰富成两段,文字描述更加细腻:

图片

为了测试 AI 文本修订功能,我们对原文稍作修改,使其含有语病,句子不通顺,然后选择「词汇 & 语法修订」功能,百度文库 AI 修订的结果如下图所示:

图片

我们还在百度文库中选择了一篇自动驾驶相关的文章来测试缩写和扩写功能,旨在评估智能编辑对于专业性较强的文章效果如何。

如下图所示,选择缩写功能后,百度文库把两段文字缩写成了一段,并且清楚阐述了原文中重要的概念和因果关系。

图片

在扩写方面,我们发现扩写后的内容添加了「自动驾驶汽车通过激光雷达、摄像头、超声波传感器等设备获取周围环境的信息」等专业表述,这是百度文库根据自动驾驶发展现状延伸扩展的,这说明百度文库已经掌握了一些知识,能够对专业性较强的内容进行智能编辑。

图片

百度文库能够借助 AI 完成多种文本编辑任务,这说明其已经熟练掌握文本的语法、语义和语言风格等。在实际的文本编写工作中,这样的辅助编辑工具会为我们节省大量时间和精力。

此外,我们还发现文档助手可以根据文本内容生成数据图表:选中含有数据的段落,右侧文档助手就会自动弹出「生成图表」的选项。该功能不仅可以生成数据图表,还会根据文章内容和数据情况作出解析。

例如,我们用一篇《公司财务报表分析案例》中一段涉及销售利润率的段落测试了该功能。结果如下图所示,文档助手生成了一张销售利润率柱状图,并给出了原因分析、解决方案、洞察和建议等等。

图片

智能辅助阅读

在办公场景中,大模型的长文总结能力也具有很多实际用途,例如查阅参考资料、提炼会议记录、速读合同条款等等。

作为一个月活跃用户超过 1 亿的平台,在百度文库上,以前我们搜索资料通常是用搜索关键词的方法,找到资料后,我们需要粗略查看文献目录和内容,以找到所需信息。

现在,百度文库可以借助文心一言大模型为其收录的文档生成简短的摘要,让用户能够迅速了解文档内容,做到智能辅助阅读,节省办公时间。这让上亿用户在百度文库查阅资料更加方便迅速,成为 AI 学习办公的「原住民」。

例如,我们让文档助手总结百度文库中一篇题为《人工智能的发展及应用》的长文:

图片

还可以根据文档内容回答相关问题。例如根据该文章回答:「人工智能是何时提出的?」文档助手可以给出正确的回答,并且会指出参照的文章依据是什么。

图片

总结文档内容、回答相关问题等功能也适用于 PDF 文档。例如,在阅读一篇关于多智能体强化学习的基础和应用的万字长文时,直接选择右侧文档助手中的「帮我总结文档大意」,AI 就迅速给出了一份文档内容总结,这样只需几秒我们就能大体了解一篇万字长文的内容。

图片

以秒计时的全新办公模式

今年,生成式 AI 掀起了一场生产工具变革浪潮。大模型从最初的生成效果惊艳,到开始探索应用方向,再到现在有了一些较为成熟的应用,大模型已经从技术走向落地。文心一言加持的百度文库就是一个很好的例子。

以前,word 文档、PPT、搜索工具在办公场景中各司其职,办公往往需要跨平台。虽然内容有很大的相关性,但编写 word 文档和制作 PPT 是两项单独的工作,并且每个工作都需要花费较多的时间来完成,例如编写文档就需要搜索资料、构建大纲、撰写文章、润色编辑等步骤。

现在,只需要一句话,百度文库就能生成完备详尽的文档内容,上传文档就能直接生成 PPT,整个过程可能只需要几分钟。从这个角度看,百度文库解决了「办公跨平台」这个长期存在的痛点,「一站式」办公成为现实。

那么,百度文库可以给日常工作带来哪些具体的益处呢?

从工作效率上讲,百度文库生成 PPT 大约需要 30 秒,创作文档约 15 秒,总结万字长文只需 10 秒。其中任何一项任务,人工完成的时间至少是数十分钟,有时甚至需要数天时间。我们可以用节省出来的时间完成更有创新性的工作,制作 PPT 等相对程式化的工作交给 AI 来完成,让办公效率呈数量级提升。

从生成质量上看,百度文库生成的内容质量非常高,逻辑清晰、内容丰富,往往只需要人们根据实际情况对生成内容进行调整就可以直接使用。这也是百度文库作为「一站式智能文档创作平台」可以实际应用的重要原因。全面上线仅一个月的时间,百度文库 AI 新功能的累计用户已超过千万,累计生成内容超 2000 万,累计生成 PPT 超 200 万。

从使用场景看,以前我们办公通常是依赖于 PC 端,时空条件有所限制。现在,使用百度文库 app,在移动端仅用非常简单的操作就能完成编写文档、制作 PPT 等任务,打破了办公场景在时间和空间上的限制。

实际上,自大模型崭露头角以来,行业内一直在努力提升大模型的性能,以使其能够投入实际应用。百度文库能成为行业首个一站式智能文档创作平台,来源于三个关键因素。

首先,文心一言大模型基于非常精细的数据训练出了强大的理解能力、生成能力和逻辑能力,这几方面的能力会让其加持的百度文库能够精准理解用户需求、生成内容逻辑清晰、丰富合理。

其次,百度文库本身具有 12 亿高质量文档,这是百度文库重构的内容优势。这些文档也是文心一言大模型的重要训练数据之一,百度文库和文心一言相辅相成。

第三,百度文库自身的研发团队多年来一直在算法开发、应用落地等层面努力探索。这为百度文库重构为「一站式智能文档创作平台」提供了技术保障。

文心一言问世不过几个月的时间,百度文库已经攻克了多个技术难点,未来还将持续迭代升级。

「我们给自己定的黄金标准就是最可用和最便捷」,百度副总裁、互娱和垂类平台负责人王颖说道。

我们期待看到百度文库上线更多智能创作功能,也期待看到大模型为生产力带来进一步的提升。

产业一站式智能文档平台百度文库文心一言
相关数据
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

暂无评论
暂无评论~