![](https://cdn.jiqizhixin.com/assets/code-modal__close-c158a550a9982aa92801c046548d72945aa912de6f2a012513132fdc02dfc379.png)
Auto Byte
专注未来出行及智能汽车科技
![](https://cdn.jiqizhixin.com/assets/auto-byte__qr-code-89b58c6d2398c12b7def0f2538cac5ff08727062918f9bad97f25b1d61aac000.png)
微信扫一扫获取更多资讯
![](https://cdn.jiqizhixin.com/assets/code-modal__close-c158a550a9982aa92801c046548d72945aa912de6f2a012513132fdc02dfc379.png)
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
![](https://cdn.jiqizhixin.com/assets/science-ai__qr-code-a12e4635c8d3968645bd2b6371981b65b0d21058c5a2c216aef80015b4eb7e43.png)
微信扫一扫获取更多资讯
田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣
以后,写故事这脑力活可以交给 AI 了。
前段时间,模仿人类写作过程的语言模型 Re^3 发布,该模型不需要微调大模型,而是通过设计 prompt 来生成一致性强的故事。现在,该研究团队又提出了一个生成故事的新模型 DOC。论文作者 Kevin Yang、田渊栋也在推特上发文宣传了 DOC 模型,表示 DOC 比 Re^3 生成的故事更加连贯、有趣。![](https://image.jiqizhixin.com/uploads/editor/2c30465b-1fe9-4cd4-828d-2eeccdaa6ff3/640.jpeg)
DOC 框架意指详细大纲控制(Detailed Outline Control),用于在自动生成数千字长故事时提高情节的连贯性。DOC 由两个互补的组件组成:详细大纲组件(Detailed Outliner)、详细控制器(Detailed Controller)。![](https://image.jiqizhixin.com/uploads/editor/f71cb61e-c089-4a19-abff-84aa153194d3/640.png)
论文地址:https://arxiv.org/pdf/2212.10077.pdfDetailed Outliner 负责创建详细的、分层结构的大纲,将写作创意从起草转移到规划阶段。Detailed Controller 则通过控制故事段落与大纲细节对齐,确保生成结果遵循详细的大纲。该研究对模型自动生成故事的功能进行了人工评估,DOC 在多个指标上获得了大幅增益:情节连贯性(22.5%)、大纲相关性(28.2%)和趣味性(20.7%),大大优于 Re^3 模型。此外,DOC 在交互式生成环境中更易于控制。与 Re^3 类似,DOC 通过将写作过程分解为计划、起草、重写和编辑步骤,生成超过 2000 字、情节连贯的长篇故事。DOC 遵循 Re^3 的高级写作过程和基于结构化提示的段落生成。不过 DOC 删除了耗时的编辑步骤,即便如此,但对最终故事的质量没有影响。不同于 Re^3 存在的缺点,如无法保持远程情节的连贯性、与周围环境不符的冗长段落、故事经常偏离最初计划等,DOC 旨在通过两项创新来解决这些缺点:通过 Detailed Outliner 实施更详细的规划,通过 Detailed Controller 在起草过程中相应地进行更详细的控制。![](https://image.jiqizhixin.com/uploads/editor/53d6c451-9053-448a-9488-ae047d0e90cb/640.png)
Detailed Outliner 递归地生成任意粒度的分层详细大纲。图 3 总结了各个组件。![](https://image.jiqizhixin.com/uploads/editor/f1876ea9-8e0d-4c8b-af66-0df58b5404d5/640.png)
Detailed Controller 增强了生成器与详细大纲保持相关性的能力。该研究将 Detailed Controller 实现为 FUDGE 控制器,以根据给定的摘要指导段落生成。在起草过程中,Detailed Controller 的灵活性体现在:- 事件。将事件描述(图 2,橙色文本)逐字输入控制器。
- 设置。如果设置发生变化,该研究通过构建输入摘要来说明角色移动到新设置,与事件描述相比使用较低的控制强度。
- 角色。如果出现了一个没有出现在前一个大纲条目中的角色,该研究还是通过构建一个输入摘要来说明这一点,再次使用较低的控制强度。
![](https://image.jiqizhixin.com/uploads/editor/a384beaf-477b-41c0-ba1b-40c143ba845f/640.png)
该研究比较了处于同一顶级大纲条目的 1000 到 1500 字的段落,而不是完整的故事。评估指标包括三个:连贯性、相关性以及趣味性。结果如表 1 所示,DOC 生成的段落情节更加连贯且与大纲相关。![](https://image.jiqizhixin.com/uploads/editor/fb45317c-915b-491f-a811-357af5b32768/640.png)
表 3 显示了 DOC 根据表 2 中的详细大纲(经大量删节)编写的一个故事(经大量删节):虽然有些问题仍然存在,但故事还保持整体连贯,遵循大纲内容。![](https://image.jiqizhixin.com/uploads/editor/f565fda9-33ac-4b75-a8fc-42c25bb9c03f/640.png)
![](https://image.jiqizhixin.com/uploads/editor/a6687ca0-d4b1-4fb1-8459-b8498a19e3a7/640.png)
人机交互故事生成:如表 4 所示,在四个人机交互指标上,人类更喜欢 DOC 而不是 RE^3 生成的故事:至少四分之三的人表示 DOC 在每个评估指标上都更优秀。![](https://image.jiqizhixin.com/uploads/editor/3c79ac6b-57f0-46ce-a975-a87076acbf4f/640.png)
为了评估 DOC 的两个主要组成部分,该研究对 DOC 进行了如下两种修改:- DOC-NOOUTLINE,仅根据粗略大纲而不是完整的详细大纲生成故事,使用固定强度的 Detailed Controller。
- DOC-NOCONTROL,除了 Detailed Controller 关闭外,其他设置与 DOC 相同。
![](https://image.jiqizhixin.com/uploads/editor/b4e95253-8980-47e9-bd32-afe8770887b1/640.png)
该研究发现,与 Re^3 相比,趣味性的提高主要是由于 DOC 有更详细的大纲;而 Detailed Controller 可能会稍微损害趣味性。该研究通过定性观察发现:进一步增加控制强度会产生更多重复的输出,这些输出越来越狭隘地拟合给定的大纲,而失去了创造力。如下表 6 所示,该研究又进一步实验证明:Detailed Controller 的作用是大大提高 DOC 在起草过程中遵循大纲细节的能力。![](https://image.jiqizhixin.com/uploads/editor/1ba942b5-c10c-46bb-a2dd-b8a432aea4ba/640.png)