Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AIGC加持游戏剧情,无限故事的游戏交互体验来了

游戏公司 Cyber Manufacture Co. 发布了最新的 AIGC 技术预览 Quantum Engine,用户可以用自然语言随意与 NPC 互动,AI 会根据用户的表达,实时生成剧情互动。

在 24 年前上映的《黑客帝国》里,救世主尼奥对抗着一个人工智能程序所控制的世界,人们第一次见识到 AI 技术所带来的震撼。

图片


二十多年前看,这是科幻片。二十多年后看,像不像预告片?

在一些竞技领域,AI 多年前就已达到、甚至超越人类的最高水平。最近一年来,生成式 AI 在绘画、文本、代码等创作领域的表现也越来越成熟,OpenAI 的聊天机器人 ChatGPT 更是将这一趋势推向舆论顶点。最新有消息传出,微软正在考虑向 OpenAI 投资 100 亿美元

而 AIGC 在游戏领域的进展也备受关注,投资公司 a16z 不久前发表过一篇研究文章《AIGC 在游戏中的革命》,认为在所有娱乐类目中,游戏会是生成式 AI 影响最大的领域

图片

近日,游戏公司 Cyber Manufacture Co. 发布了最新的 AIGC 技术预览 Quantum Engine,用户可以用自然语言随意与 NPC 互动,AI 会根据用户的表达,实时生成剧情互动,支持英文、中文、日本等多种自然语言的交互。下面这段视频,正在《黑客帝国》的框架里,用户扮演尼奥与 AI 加持的 NPC 墨菲斯互动。


这些对话都是《黑客帝国》剧本中完全没有过的对话和场景,AI 学习了人物关系、表达逻辑和角色人物,NPC 墨菲斯能够在故事设定框架里与用户随机互动,开展无限的故事剧情互动。

据其团队介绍,行业在 AIGC 生成游戏剧情方面探索已经很多年,不过此前预览发布都基本是视频演示,用户只能观看感受,而他们这次发布的技术预览已经可以让用户上手体验了。目前支持玩家扮演故事中的某个角色,用自然语言与 NPC 任意互动,AI 会实时提供互动台词与剧情推进,在游戏剧情方面实现了千人千面的个性化体验。

很快他们将在下一版本的更新中上线用户自主上传故事剧本让 AI 学习,用户可选择任意角色与其他 AI 角色互动的功能。长远来看,他们还将重点推进 AI 生成剧情与游戏画面的结合。

Cyber Manufacture Co. 旗下除了有刚发布技术预览的 AIGC 引擎 Quantum Engine,还有基于虚幻引擎 5 驱动的元宇宙项目 GAMA,其创始人是人工智能领域的连续创业者吕骋 Jesse。

在其团队的帮助下,我们用中文体验了 AI 实时生成游戏剧情的互动,也提前测试了下用户自主上传故事剧本后,AI 在快速学习角色与我们互动的感受。

下一代游戏的体验之旅

进入 quantum-engine.ai 的网站后,首先会有几分钟的故事背景介绍,在部分网络环境下,该网站可以访问,但可能无法体验 AI 互动部分。

目前体验到的是《黑客帝国》故事,用户扮演救世主尼奥,AI 扮演 NPC 墨菲斯,按住 F 键就可以开展跟它的对话,在移动设备上可长按屏幕说话互动。

如果我们用中文对话,NPC 也会用中文来回应,如果用英文或别的语言,NPC 也会用相应得语言来互动。

图片

图片

刚开始互动时,我已经忘记了墨菲斯这个角色,所以问了一堆他是谁,要干啥之类的问题。他的回答成功让我想起了故事剧情,墨菲斯是我的上级,在故事设定里,它的角色任务是要启发我反抗机器世界的控制。所以无论我的表达多么刁钻古怪,它总是能很好的应对,而且会有意无意地会把对话拉回到故事的剧情线上。这一点挺让人吃惊的,NPC 有推进剧情的意识,它会想尽办法去实现它的角色目的。

我们也突发奇想也问了一些无聊的问题,类似于让他把墨镜送给我们之类,从它的回答能看出,它记得这副墨镜是这个 NPC 角色的标志,说什么也不能给我 —— 做人,哪怕是做机器人,也是有底线的。这个底线就是 NPC 会坚持输出与故事、角色相关的内容,而不是天南地北给你一些不着边际的回答。

图片

在多轮对话的体验后,我们也发现了一些此次预览中存在的明显不足。比如 NPC 的回答有时会显得着急,过于想要推进剧情的进度,以及语音识别带来的延迟、声音的机械感也让沉浸感有所减分。

但与 ChatGPT 带来的震撼体验类似,Quantum Engine 具备多轮对话的能力,互动表述的合理行和逻辑性,完全不逊于真人游戏策划们为 NPC 所做的设计。这一技术对游戏开发来说可能是划时代的,AIGC 的效率是人力无法比较的,a16z 在前述文章中曾预言,AIGC 在游戏领域的运用会打破游戏开发中 “成本、质量和速度” 的不可能三角。

在其团队的帮助下,我们提前体验了下一更新版本中 “用户自主上传故事” 的功能,AI 在学习了故事、角色设定后,用户可以自由选择任何角色与其他角色对话,体验全开放式的故事互动。

我们尝试让 AI 学习了《甄嬛传》滴血认亲的故事桥段,然后扮演甄嬛与皇后 NPC 对话。

图片

能感受到 AI 已经成功领悟故事中的角色关系,以及皇后 NPC 在故事中的任务设定是让甄嬛说出与温实初的事件真相,会千方百计地逼着甄嬛坦白。

在体验了 AI 实时生成的游戏剧情互动后,我们有一个无法回避的疑惑,它是不是一个语音版的 ChatGPT?我们也将这个疑惑抛给了 Quantum Engine 团队,其回复说:

Quantum Engine utilizes low-level OpenAI APIs and open-sourced models, trained and finetuned by Cyber Manufacture Co., to achieve highly contextual, text-based multi-modal (voice + text + 3D models) & multilingual (e.g. English, French, Chinese, Japanese, Spanish) understanding of user intentions, character-character interaction and environment response within a scene. On top of it, Quantum Engine contains a highly scalable , streaming orchestrator that schedules calls to large-language-model APIs and transforms raw-text outputs into structured data (audio text-to-speech, 3d point cloud, Unreal Engine primitives, screenplay scenes) that comprises of the end user experience. The result is self-composing script in the Hollywood standard that is able to interact with user in near-real-time fashion, able to retain memory of past interactions, and respond to normal and outlier user requests while adhering to the character and plot.

其中可以解读出的关键信息是:

  • 他们有用到 OpenAI 的定制 API 接口,从多轮体验上推测,类似于 GPT3.5 的级别,所以在对话感受上跟 ChatGPT 有相似之处;
  • 除了 OpenAI,他们也针对游戏互动的垂直场景,做了向上和平行的技术开发,比如语音识别,又比如让角色限定在故事中,坚持输出角色目的等等;
  • 目前与用户实时互动的内容会自动转化为标准的好莱坞剧本格式,这是为下一步的游戏画面结合做准备。

Quantum Engine 的本次技术预览让我们看到,AIGC 在游戏中的探索又前进了一步,“无限生成”“合理” 故事的能力已经基本能实现了,但继续向前发展,其商业化前景会如何?

AIGC 如何在游戏产业淘金?

最近这一轮 AIGC 热潮引发关注,有一篇重要的文章起到了推波助澜的作用,红杉资本两位合伙人与 GPT-3(AI 模型)联合撰写《Generative AI: A Creative New World》。

在这篇文章中,将 AI 划分为了传统的 “分析型 AI” 和 “生成型 AI”。前者常常用于内容推荐算法,分析已经存在的东西;后者则用于创造,生成新的东西。AI 绘图、AI 写代码以及上面介绍的 AI 实时生成游戏剧情,都是生存型 AI 的技术结果。

这篇文章认为当下的市场阶段,平台层开始巩固,模型继续变得更好、更快、更便宜,以及模型的使用趋向于免费和开源,应用层的创造力爆发的时机已经成熟,正在孕育一款生成型 AI 的杀手级应用。

该文章认为,“正如移动通信通过 GPS、相机和随身连接等新功能催生出了新类型的应用,我们预计这些大型模型将激励新一波生成型 AI 应用的诞生。正如十年前移动通信的拐点为少数几个杀手级应用创造了一个市场缺口一样,我们预计杀手级应用也将出现在生成型 AI 当中。如今,比赛正在激烈进行当中。”

图片


作者尝试预测了下各个领域的应用爆发时间表。

图片

而其中游戏应用场景,也成为市场论证中 AIGC 商业化的最重要方向,甚至终极方向,比如上述 a16z 的分析。AIGC 在游戏产业商业化的被看好的原因包括:一是游戏产业的吸金能力天然强大;二是游戏是最为复杂的艺术创造形式,也是体验最为丰富的艺术形式;三是 AIGC 在游戏环境中的行动空间更大,世俗约束相对较少。

a16z 认为生成型 AI 在游戏产业的商业化前景首先体现在降本方面,比如游戏美术师可以在数小时内生成高品质图片,以往用手绘可能需要数周的时间完成,更具有变革性的是,AI 可以通过学习美术师的风格来迭代创作,实时生成无尽的变种图片。

其列举了《荒野大镖客 2》这款造价超过 5 亿美元的游戏,研发耗时 8 年,具有超过 1000 个 NPC 角色,每一个 NPC 都有自己的个性、美术作品和配音演员,在一个接近 30 平方英里的世界,超过 100 个任务。

而通过 Quantum Engine 的技术预览中,我们似乎看到了这些成本正在快速消失。a16z 也认为,游戏制作中涉及的每一个资产都会有一个生成的 AI 模型,某些情况下的内容的成本会降为零。

国内的 AIGC 玩家也在证实这一趋势。游戏上市公司昆仑万维 CEO 方汉最近表示,AIGC 与游戏的碰撞首先会让美术费用得到优化,视觉效果更好的同时成本更低。

而方汉还提出,在游戏上线后,剧情、地图、关卡都可以通过 AIGC 来动态生成,玩家可以享受自己独有的专属剧情和人物,一个游戏实现千人千面,NPC 也不再是简单规则约束的玩偶,可以对玩家行动做出自己的反应,游戏产品的可玩性将大大提升。因此,在 AIGC 加持的游戏体验将得到极大提升,市场规模将挤压其他娱乐形态的空间。

其描述在 Quantum Engine 的技术预览中已经得到一定印证,NPC 对玩家行动的反应、剧情体验的千人千面。这一技术实现的速度似乎比红杉资本的预测来得更快一些。

目前在 AIGC + 文本领域跑出的 Jasper 在去年营收预计达到 6000 万美元,估值 15 亿美元。而在 AIGC + 图像领域的一众创业公司也开始拥有规模化营收的能力。随着 AIGC 往视频、3D 等领域的深入发展,游戏产业正在迎来一波翻天覆地的技术变革。

按 Quantum Engine 团队的规划,这次所发布的技术预览,是其整体规划的三分之一阶段成果,接下来还有关键的两步,一是 AI 实时互动剧情与游戏画面的结合,二是最终将技术封装成一款可操作的游戏。他们认为游戏最终会成为 AIGC 方向的杀手级应用。

看到这儿,相信很多人会想,最终游戏会变成什么样子?会和《黑客帝国》《西部世界》《头号玩家》等一众科幻片所描绘的场景那样吗?到那时,游戏与现实的边界会消失吗?

这当然也是 Quantum Engine 团队需要思考的问题之一。在系统测试时,他们经常会与 AI 随机互动问答,其中一个经常提及的问题是:这个世界是真实的吗?
产业AIGC
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

暂无评论
暂无评论~