陈韵竹编译

机器创作不可避免,用AI打造新《格林童话》的Botnik还想守住文化

流行两百多年的《格林童话》有了一个新版本。

这次,人工智能成为格林兄弟的模仿者,创作了一个名为《公主和狐狸》的「孪生」故事。

上个月,它的音频版本对外发布,其创造者 Botnik,是一家使用机器学习和预测算法来写作的公司。

不过,利用 AI 技术生成童话故事的做法也算不上新鲜事。早在 20 世纪 30 年代,佐治亚理工学院人工智能教授 Mark Riedl 就已经写过这样的故事。此外,加州大学圣克鲁兹分校的人工智能研究员 Issac Karth 也表示已经完成了对格林兄弟语言模仿的程序实现。

但《公主和狐狸》这篇故事脱颖而出的原因在于,它很好地模仿了格林童话和其他民间故事的风格和模式,在某些程度上还保留了格林兄弟身处的那个年代人们对性别所持有的固有偏见。

而且《公主与狐狸》也并不是完全由人工智能撰写而成,Botnik 首席执行官 Jamie Brew 说,这是人类与机器合作的一次创作实验。

他解释说,文本是由两个具有预测文本功能的键盘生成。旁白键盘构建故事的整体结构,而对话键盘模拟了格林童话的叙事风格。人类可以从人工智能生成的各种可能性中进行选择。

「人类作者在写每个句子时都会得到一系列的建议」,而这些「建议」出现的原因被解释为「基于源文本中的单词模式,算法为语句分配了不同的可能性」。

除了《格林童话》,Botnik 也对其他作品也采取了类似的方法,包括摇滚乐队 Radiohead 的歌曲、哈利波特、诗歌等。

「无论你如何对作品进行划分,人类的参与都是我们写作的内核,这一点无可替代。」Brew 说道。

高颜值的公主总是等待勇敢王子的拯救

这仍然是一个非常传统的故事,所以遵循了许多童话故事中的固有套路——一个会说话的狐狸帮助地位卑贱的磨坊主儿子解救了一位美丽的公主,让她免于嫁给自己不爱的可怕的王子。

故事的开头是这样的:

很久很久以前,有一匹带着金色马鞍的金马,它的头上别着一朵美丽的紫色小花。这匹马会把花带到村庄去。有个公主看见花是如此美丽,不由得跳起舞来。公主对他的父亲(面包和奶酪的国王)说:「这实在是太棒了!」

在这个故事中,公主的自我价值很大程度上取决于她的外表,她曾跳了一段形意舞来模仿那个把花带到村庄的金马。

故事的其他部分则不断提醒读者,公主是善良、美好、快乐的,当然最重要的是,她是美丽的。

虽然她曾拒绝按照父亲的意愿行事,但是公主反抗精神的唯一标志仅限此,其他时候公主的行为都是在舞蹈、微笑或哭泣。而与她的母亲(这个故事中仅有的另一个女性角色)相比,公主还是令人羡慕的:王后完全不懂得反抗。

故事中还有五位男性角色:两个王子(其中一者是伪装起来的)、一位国王、一只狐狸以及那匹漂亮的马。

尽管这篇故事里有几处奇怪的过渡和轻微的逻辑问题。不过,整个故事看起来非常有格林童话的风格,这种不协调反倒为整个故事增添了一些超现实的魅力。

机器开始创作了,我们需要保卫文化吗

加利福尼亚大学圣克鲁兹分校的 AI 研究员 Kate Compton 表示:「人工智能语料库训练的系统会习得语料库数据的偏见,这是一个很大的问题。」

不过,人类也参与了《公主和狐狸》的创作,所以故事的偏见不能简单地归咎于机器。

Compton 认为,在这种情况下,部分偏见来自于「作者所受到的文化熏陶,这让作者选择了一个带有类似性质的想法并将其转化为故事。」

有趣的是,这个故事中对于性别的看法其实是一种创作者喜闻乐见的结果。

「在第一次试验时,作者大多倾向于选取一些令人惊讶的元素和故事走向。」Brew 说。故事的第一个版本实际上是磨坊主的女儿拯救了好几位公主。而为了保持格林童话的腔调和美感,这些元素和部分荒谬的细节都是被重新编辑过的。

「任何用人造数据进行训练的系统都有可能造成人为的偏见。」Riedl 说道。

但他也指出:「我们经常认为偏见不是好事,但是要记住,所有数据和所有故事都有带有偏见——如果完全没有任何偏见,那也不会有任何故事。」

Riedl 认为,基于人工智能的叙事目标不一定是要消除所有的偏见,而是决定如何、是否更新人工智能的价值参照系,从而使它产生的故事符合当前的价值观。

「我们的偏见、想法和刻板印象确实会随着时间而改变,而我们未必能及时应用我们的想法」,他说。

如此看来,Botnik 团队的研究人员可以看作是文化的新守门人:他们必须决定是保留文化的某个特有面貌(如格林美学),还是摆脱不再有意义的刻板印象和模式,或者决定彻底发起进攻。

「这是一把双刃剑」,Riedl 说道——不过,如果能握在正确的讲故事的人手中,这把剑仍然是充满魔力的。

文章来源:https://qz.com/1256191/ai-learned-to-mimic-brothers-grimm-fairytales-including-their-sexist-stereotypes/

产业机器创作机器学习Botnik
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语料库技术

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为"body of text"。

推荐文章
暂无评论
暂无评论~