Jason Bailey作者Artnome来源Geek AI编译

最新访谈首次披露拍出「天价」AI画作背后的故事

围绕新技术将有更多可能性。将会有越来越多的工具被创造出来,将会创造出新的艺术家,新的艺术作品和新的使用这些工具的艺术方法。不过,将人从艺术中剔除出去,毫无意义。

不久前,拍卖行佳士得在一家大型拍卖场以 43.25 万美元(约合人民币300万)的高价拍出一件人工智能艺术品。这幅作品是由来自法国艺术团队「Obvious」,团队主要成员是三名25岁的青年,他们没有接受过正式的艺术培训。 左图:《埃德蒙·贝拉米(Edmond Belamy)的肖像》在佳士得以432,500美元的价格拍卖;右图:汤姆·怀特基于罗比·巴拉特 (Robbie Barrat )的2017 art-DCGAN 平台生成的作品。

外界对于在这幅AI天价作品的创作过程有着诸多疑惑——人工智能艺术家罗比·巴拉特(Robbie Barrat)的作品值得称赞吗?为什么「Obvious」夸大了算法的作用?「Obvious」 真的表示在考虑为他们的算法申请专利吗?在创作爱德蒙·贝拉米肖像的过程中,Obvious 扮演了什么角色?在「Obvious」看来,人工智能和艺术是如何一同向前发展的?

在这篇采访中,我采访了 Obvious 的技术负责人 Hugo Caselles-Dupre。我向他提出了上述问题,直接得到最真实的答案。我相信 Hugo 在这次采访中是坦诚而透明的(即使可能为他带来一些麻烦)。

我对 Hugo 的采访是全方位的,他在采访中也给出了他未经过滤的观点。因为我已经给了 Hugo 超过 6800 字了,在我们深入介绍采访内容之前,我想分享一些来自人工智能艺术社区的其他成员的想法,来为这个故事提供一些平衡。

Mario Klingemann用 生成性对抗网络创作的画作

我采访了受人尊敬的人工智能艺术家 Mario Klingemann,他创作了《埃德蒙·贝拉米(Edmond Belamy)的肖像》,令人赞叹。他向我们分享道: 

「这件作品的成功应该归功于什么,谁也不容易回答。

这里有一个重要因素,这项工作是在艺术背景而不是在科学的背景下创造出来的,所以,没有必要像科学研究一样引用以前的工作或列出创造的工具和框架。

说到 Ian Goodfellow 的生成性对抗网络(Generative Adversarial Network,GAN),我认为这是一种生产工具,类似于数码艺术中的 Photoshop 或绘画中的画笔。

据我所知,Ian 并不是一个艺术家,也没有将他创造的 GAN 当做艺术作品,因此, 我认为在某份作品中提及他或其它研究人员的工作是合乎礼貌的,但是我也并不认为因为在创作过程中使用了他的技术,就需要将他称赞为艺术家」。

「但在 Robbie 的工作中,情况就不同了:他策划了训练数据集,训练了模型,并把它放到了 GitHub 上。最后,Obvious 可以直接使用这个模型,让它根据随机特征向量生成一些图像,最后从中选出他们想要的艺术品。

所以,你可以说 Robbie 完成了这个过程中三分之二的工作。

汤姆·怀特基于罗比·巴拉特(Robbie Barrat)的 2017 art-DCGAN 平台生成的作品

另一位备受尊敬的艺术家 Tom White 自上世纪 90 年代中期以来一直在探索人工智能和艺术。他认为, Obvious 使用了类似的代码库和相同的训练集。

事实上,Tom 亲自运行过 Robbie 的模型,并能做出几乎和爱德蒙·贝拉米的肖像一模一样的图像。他认为「爱德蒙·贝拉米画像」是一部「借鉴」而来的作品。

Hugo 关于这方面的想法在下面的采访中有详细的介绍。他特别要求我把这段视频作为部分证据,证明 Obvious 的确训练了他们自己的 GAN。

接下来,我们进入第二部分,亦即我与  Hugo Caselles-Dupre 的对话。(JB=Jason Bailey;HC=Hugo Caselles-Dupre;JB=Robbie Barrat。)

Robbie Barrat 应该为其创作的 Edmond Belamy 的肖像受到称赞吗? 

JB:我可能要问一些难以回答的问题,但我认为这很重要,因为我知道你想通过这次采访来消除一些误会。Robbie Barrat 在你做创造的作品中做出了一定贡献,你认为他因此应该受到赞扬吗?或者你会说,他不过造了相机,而使用相机的是你?你对此有何看法?

HC:是的。我认为这是个好问题。我们也经常问自己这个问题。我们会想,「好吧,我们能做些什么呢」?但最终,事实是我们做出了这件作品,并形式化定义了这个问题,这就是我们想要做的事情。

我认为,在我们项目向外界展示的过程中,他也承担了很多责任。所以,我们欠他很多,这就是我们想对他说的,我们想和与他建立好的合作关系。所以我们欠他很多。我们祝他成功。

我们希望,如果人们喜欢我们的项目,他们也会去看他的项目,看看他在做什么。所以,我们认为在这种情况下,他应该得到一些回报。然后,我考虑更多。我们到底能做什么? 

JB:这些问题只是为了将事情说清楚,而这次采访正是我们做这件事的最佳时机,我们的访谈将会深入一些:你能在不使用 Robbie 的代码的情况下完成 Belamy 项目吗? 

HC:是的,我确实是这么认为的,因为我们同时关注很多不同的数据集。

我们已经知道我们想要做的是一些类似古典艺术的工作,像肖像画之类的。这个想法我们已经思考成熟了。因此,当我们看到 Robbie 的工作的时候,我们就想「好吧,这真的很方便,所以我们可以试着用它。」

是的,我们肯定会自己找到一种方法。在查看他的代码之前,我在硕士阶段已经做了很多与 GAN 相关的工作。这只是收集数据集的问题,由于我们具备抓取数据的能力,我们总能找到一种方法。

我们主要用他的代码来完成 scraper 网络爬虫的数据抓取工作,从而获得所有的艺术作品数据。最后,创建 Belamy 集合所使用的代码是我曾经提到过的 GAN 置换技术。

JB:是 PyTorch DCGAN 吗?

HC:我曾在攻读硕士期间进行了这项工作,我对 GAN 编程十分熟悉。

JB:大多数情况下你都会使用 scraper 收集图片数据吗?

HC:是的,我会用它收集数据。这是一个 Python 脚本,当你运行它时,它会收集所有的数据(比如肖像类的数据)。你可以通过它收集所有的肖像数据。

JB:你从哪里得到的这些图像?

HC:在 Wikiart.com。

为什么你说「不仅仅是人类才具备创造力」?这是否意味着人工智能能自主完成工作,即使你知道事实并非如此? 

JB:你怎么看「不仅仅是人类才具备创造力」这一说法?你是不是高估了机器,现在又说那不是你的意思? 

HC:是的。完全正确。

我想这就是当你在做某件事却没人关心的时候会发生的事情,然后你就会变得很茫然,做出一些非常蠢的事情。

当每个人都有这样的观点时,他们就会回到你之前做过的事情上然后你就必须证明它是正确的。我们一直在证明这一点,因为我们仍然认为创建图像的 GAN 运算符的这一部分非常有趣,而且存在某种形式的创造力……我们只是觉得这样做很酷。对我们来说,这只是一种有趣的说法。

JB:你之前想过你们的事件会被放在显微镜下被放大吗?

HC:如果我们知道将会有 400 篇关于我们工作的新闻报道,我们肯定会这么做。但在那一刻,我们就想,『是啊,这太愚蠢了,好吧,不管怎样,让我们把这个放上去。』

但回顾过去,当我们看到这种情况时,我们就会说,这是一个大错误。你所能做的就是承认错误。

GANS展示了什么创造性行为? 许多人觉得他们没有表现出创造性的行为。

HC:对于我来说,如果你能给它一定数量的数据示例,那么你就可以继续看到潜在空间中的生成结果,对我来说,这种差距需要被填补。所以,一定有某种类似发明创造这样的事情。所以我想我有一些创造力。

因为创造力是一个非常宽泛的术语,所以它可能会被误解,因为创造力是与人类相关的东西。但在基本的,低层次上,它被赋予了一组图像,它可以创建不属于训练集的图像,这是一些被模型转换的东西,有某种创造性。所以这只是你理解「创造力」这个词的一种方式。也许从某些角度你可以说这是创造力。

JC:听起来你认为这取决于你对创造力的个人定义? 有人说,GANs 只是近似分布,这并不是真正的创造性,但听起来你觉得它是创造性的? 

HC:是的。这就像,无论你认为创造力是什么,如果我们符合同样的定义,我们就不得不在某些事情上达成一致。如果我们用同样的定义来定义创造力,比如说,这个概念,那么 GANs 就会符合这个概念。或不呢? 我想,这只是一种观点——我理解人们会说 (这) 不太好,我们理解,但这只是一种观点。

你是否声称你要为这个算法申请专利,即使它不是你的? 

JB:所以有一篇文章引用了你的话,说你决定不为你的算法申请专利。你跟我说过你从来没这样说过。但是在你们的画作前署名 Ian Goodfellow,所以你不认为这是一种申明著作权的表现?

HC:是的。「Belamy」在法语中被翻译成「Goodfellow」。所以我认为这个论点真的不好,因为我们说了很多次「Belamy」是法语中「Goodfellow」的翻译,因为我们钦佩 Goodfellow,他创造了GANs,所以我们把公式写在这里。

这是一个数学表达式,不是我们的,不是他的。它不属于任何人。这和 GANs 很像,但我们尊重 Goodfellow 因为他创造了这篇论文,但它是开源的。所以,我们从没想过要对 GAN 算法进行版权保护。这说不通。

因为对我来说,作为一个机器学习的研究者,这样想是很荒谬的,因为,你不能给一个定理或算法申请专利因为它是人类常识的一部分,任何人都可以自己调用它并使用它。这是常识的一部分。

是的。文章中有越来越多我们从未说过的话。

在创建 Edmond Belamy 肖像时,Obvious 做了哪些贡献?

JB:那么是别人写了你用的 GAN 代码,对吧? 你用 DCGAN 来画 Belamy 了? 

HC:是的。完全正确。我们使用了 DCGAN。这是 PyTorch 中可用的实现,它存在于 Soumith Chintala 程序代码库 ,所以我们使用它是因为我们尝试了两个变体,因为在我的研究中,我已经编写过许多不同类型 GAN 的代码,所以我已经有了代码。

最后,当我做了全面研究后,我认为 DCGAN 没问题。这与技术性能无关;我们只是说,『嘿,这就是使用 GANs 的新方法。「我想像 GANs 一样的东西,对人工智能艺术来说很有趣,但它也是研究。」

比如,GANs 进行了真正的技术创新,而我们并没有宣称要做这样的事情。我们只是想有正常的 GANs 工作良好,并允许我们做想做的。

因为现在我们正在利用 3D GAN 做一个的项目,我想这次的技术创新会更大。我们正在与 Max Planck 研究所的一些研究人员联系,希望使用他们的一种模型来创造和训练 GAN。

在这个项目中,我认为我们越来越多地参与到它的工作中来。但因为这是我们的第一个项目,使我们工作的起点。这似乎是个合理的主意。这个项目看起来不错。我们尝试了很多超分辨率算法,所以最后我们尝试了 GAN,我们也尝试了其他不使用机器学习技术的更传统的算法。最后,我们找到了一种提高性能的方法,其效果非常好,能得到很漂亮的结果,我们觉得这很酷,我们会坚持做下」。

是的,我们只是尝试了很多模型,当我们认为模型的结果对于我们的第一个项目来说已经足够好时,我们说「好了,现在让我们试着向世界展示它」,也许我们可以通过它为我们进一步的研究筹集资金,看看我们可以通过它做些什么。因为我们的第一想法是「好吧,让我们试一试吧」。

如果我们设法表达一些意见,同时人们对我们感兴趣,我们就可以启动新的项目,然后我们继续沿着这个新项目做下去。如果没人关心,我们就会停止工作,然后我的两个朋友打算回去工作,我们就会停止,继续我们的生活——我有博士学位,他们有工作——我们继续我们的生活。

但是,爆炸性的事实真的改变了一切。我想,是的,一个很大的误解是,这只是我们的第一个项目,所以我们想做这个。

JB:与我一起工作过的一些工程师会认为这是一种现成的技术。你们的工作没有太多的技术革新。如果没有技术性的创新,那么 Belamy 项目的创新点在哪里? 

HC:所以对于这个项目,我们猜测它的创新点是……我们以一种简单而不是精密的方式展示了它因为它真的很容易理解,我认为这就是创新

但既然它已经引起了如此多人的共鸣,那么这里肯定有一些与前人不同的东西。一开始,我们想做一些原创的,独特的事情。但你无法真正控制人们对你所做事情的看法。所以是的,也许它真的是可以实现的才是关键。

但我们真的不知道创新究竟有多大。所以对于进一步的项目,我们有很多思考。但还有一件事必须认真考虑,那就是我们没有钱。

我们没有计算能力, 所以我们在这第一个项目上花了很多钱进行尝试,当我们觉得我们的结果已经足够好,我们就会停下来,因为继续研究下去会耗费我们大量的金钱和时间,我们真的不能负担得起这样的创新。因为如果你没有计算能力,你就不能做出一些创新的成果。

当然,我从他们在 Reddit 上发布的那天起就知道了「progressive GAN」,我想在第二天尝试一下,但我就是做不到。这和大的 GAN 论文是一样的,比如说它需要 512 个 GPU 核心(这是我们没有的),而我们没有这么多预算。

所以现在,如果你想训练这个模型,你就无法做到。所以,是的,我们想要做一些创新的事情,但是我们必须从某个小项目开始获得一些资金并继续工作,我们慢慢积累一些信誉,才能有机会获得更多的计算能力。

这是做出真正创新的事情的一种曲线救国的思路

在我们创作 Belamy Family 的时候,我们没有办法去做一些真正有创意的事情——或者,我认为创意不够。尝试真正的创新对我们来说是非常困难的,因为我看到在我的研究中, 做出真正的创新需要经历无数次的尝试和失败。如果你失败了, 你对模型的训练就没有意义了,然后你必须为此付出金钱和时间。

所以,我们负担不起。

你为什么没有开源自己的代码呢?

JB:还有一些简短的小问题。我让一些人知道我在采访你,问他们有什么问题。有人问,如果你真的想让公众明白这一点,为什么不开放源代码? 

HC:是啊,好吧,为什么不呢?实际上我们可以做到,但我认为它已经是开源的了。就像我说的,我们用的是 DCGAN,是的,它已经上线了。但如果有人感兴趣的话,我们可以这么做。

但我们主要是想指出,我们使用的不同技术,这些技术也在我们的 Medium 博客中实现了。这就是 DCGAN PyTorch 代码仓库。我们还受到了 Robbie Barrat 的 art-DCGAN 代码仓库的启发。我们可以发布这些数据集,但是这没什么意思。我们只是去掉了所有有双面的画或者像真的肖像画的画。但我们并不反对开源。

对我来说,开源的过程就是获取别人的代码然后开源,就好比它不是你的,只要指出你从哪里得到这些代码,而我在 Robbie Barrat 的 GitHub 和 Sumith 的 GitHub 上得到了这些代码。你可以用它。这些工具已经可用了。

JB:所以开源意味着你获得了比你想要获得的更多的荣誉,因为你实际上没有写任何代码? 

HC:是啊,我想你说得很有道理。如果我站在 Robbie Barrat 的立场上,我就不希望看到我的代码被用在 Obvious 公司发布的任何东西上,因为这是我的代码。

我们已经和很多记者谈论过他,说我们受到他所做的事情的启发,在我们的主要博客文章中,你可以访问他的 GitHub 的链接。这是我们讨论的第一件事。前面, 我们还真的跟他有所交流。

比如, 当我们这样做时, 讨论过我们是否需要给他留言, 问他这样做是否可行。他告诉我们, 他没有意见, 他告诉我们「好吧, 我以为你只用代码而不是训练模型」。然后我们说,「不,不,我们训练了我们自己的模型。我们调整了超参数使其工作」。我们玩得很开心,最后,他说一切没问题。他让我们引用他的代码,我们在网站上就是这么做的。

我们真的不想偷他的想法,也不想偷他的代码,我们想对他保持诚信。

GAN 从此会走向何方?

JB:看得出你对艺术有一些热情,你如何看待人工智能和艺术的关系?人工智能给艺术带来了了什么,谁在创作有趣的作品,你如看待它相对于更大的艺术领域的关系以及你对它的热情? 

HC:我认为我们被这么频繁地曝光的原因之一是人工智能艺术揭示了人们对人工智能的看法,揭示了人们对人工智能的恐惧和误解。这就是为什么它也得到了如此多的关注。

所以在艺术领域,我想说这真的很有趣,因为它展示了这个社会的一些东西,因此,我认为艺术是一种很好的方式来揭示社会的情绪和人们现在的想法。

所以这确实代表了目前与人工智能相关的行业的氛围以及所有的误解。我认为这也是人工智能艺术有趣的原因之一,因为它展示了今天人类的一些东西。

我看到 GAN 是在 2014 年被提出的,(而且) 第一个结果并不是很好。现在,每隔 6 个月,我们就会在技术上有一个很大的飞跃,所以我们看到了各种各样的 GAN 的变体,然后我们得到了 DCGAN、我们得到了 Progressive GAN、我们得到了 big GAN 而这是第一个得到了逼真的脸的结果的模型。

Progressive GAN 是一次巨大的技术飞跃。我认为,Big GAN 也是一个巨大的飞跃,因为图像的多样性非常大。所以从技术的角度来看,由于研究人员的速度非常快,我认为围绕这项技术将会有越来越多的可能性

不仅仅是 GAN,因为 GAN 是一个巨大的例子,现在显得非常有趣,但是我们不会对人工智能研究感兴趣,由于人们在人工智能研究上投入了大量的精力,将来会有更多的突破。所以,我认为将会有越来越多的工具被创造出来,那将会创造出新的艺术家,新的艺术作品和新的使用这些工具的艺术方法

我们真的认为这个工具不可思议。当我们说到摄影的时候,我们的意思是,当摄影第一次出现的时候,它对于高级工程师来说就是一种工具,而我们现在不过是有了同样的人工智能工具。也许人工智能会像摄影一样引发一场全新的艺术运动。所以我们希望是这样,但我们不能确定这一点。我不知道它是否会像摄影一样长久,是否会像摄影一样重要,但我认为这是一个很好的机会。

JB:我看到了一些类似谷歌 Deep Dream 的东西,一旦代码成为开源,任何人都可以添加照片。当我添加照片时,一开始我很惊讶,我想,「这比 Salvador Dali 好」,但在添加了 10 张照片之后,它就失去了新鲜感。所以再也没有人对 Deep Dream 图像感到兴奋了,因为他们意识到即使是他们的祖母也可以通过点击按钮来实现。那么, GAN 与 Deep Dream 有何不同? 

HC:我明白你的意思了。我想在这里我们可以把它和摄影相比较。

任何人都可以拿着他们的手机去拍任何东西。那么,是什么让摄影变得如此不可思议或者如此有趣呢? 所以我认为,就像在摄影中一样,你必须添加一些技巧,这些技巧会被你的工具以及传达的信息放大。

当你看到艾未未的照片和他的中指之类的东西时,你会发现,任何人都可以做这样的摄影,但是他的摄影方式是非常相关的,并且带有强烈的信息。这就是为什么它很重要。

我认为随着时间的推移,我们会看到有最好的想法的艺术家,我想说,也许最具创造性的使用工具的方式最终会被认可,而不仅仅是使用新的东西或者与之类似的东西。

也可以说「好吧,你只是在用 Deep Dream 来形容 GAN」。我们完全同意这一点。为了让人们开始得到相机和拍照,为了让未来伟大的艺术家们崛起,你需要将技术展示出来。

此外,我认为我们所做的工作可能会促使人们去了解这个工具,他们也许会比我们更有创造力。我们不在乎这一点。因为我们不是在竞争。我们想要让这项技术发光发亮,让越来越多的人了解人工智能,了解机器学习——我对机器学习充满热情,所以我想让人们了解它。我想让他们知道它有多棒,有多有趣。

我认为,最终,你不能愚弄人们——艺术家最终会脱颖而出,最好的作品自然会出现。一百万年来这样的过程一次次重复上演。我们希望并相信,最好的艺术家会得到他们应得的东西,得到他们真正应得的绽放。

未来人工智能艺术之所以能够具备趣味性,最重要的决定因素是技艺。我认为并不一定需要一系列的技术革新。我想我们现在已经有了这样的技术,你可以用很多方式去探索潜在的杰作。你需要这样的工作和奉献才能找到一种方法发掘出这些杰作。

JB:对于人类来说,似乎区分出好的 GAN 艺术作品变得越来越重要。公众有一种反乌托邦的观点,认为人工智能将取代艺术家。但是你刚才描述的正好相反。

HC:我完全赞成 

JB:人们使用 GAN 进行优秀的艺术创作的例子有那些?什么是好的 GAN 艺术?

HC:是啊,什么是好的 GAN 艺术作品的例子?复制以前做过的东西在艺术史上已经做了很多了。我认为这也是我们工作的很小一部分。

肖像在很长一段时间里都是艺术中非常重要的东西,重新创造肖像并从不同的角度看它是一件有趣的事情。所以我们受到了启发,我们认为这是一种非常引人注目的方式,能够展示它的趣味性。

你的意思是我不认为机器会取代艺术家之类的东西。最后,艺术是为人类创造的,所以它需要有人类的参与。我想这也是我们工作中的一件事,那就是在某种程度上它真的像人类一样会做出一些看似愚蠢的决定,所以我想这也是为什么它能引起人们共鸣的原因。

比如,如果你做出了一个非常能够引起机器的注意的东西,我们无法理解它,所以它对我们来说就不再有趣了。最后,是人们在欣赏艺术,而不是机器,所以把人的部分完全从艺术过程中移除没有任何意义

产业人工智能应用
2
相关数据
Ian Goodfellow人物

Ian Goodfellow 是机器学习领域备受关注的年轻学者之一,他在本科与硕士就读于斯坦福大学,师从吴恩达,博士阶段则跟随蒙特利尔大学的著名学者Yoshua Bengio研究机器学习。Goodfellow 最引人注目的成就是在2014年6月提出了生成对抗网络(GAN)。这一技术近年来已成为机器学习界最火热的讨论话题,特别是在最近几个月里,与GAN有关的论文不断涌现。GAN已成为众多学者的研究方向。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

暂无评论
暂无评论~