Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

被StabilityAI滥用1200万张图后,全球最大图片商也训练了一个生成AI,效果逼真

机器之能报道

编辑:吴昕

除了版权安全,Getty Images 新工具还有一个明显的特点,就是并不关心现实世界。

道高一尺,魔高一丈。

早些时候,全球最有影响力的传统图片经销商之一 Getty Images  起诉 Stability AI 在训练图生文工具 Stable Diffusion 时,滥用超过 1200 万张自家照片。

今天,Getty Images 双管齐下:面向数十万用户,推出一款新的图像生成工具( AI Generator )。自此,用户可以在 Getty Images 授权照片库里放飞创意和想象力。

和 OpenAI 的 DALL-E 3 、Midjourney 等主流文生图平台一样,这款生成工具会根据用户的文本描述或者提示来渲染图像:

比如,「一个布满棕榈树的热带沙滩岛屿」

图片

「黎明时分,一棵拥有巨大手臂的粉红色塑料仙人掌,矗立在沙漠中,超广角。」

图片

「 森林里,一座粉色棉花糖做的建筑,神奇、蓬松、奇怪并充满幻想。」

图片

Getty images 的生成 AI 工具使用了英伟达最新一代的 Edify 模型架构进行训练(该架构也是 NVIDIA Picasso 的一部分),专门接受了 Getty Images 庞大的优质摄影和插图内容库的训练,确保了生成图片高质量、真实的视觉效果。

为此,科技媒体 Verge 记者 Emilia David 亲自体验了一把,看看生成的照片(而不是插图)效果到底有多逼真?

「在背景稍微模糊的舞台上,芭蕾舞演员展示阿拉贝斯克舞姿(单腿站立,另一条腿放在后面)」

图片Getty Images 生成人工智能工具的屏幕截图

看来,这款工具在渲染逼真的人物形象方面做得很好。她也在 Stable Diffusion 尝试了同样要求,感觉 「Getty 生成的照片更加人性化。」

记者将图片发给朋友,后者误将 Getty 生成的图片认为是真实照片。「很明显,这个模型不仅接受插图艺术训练,还接受真实照片训练。」

「效果比预期的要好。」在她看来。不过,Getty Images 库存照片本来就有一种「缺乏灵魂、人造的气质」,因此,这种数据集训练出来的生成器也更容易生产类似让人缺乏感觉的图片。

记者坦言,这种感觉并非 Getty 的生成式人工智能工具所独有,OpenAI 即将推出的 DALL-E 3 生成的照片,「也让我也有同样的想法。」

图片

与市面上主流图生文大模型不同,Getty images 生成 AI 基于一个「精心策划和干净的数据集」。

除了数据版权合法,他们还事先剔除了有被深度伪造滥用风险内容的图片。比如,涉及知名公众人物(安迪·沃霍尔)、真实地点(五角大楼)、知名品牌(巴黎世家)的内容。因此,类似 「乔·拜登位于白宫前」、「安迪·沃霍尔风格的猫」的要求都不会被支持。

Getty 声称,这个模型实际上不知道教皇、安迪·沃霍尔、乔·拜登或任何其他现实世界的人是谁,也不知道五角大楼、巴黎世家是什么,「因为它不想操纵或重现现实生活中的事件。」

当然,最重要的是——这款人工智能生成的图像作品也是「商业安全的」,没有「知识产权风险」。用户可以通过 API 将该工具集成到自己的工作流程中,其使用人工智能生成的所有内容都将属于用户,不会添加到公司现有的内容库中。

工具也会为其创建的所有图像加上一个水印,以表明它们是人工智能生成。Getty Images 也为被使用图片的作者提供了 spotify 式的报酬模式。

图片

在过去的一年里,图像和文本的生成人工智能系统蓬勃发展。但人工智能公司也卷入了无数关于版权内容的法律纠纷。著名艺术家和作家——最近的是 John Grisham 、 Jodi Picoult 和 George R.R. Martin ——起诉 OpenAI 和 Stability AI 等人工智能公司侵犯版权。

作为世界上最大的图片机构之一 Getty images 拥有超过 1.6 亿张受版权保护的图像。在推出自己的工具之前,Getty images 一直直言不讳地批评生成 AI 产品,如 Stable Diffusion,该产品是在其图像内容库的一个子集上训练的,却没有通知或补偿 Getty images 的贡献者。

「在许多情况下,对更高质量的数据(如 Adobe 或 Getty 数据集)进行培训比不分青红皂白地抓取网络产生更好的结果。」该公司指出。

不过,一些开发生成式人工智能工具(包括 Stability AI )的公司认为,他们的内容抓取实践受到合理使用原则的保护——至少在美国是这样。

但这个问题不太可能很快得到解决。现在,通过建立自己的生成人工智能图像平台,Getty images 可以削弱其他想要使用其图像库来训练模型的公司。

事实上,Getty images 并不是唯一一家利用其许可数据建立人工智能图像平台的公司。Adobe 发布了 Firefly 模型,在其 Creative Suite 和 Creative Cloud 服务中对其许可图像进行了训练。

人工智能初创公司 Bria 提供了一个生成式 AI 艺术工具,该工具根据 Bria 从合作伙伴那里获得许可的内容进行训练,包括个人摄影师和艺术家,以及媒体公司和库存图像存储库,这些公司获得了公司收入的一部分。

与此同时,最近推出的头像创作者 Ascendant Art 也承诺向自愿提交作品以训练其模型的艺术家支付版税。

Getty images 还表示,客户最终可以添加自己的数据来训练模型并生成具有其品牌风格的图像。此功能和其他服务将于今年晚些时候推出。

产业
暂无评论
暂无评论~