Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

一键改图,视觉中国终于出手AIGC了

近日,视觉中国再次上新AIGC功能——基于生成式AI技术的创意工具。


随着生成算法、预训练模型、多模态技术等 AIGC 技术的突破性发展,以 ChatGPT 为代表的 AIGC 技术完成了从感知、理解世界到生成、创造世界的革命性跃迁。人工智能进入 AIGC 时代后,AIGC 将成为 Web3 时代的生产力工具,为元宇宙内容生成提供新的解决方案,有望开启新一轮内容生产力革命。

视觉中国作为以 “优质内容 + 智能科技” 为核心驱动的智能交易与服务平台,一直以来积极拥抱 AIGC 新技术带来的变革。公司确立了 “AI + 内容 + 场景” 的发展战略,以客户需求为导向,并结合公司业务场景展开相关 AIGC 的研发工作。公司的 AI 智能中台已经在交易平台、创作者社区、数字资产管理系统等产品上应用,包括以图搜图、绘图搜索人脸识别、智能标签、画质增强、美学评分、智能抠图、自动修图、元素拆图、色彩分析、黑白照片上色、视频封面生成、精彩片段提取等多项 AI 智能服务,这些能力也通过公司 API 开放平台向第三方平台提供服务。

近日,视觉中国再次上线 AIGC 新功能 —— 基于生成式 AI 技术的创意工具。用户可通过该工具中的 “模特转换”“插画转换” 功能在线对版权图片进行二次创作,在提高内容生成效率的同时,还能提高内容多样性。

值得一提的是,客户使用 AI 创意工具对原版权图片进行二次创作时,在下载图片并确认付费后,原版权图片创作人仍可获得相应分成收益。


模特转换

“模特转换” 功能可识别不同的人脸特征并进行转换,弥补模特类型相对单一的不足,以适用于更广的应用场景。


插画转换

“插画转换” 功能通过分析摄影作品的色彩、纹理、明暗度等特征,可轻松实现不同风格作品之间的转换,为用户提供更丰富的创意素材。





以上功能已在视觉中国旗下 vcg.com 网站上线,目前仅对部分签约客户开放,如需试用,请联系 vcg 网页客服或销售代表。

在使用 AI 工具进行二次编辑时,客户应遵循现行国家法律法规的要求合法使用,使用时还应向公众标注此图片含有 AI 辅助生成内容元素。视觉中国表示,后续还将很快解锁更多 AI 创意工具:画面扩展、智能修图;以及更加令人期待的 AI 内容生成功能:灵感绘图、商品背景合成等全新 AIGC 应用,为用户创作高效赋能。


灵感绘图



画面扩展


商品背景合成


智能修图



此次推出的 AI 创意工具系列功能,是视觉中国数字版权交易平台 “AI 智能搜索 + AI 灵感生成” 双服务模式的应用落地。今年 3 月,视觉中国基于多模态、自然语言理解以及知识图谱等技术,推出了首个 AIGC 应用产品 ——AI 智能搜索。通过 AI 智能搜索,用户不仅可以使用 “关键词”,还可以通过 “自然语言” 的方式,快速准确找到对应图片,当用户在搜索不到合适内容时,平台则会根据用户输入的文案,进一步提供 AI 生成内容服务,全方位满足用户创意需求,促进数字内容交易。


2023 年 4 月 11 日,国家网信办公布《生成式人工智能服务管理办法(征求意见稿)》,征求意见稿明确规定,利用生成式人工智能提供服务的主体对训练数据的合法性承担责任,不得含有侵犯知识产权的内容。在人工智能大模型火爆的当下,数据及版权保护成为重要议题。数据 / 版权方在人工智能中的重要地位得到认可,大模型为优质的版权的数据资源进行付费,将成为生成式 AI 的产业趋势。

同时,在专业细分领域,仅靠单一基础大模型,很难实现非常完美的解决方案,需要多个模型共同来支持,以及外部专业的数据、API 等能力的补充。训练数据集的质量、类型、合规性、风格都会决定 AI 生成的内容质量。专属的优质数据价值将进一步凸显,有望实现多元化变现。

视觉中国自 2000 年 6 月成立以来,对新技术、新趋势保持关注并积极付诸实践。公司拥有超过 4 亿的优质图片、视频、音乐等数字版权交易平台。2014 年 4 月,公司在深圳 A 股主板上市(股票代码:000681),自上市以来交易收入超过 50 亿元。公司拥有全球化的创作者内容生态,2016 年收购了微软创始人比尔・盖茨创办的全球第二大高端图片库 Corbis 全部资产;2018 年收购了位于加拿大的国际摄影师社区 500px,注册用户覆盖全球 195 个国家和地区,数量超过 2200 万;2023 年控股国内领先的音视频交易平台光厂创意。公司在全球范围内拥有超过 55 万签约创作者,并与新华网、CCTV+(国际视频通讯社)、中新社、GettyImages、美联社、法新社等全球 300 余家专业媒体、版权机构建立了战略合作关系。

公司将充分发挥全球创作者生态、海量优质合规的内容数据以及内容交易变现场景等核心优势,运用人工智能区块链、大数据等技术进行产品与服务的研发。积极与各方共同探索全新 AIGC 商业模式,实现数字创新,赋能实体经济,为内容产业高质量发展注入新动能,为国家文化数字化战略贡献力量。
产业图像生成AIGC视觉中国
相关数据
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

图搜索技术

在计算机科学中,图遍历(也称为图搜索)是指在图中访问(检查/或更新)每个顶点的过程。这样的遍历是按访问顶点的顺序进行分类的。比如,树遍历就是图遍历的一个特例。 与树遍历不同,图遍历可能需要多次访问某些顶点,因为在转换到一个已经被探索的顶点之前,它并不一定是已知的。随着图形变得越来越密集,这种冗余变得更加普遍,导致计算时间增加;随着图形变得越来越稀疏,相反的情况也成立。 因此,通常需要记住哪些顶点已经被算法探索过了,这样就可以尽可能少地重新访问顶点(或者在最坏的情况下,防止遍历无限延续)。这可以通过将图中的每个顶点与在遍历期间的“颜色”或“访问”状态相关联来完成,然后在算法访问每个顶点时检查和更新。如果顶点已经被访问过,它就被忽略了,路径就不再被继续了;否则,算法会检查/更新顶点,并继续它当前的路径。

推荐文章
暂无评论
暂无评论~