Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

几行代码安装,免费做图无上限:Stability AI公布DreamStudio开源版本

开源是永远的必杀技。

自从文本到图像开源模型 Stable Diffusion 最初版本发布以来,DreamStudio 一直是 Stability AI 新模型和功能的主要界面。迄今,用户已经借助 DreamStudio 创建了数百万张图像。

最近,DreamStudio 还升级到了 SDXL,实现了比其前身 Stable Diffusion 2.1 更详细的图像和构图,并能用较短的 prompt 来创建描述性图像。

就目前来说,DreamStudio 已经可以生成这样的图像,效果不输 Midjourney 5.1:
图片
尽管 DreamStudio 提供了几乎没有门槛的图像生成方法,但它也有一个条件:付费。SDXL 版本的定价甚至还要更高一些。
图片
而且,对一部分技术过关的开发者来说,他们也希望能够在 DreamStudio 的基础上进行一些应用扩展。

或许是听到了网友们的心声?刚刚,Stability AI 发布了 DreamStudio 的开源版本 ——StableStudio。
图片
开源地址:https://github.com/Stability-AI/StableStudio

「我们相信,扩大技术落地的最佳方式是通过开放、社区驱动的开发,而不是闭源产品的私有化迭代。」Stability AI 表示。

在该公司的规划中,StableStudio 的目标是进行更广泛的社区合作,为生成式 AI 打造一个世界级的用户界面,让用户能够充分控制。尽管 DreamStudio 仍将是 Stability 公司托管的 StableStudio 的实现,但最终目标是培养一个能够超越任何由单一公司开发的项目。

具体来说,StableStudio 和 DreamStudio 有什么区别?

Stability AI 做了一些调整,使得该项目对社区更加友好。包括:

  • 删除了 DreamStudio 专属品牌;
  • 所有在线 API 调用都已被插件系统取代,用户可以轻松更换后端;
  • 删除了专属于 Stability 的帐户功能,例如计费、API 密钥管理等。

扩展功能

DreamStudio 最初被设想为 Disco Diffusion 的动画 studio,2022 年 Stable Diffusion 发布之后,DreamStudio 的重点就转向了图像生成

受今年爆火的对话模型启发,4 月 Stability AI 发布了开源 LLM StableVicuna。DreamStudio 的开源版本 StableStudio 将和 StableVicuna 结合,推出聊天界面。
图片
StableVicuna 对话示例。
图片
Stable Diffusion XL 生成的「Stable Vicuna」。

Stability AI 表示,StableStudio 未来可能会更新以下功能:

  • 通过 WebGPU 进行局部推理
  • 通过 stable-diffusion-webui 进行局部推理
  • 桌面安装
  • ControlNet 工具

安装与使用

StableStudio 项目已在 GitHub 上线,其中包含快速安装方法。
图片
项目地址:https://github.com/Stability-AI/StableStudio

要使用 StableStudio,用户需要先安装 Node.js 和 Yarn。然后按照如下命令克隆 StableStudio 存储库
git clone https://github.com/Stability-AI/StableStudio.git
cd StableStudio
yarn
yarn dev

默认情况下,StableStudio 在 localhost:3000 上运行。用户需要准备 API 密钥才能使用默认的 Stability API 插件;如果没有,则需要在 DreamStudio 上创建帐户并获取密钥。

图像生成主流模型

无论是 DreamStudio,还是开源版本的 StableStudio,其背后的基础模型都是当前大火的图像生成模型 Stable Diffusion。Stable Diffusion 因其能在消费级 GPU 上快速生成高质量图像而得到广泛使用。

Stable Diffusion 模型的技术最早来源于发表在 CVPR 2022 中的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》。为了训练出 Stable Diffusion,研究团队动用了 4000 个 A100 Ezra-1 AI 超大集群, Stability AI 公司提供了这些算力。

2022 年 8 月,Stability AI 宣布发布 Stable Diffusion 并开源,11 月,他们又发布了 Stable Diffusion 2.0 版本。现在,Stable Diffusion 已取代 GAN 成为图像生成领域主流模型。
图片
作为产品平台 DreamStudio 的开源版本,StableStudio 把所有在线 API 调用替换为插件系统,能让用户轻松更换后端,将进一步推动图像生成领域的发展。

参考链接:https://stability.ai/blog/stablestudio-open-source-community-driven-future-dreamstudio-release
工程AI绘图
相关数据
规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

图像生成技术

图像生成(合成)是从现有数据集生成新图像的任务。

推荐文章
暂无评论
暂无评论~