Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

一周2.5k star,3张照片打造专属形象,开源项目FaceChain让每个人AIGC出个人写真

最近,一些 AI 生成视觉形象的应用爆火,例如只需 9 块 9 就能生成个人写真的「妙鸭相机」。由于操作简单,不涉及任何技术操作,很多用户都纷纷在朋友圈晒出妙鸭相机生成的写真。

图片

妙鸭相机虽然好用,但它是一个需要付费的应用。现在,一个名为 FaceChain 的开源项目可以用 AI 模型打造人物写真。项目上线一周,已经狂揽 2.5k star,今天还上了Github趋势排行榜第一名。

图片

项目地址:https://github.com/modelscope/facechain

用户仅需提供最低三张照片,就可以获得特定风格的个人写真。例如,生成商务证件照:

图片

也可以在 ModelScope 创空间中直接体验这项应用,无需任何安装步骤。

图片

试玩地址:https://modelscope.cn/studios/CVstudio/cv_human_portrait/summary

图片

图片

作者在项目介绍中讲解了 AI 生成个人写真的技术原理,解释了生成式 AI 模型如何成为「写真神器」,我们来看下这部分讲解内容。

个人写真的生成原理

基本原理

AI 生成个人写真的能力来源于 Stable Diffusion 模型的文生图功能,—— 输入一段文本或一系列 prompt,输出对应的图像。而影响个人写真生成效果的因素主要有两方面:写真风格信息和用户人物信息。

为此,项目作者分别使用线下训练的风格 LoRA 模型和线上训练的人脸 LoRA 模型来学习上述两方面的信息。LoRA 是一种具有较少可训练参数的微调模型,在 Stable Diffusion 中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到 LoRA 模型中。

图片

因此,个人写真模型的能力分为训练与推断两个阶段,训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸 LoRA 模型;推断阶段基于人脸 LoRA 模型和风格 LoRA 模型生成个人写真图像。

训练阶段

训练阶段的输入是用户上传的包含清晰人脸区域的图像,输出是人脸 LoRA 模型。

具体来说,项目作者首先使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法,来处理用户上传图像,得到包含正向人脸的图像;接下来使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,该项目使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后使用上述图像和标签数据微调 Stable Diffusion 模型得到人脸 LoRA 模型。

推断阶段

推断阶段的输入是训练阶段用户上传图像和预设的用于生成个人写真的输入 prompt,输出是个人写真图像。

在推断阶段,该项目首先将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中;接下来使用 Stable Diffusion 模型的文生图功能,基于预设的 prompt 初步生成个人写真图像;随后,该项目使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中进行挑选;最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

项目作者已详细介绍安装与使用方法,并将项目代码开源,感兴趣的读者快去试试吧。

工程AIGC
相关数据
权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

人脸检测技术

人脸检测(face detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。

推荐文章
暂无评论
暂无评论~