杜伟、魔王机器之心报道

这竟然不是阿汤哥?这个「真的吓人」视频火爆全网

好莱坞影星「阿汤哥」又一次成为深度造假视频的主角。

近年来,人们对深度造假(deepfaking)既着迷又担忧。这项技术可以替换视频中的人脸,并利用机器学习使最终生成效果看起来非常逼真。

随着深度造假技术越来越先进,一些人因为恶趣味或意图谋取私利而将这项技术应用在侵犯他人权益的领域,如 2019 年的「一键脱衣」AI DeepNude 等。因此,人们开始呼吁限制这类技术的应用。

但并非所有使用深度造假技术的人都怀有恶意,有些人只是想要创建一些有趣的视频。近日,一段有关好莱坞影星汤姆 · 克鲁斯打高尔夫球的深度造假视频在网络上迅速传播,第一眼看过去,很多人都认为是汤姆 · 克鲁斯本人。这段视频的创建者为 TikTok 用户「deeptomcruise」。视频中的「阿汤哥」不仅长得极像,声音也几乎与本尊无异。这不是汤姆 · 克鲁斯第一次成为 deepfake 视频的主角,但这次依然让人惊艳。

大家可以先从以下几个片段中判断到底像不像阿汤哥本人:

除了打高尔夫球之外,这位 TikTok 作者还创建了一些其他场景中的「阿汤哥」视频。比如房间里滑倒:

又如表演魔术:

不过在下面的慢放镜头中,还是可以看到一些瑕疵,比如太阳镜在戴上之前消失了(特别是左镜片)和嘴唇的变化。

图源:verge。

虽然存在一些瑕疵,但造假效果已经接近完美。有网友表示:「这是我见过生成效果最逼真的深度造假视频之一,就连声音也非常地接近。」不过,也有人担忧称:「这些极度逼真的深度造假视频也着实令人头疼,我们还怎么相信电视上看到的是本人呢!」

想要观看完整视频的读者,可前往 TikTok 作者主页:
https://www.tiktok.com/@deeptomcruise?

「阿汤哥」背后的 deepfake 技术——DeepFaceLab

火爆全网的「阿汤哥」视频使用的技术依然是我们熟悉的 DeepFaceLab。

 项目地址:https://github.com/iperov/DeepFaceLab/

DeepFaceLab 是制作 deepfake 视频时非常常用的软件,该 GitHub 项目目前已获得近 2.4 万颗星。DeepFaceLab 的特点是灵活、简单、扩展性强,并且具备 Windows、Colab、Linux 等多个版本。

该软件整合了多项 deepfake 功能,比如换脸:

减龄:

施瓦辛格瞬间变年轻。

换头:

 对口型:

英女王伊丽莎白二世的圣诞演讲 deepfake 视频截图。在这个视频中,「女王」甚至跳了一段舞蹈。

去年 5 月,该项目作者 Ivan Perov 等人撰写了相关论文,详细介绍了这一 deepfake 神器。

论文链接:https://arxiv.org/pdf/2005.05535.pdf

据介绍,DeepFaceLab 的 pipeline 包含三个主要部分:提取、训练和转换。

第一步:提取。这部分包含多种算法和处理部分,如人脸检测人脸对齐和人脸分割。下图展示了「提取」步骤的流程:

第二步:训练。这是 DeepFaceLab 实现逼真换脸效果的最关键步骤,具体步骤参见下图:

第三步:转换。该步骤的过程参见下图:

此外,为了提高生产效率,DeepFaceLab 还包括多种生产工具,如「提取」步中的手动人脸识别与人脸关键点提取工具(下图 a)、XSeg 手动人脸分割编辑器(下图 b)。

目前,DeepFaceLab 项目发布了多个版本和教程,感兴趣的读者可以自行尝试。

参考链接:
https://www.theverge.com/22303756/tiktok-tom-cruise-impersonator-deepfake
https://www.dexerto.com/entertainment/insanely-accurate-tom-cruise-deepfake-goes-viral-on-tiktok-1521789/
理论DeepFaceLabAI换脸
21
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

人脸检测技术

人脸检测(face detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。

人脸对齐技术

人脸对齐可以看作在一张人脸图像搜索人脸预先定义的点(也叫人脸形状),通常从一个粗估计的形状开始,然后通过迭代来细化形状的估计。

推荐文章
捷高富家族办公室・创始人
感觉会走歪掉,不过走歪也是必然的