Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

打造虚拟IP信手拈来:百度大脑视频人脸融合产品上线

人工智能技术发展的基础上,越来越多的新业态正在涌现。近日,百度大脑开放平台上线视频人脸融合产品,用户可通过人脸编辑技术,定制化生成非常接近真人的虚拟人脸图,并可高保真地替换已有视频素材中的形象。背靠百度大脑开放平台领先的图形图像AI技术,这一产品解决了广告创意、互动娱乐、游戏影视等行业打造虚拟IP被高门槛要求拒之门外的痛点,同时又可以规避肖像权与隐私权风险,应用前景广阔。

官网信息显示,该产品可生成不同种族、年龄、性别、五官风格、肤色等的虚拟人物形象,满足用户的全方位需求。最重要的是,以前视频换脸总是伴随侵权风险,而该产品可以让你打造专属你本人IP的虚拟人脸,全程合法合规,可有效保障肖像权与隐私权,避免风险。此外,网络生成的形象可以定制观赏性高的角色,以满足虚拟广告形象、虚拟主播形象、虚拟游戏影视形象等领域的高要求。

在效果上,不同场景均可以打造出观赏性好,趣味性强,风格独一的虚拟形象,且输出的视频可以保持高清晰度,并消除关键点、颜色等的抖动,具有非常高的稳定性。同时,产品的使用操作也相当简易化,无需海量素材,仅一张图片即可实现视频级别形象替换,很快就能得到结果,仅需非常低的用户成本。

(视频人脸融合产品输出效果)

据了解,视频人脸融合技术在实际应用中,往往因为视频画面的复杂性,造成面容僵硬、光照条件变化、身份信息失真等问题,影响观众体验,而且传统解决方案输出效率也较低。对此,百度大脑视频人脸融合产品利用极易获取的先验知识,如3DMM系数,区域纹理编码等,通过生成模型实现对于任意人脸的全方面编辑,涵盖身份、姿态、表情、光照、妆容等维度,具备很大的灵活性,同时展现出强大的控制力。

(人脸形象替换示例,自左向右每列依次为换脸,换妆,光照控制效果)

为保障视频人脸融合输出的高质量与高保真度,百度团队设计了Identity-Style Normalization Module框架,可利用身份信息和区域纹理编码对主干生成网络特征进行调制,使得视频源的身份和区域纹理信息得到最大化的保留,在“换脸”时让观众很难分辨出差异。同时,该产品利用一个简单的前向模型来实现,仅用单图就能对视频进行换脸,数据效率更高。

此外,鉴于该方案在人脸融合技术领域的领先性,百度相关论文得到学术界肯定,被美国人工智能协会(AAAI)2021年会收录。同时,该产品面向娱乐行业的相关从业人员或爱好者,用户可在百度大脑开放平台官网进入产品页面,更多信息可访问:https://ai.baidu.com/tech/face/facemerge_video

(视频人脸融合技术框架)

借助这一全新产品,更多开发者与从业者将能够体验到虚拟角色形象带来的新潜力,延伸出更多的玩法,让娱乐行业更智慧化。实际上,作为百度打造的新型AI技术基础设施,百度大脑正通过这些技术能力与产品方案的输出,在工业、农业、教育、零售、文化娱乐、企业服务等众多行业落地创新应用和智能化升级,仅AI能力就开放了273项。未来百度大脑也将持续开放能力和产品,让更多行业走上AI之路,发展新业态,提供新动能。

Powered by Froala Editor

产业百度大脑
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
推荐文章
暂无评论
暂无评论~