蛋酱报道

带宽成本降低可达50%,字节跳动BVC2.0编码器在MSU 2020拿了四个「第一」

在近日公布的 MSU 2020 比赛结果中,首次亮相的字节跳动 BVC2.0 编码器一举收获了「四个第一」。

首先,让我们看两张图片:

(a) BVC2.0 处理后的图像。

(b) x265 处理后的图像。

上面两张图片是在相同压缩比情况下,x265 和 BVC2.0 的压缩图像效果。这样的对比场景,是否似曾相识?

没错,让人想起了视频网站中「流畅」和「高清」的对比。受移动互联网发展、移动智能终端普及等因素的推动,短视频和直播行业近年来实现了爆发式的增长,但对于业务方来说,存储空间和带宽资源的成本仍然高昂;对于普通用户来说,不清晰的画质和卡顿问题还十分普遍。这些目前所存在的挑战,都对视频编解码技术提出了更高的要求。

从 2005 年开始,俄罗斯莫斯科国立大学(Mosow State University,MSU)每年定期在全球范围内征集各大公司及相关机构研发的视频编码器,在不同的应用场景下对其进行综合测评。视频编码器(Video Codecs Comparison)大赛迄今已连续举办十五届,是视频编码行业内影响力最大的比赛。与往年一样,今年也有很多国内外的顶尖技术团队参赛,分别来自谷歌、英特尔、百度、阿里、腾讯等科技公司,且拥有丰富的比赛经验。

在本年度 MSU2020 offline (1fps)视频编码器比赛中,字节跳动先进视频团队(Advanced Video Group)自主研发的 BVC2.0 编码器从竞争中脱颖而出:在 VMAF、PSNR avg. MSE 两个准则测试中摘得第一名的成绩。同时也在 PSNR avg. log、SSIM 两个准则测试中获得并列第一的排名。

四个「第一」

近日,MSU2020 主办方公开了 20 个团队的测试结果,在 VMAF 准则测试中,字节跳动的 BVC2.0 编码器领先第二名 8%,领先第三名 15%;在 PSNR avg. MSE 准则测试中,则是领先第二名 6%。而在 PSNR avg. log 和 SSIM 准则测试中, BVC2.0 编码器以极微小的差距与阿里、微帧的产品并列第一。

VMAF 准则测试,测试数据越小表示压缩率越高,成绩越好。

PSNR avg. MSE 准则测试,测试数据越小表示压缩率越高,成绩越好。

上图为 PSNR avg. log 准则测试,测试数据越小表示压缩率越高,成绩越好。

上图为 SSIM 准则测试,测试数据越小表示压缩率越高,成绩越好。

据了解,BVC2.0 编码器从框架到算法搭建完全由字节跳动先进视频团队自研,尽管参与人员少,开发周期短,但得益于公司在视频压缩标准领域的技术储备,以及算法方面的创新,最终表现出了更好的压缩性能。

目前 BVC2.0 编码器完全基于传统视频编码和优化技术,随着学界和业界越来越多地使用卷积神经网络等深度学习技术以提高压缩效率、编码优化和视频处理能力。字节跳动先进视频团队表示,团队的相关领域成果未来将融合在下一版本的 BVC2.0 编码器中。

带宽成本大幅降低,画质更清晰,更流畅

未来,BVC2.0 编码器可应用于字节跳动旗下大部分产品,包括抖音、西瓜视频、今日头条等 App 的视频类内容处理,以及云计算、云游戏等基础架构领域。

字节跳动也正在计划将 BVC2.0 编码器开放给合作伙伴使用。先进视频团队的张莉博士表示:「将 BVC2.0 编码器应用到公司业务中后,将能够节省 20%-50% 的流量带宽和存储成本。假设一年的带宽成本为 10 亿,那么使用 BVC2.0 编码器有望比目前最优的编码器节省 2-5 亿。」 

除了帮助业务节省成本外,对于短视频行业的用户,BVC2.0 编码器也很有意义。在有限的网络带宽资源条件下,BVC2.0 的转码能力,可以让普通用户获得更高画质、更流畅的视频体验。例如,原来只能看标清的用户,现在可以获得高清的体验。

在国内视频编解码技术标准领域,字节跳动也有着很高的贡献度。2002 年,数字音视频编解码技术标准工作组(AVS)的成立标志着中国视频标准化工作的正式起步,迄今 AVS 音视频编码标准已经发展到第三代。经过十几年的发展,AVS 视频编码标准的压缩性已经实现了大幅提升。作为 AVS 第三代视频编码标准的重要技术贡献者之一,字节跳动一直通过组织 AVS3 技术研讨会、分享 AVS3 先进技术等各种形式向工业界和学术界推广 AVS 标准。

去年,字节跳动先进视频团队也曾因视频编码国家标准 AVS 方面的技术功效,获得了「2019 年度 AVS 产业技术创新奖」,字节跳动也是该奖项中的唯一一家互联网公司。

此外,字节跳动先进视频团队成员也在多个国际标准化工作组中担任重要角色,如 VVC、H.265/HEVC、H.264/AVC 等多项标准文本主编及编委等,同时,也是多项多媒体国际标准的重要贡献者之一,包括视频编码标准、系统标准、传输协议、文件格式等。过去两年间,字节跳动先进视频团队累计递交了 260 项以上 H.266/VVC 技术提案,被采纳数量超过 130 项。

张莉博士表示:「视频编码优化和传输是一项重要且非常有挑战的工作,只有持续创新,才能保持不断推动技术升级。我们希望与行业一起,为大家提供更好的视频编码技术能力,提升用户的视频体验。」  

参考链接:https://www.compression.ru/video/codec_comparison/hevc_2020/main_report.html

入门字节跳动BVC2.0 编码器四个「第一」
相关数据
字节跳动机构

北京字节跳动科技有限公司成立于2012年,是最早将人工智能应用于移动互联网场景的科技企业之一,是中国北京的一家信息科技公司,地址位于北京市海淀区知春路甲48号。其独立研发的“今日头条”客户端,通过海量信息采集、深度数据挖掘和用户行为分析,为用户智能推荐个性化信息,从而开创了一种全新的新闻阅读模式

bytedance.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

推荐文章
暂无评论
暂无评论~