Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

火山引擎发布全新视频云产品矩阵,与阿里、腾讯推出超低延时直播技术标准

从此以后,直播延时一秒以上就算慢了。

如今,视频影响着每个人的生活,是主流的信息传播方式和载体。人们生产视频的参与度也越来越高——以前是拜年短信,现在是拜年小视频,人们也习惯于用视频获取知识,参与娱乐,广泛的商业场景正在快速转向视频。

2 月 25 日,在火山引擎举办的视频云科技原力峰会上,火山引擎相关负责人分享了对视频体验、交互、增长的观察与思考,并发布面向体验的视频云全新产品矩阵。

根据国际数据公司 IDC 发布的《视频云发展趋势洞察》,数字化时代从商业活动到社会生活,视频数据已经成为连接个人、家庭、社区乃至社会的重要纽带。

「2020 年,国内视频云的增速超过 50%,远超各行业的平均增长速度。预计到 2025 年,全球产出的超过 80% 数据都是非结构化数据,其中大多数都是视频,」IDC 中国研究经理魏云峰在活动中表示。「伴随 5G、AI、4K/8K 等技术的发展,车联网、物联网、视联网使音视频应用从传统视频场景,逐渐扩展至车载视频、智能家居等全新应用场景,全行业视频化的趋势已经形成。」

在此背景下,终端用户对音视频技术的要求进而开始强调高清化、交互式、沉浸式的全方面体验。

火山引擎通过抖音、西瓜视频、番茄小说、飞书等产品沉淀出优秀的能力,包括视频点播、视频直播、实时音视频、边缘计算、veImageX 等产品,能够满足客户对视频能力建设的要求。

据了解,火山引擎视频云包含泛互联网、游戏、金融、广电等场景及解决方案,视频点播、veImageX、实时音视频等核心产品,以及传输网络、智能生产、智能处理等中台支撑服务。

除此之外,火山引擎视频云还支持虚拟偶像演唱会、数字替身 Avatar、一起看抖音等实用功能。虚拟偶像演唱会支持与虚拟偶像主播进行实时互动,为观众带来跨次元沟通的全新体验。数字替身 Avatar 支持设置虚拟人形象在社交平台上互动,可降低创作成本,增加内容吸引力。「一起看抖音」功能支持房间内的所有用户,观看相同播放进度的抖音短视频,增强房间趣味性,营造了更好的沉浸体验。

这些创新玩法,都可以在实际应用中为其他企业的用户增长助力。

设立量化指标,打造面向体验的视频云

火山引擎的使命是开放字节跳动最先进的技术,在长时间的实践过程中,字节跳动总结出面向体验的创新模式。火山引擎视频云技术负责人浩铭表示:「我们需要准确的指标作为指北针,精准反映体验优化与业务数据之间的关系,往对的方向优化,才能不断提高体验。」

火山引擎从播放、画质、互动、性能四个维度,量化和评估视频体验。

在播放体验方面,火山引擎视频云将首帧时间压缩到 100ms 以下,用户感觉不到首帧存在。且相关技术有着更高的稳定性,崩溃率降低到了十万分之一以下,假如用户每天刷 100 个短视频,3 年才能遇到一次播放器崩溃。

画质体验方面,火山引擎 BVC1 编码器相比 H265 能够节省 50% 的码率,在同样的带宽下 BVC1 编码器的画质更清晰。据悉,在画质上火山引擎投入了很多的研发资源,在视频编解码全球顶级赛事 MSU2020 中,火山引擎研发的 BVC 系列编码器获得 17 项评分冠军。而为了量化画质,火山引擎自研的 VQScore 算法,也在 ICME 2021 的「压缩 UGC 视频质量评估」比赛中,获得「无参考视频质量评价(NR-VQA)MOS 赛道」第一名。

互动体验方面,火山引擎视频云集成了抖音美颜、特效、滤镜应用的最佳实践,让视频生产更简单,让用户互动更有趣。另外,实时音视频服务(RTC 技术)支持百万级用户并发,单房间最高支持超过千人上麦,成为国内首家能够提供单房间超过千人上麦的 RTC 服务。

性能体验方面,火山引擎视频云可针对业务场景提供 SDK 参数配置、码率配置的最佳实践,极大提高 H265 的播放占比;其自研的图像编解码算法效果更优,压缩体积相比行业主流产品能再优化 10%-20%;同时,高清低码技术使得片源压缩率可达 20%-35%,相同主观效果下,可节省码率 10%-20%。

由于受到传输协议等因素限制,传统直播技术存在多达 3-6 秒的明显延迟。谭待举例说,有时用手机看比赛直播,经常会忽然听到一阵欢呼,附近的电视观众已经看到进球,自己过会儿才能在手机上看到。即使网速再快,网络直播总是慢半拍。

为了降低直播延迟,视频行业近年来开始使用 WebRTC(网页即时通信)技术。但由于 WebRTC 没有定义信令交互流程,不同使用者都有各自一套客户端与服务器的交互逻辑,效果参差不齐,行业缺乏标准化的解决方案。

基于自身丰富的技术实践,火山引擎、阿里云、腾讯云合作共建了「超低延时直播协议信令标准」,简化信令交互流程,并对 WebRTC 技术做了大量优化,提升扩展性、播放秒开率和成功率,包括支持更多的音视频封装、通信协议,支持快速建立链接降低首帧渲染时间,以及支持信令安全增强等特性。

火山引擎支持的超低延时直播现在已经全面上线,覆盖的用户数量超过 2 亿人,整个直播协议和其他公司互联互通。

该标准首次正式定义了直播「客户端 - 服务器」信令交互流程,将传统直播技术 3 至 6 秒的延时缩短到 1 秒,可广泛应用于赛事直播、在线教育、电商直播等对实时性要求较高的场景。在实践中,新的技术标准使大规模分发的直播延时进入 1 秒大关,最快可达到 500 毫秒。

广泛的商业场景内容正在从图文走向视频。作为字节跳动旗下的企业服务板块,火山引擎在抖音、西瓜视频、飞书等产品的大规模实践中沉淀出很多经验,现已通过火山引擎视频云开放给客户,包括视频直播、点播、实时音视频、云游戏和云渲染等全链路产品。

谭待表示,开放互联是火山引擎云服务的重要发展理念。此次火山引擎与阿里云、腾讯云的技术合作是共建开放的协议标准,任何公司和开发者都可以按照标准接入,期待各方共同推动视频技术发展和应用创新。

产业火山引擎视频云字节跳动
暂无评论
暂无评论~