快手科技音视频技术亮相ChinaMM,首次公开多媒体传输协议KTP

近日,在中国多媒体大会产业前沿论坛,快手科技算法科学家周超博士发表题为《多媒体传输算法应用和展望》的演讲,首次对外公开了其多媒体传输协议KTP(Kwai Transport Protocol,快手传输协议),该协议解决了重要的内容传输问题。以下为周超博士演讲的主要内容。

快手的核心理念就是记录,力图打造一个简单、平等、普惠的平台。在快手,每个人都可以通过记录和分享来获得独特的幸福感,也因此,快手的视频内容汇聚了中国社会生活的方方面面,被称为“流动的清明上河图”。

多样化的业务对传输协议提出的挑战

如今快手的日活达1.3亿,月活超过3亿,拥有累计超过70亿条原创内容,并且以每天1500万条的速度在递增。在用户使用过程中,上传视频、直播推流的体验直接关系到用户留存。因此,开发使内容传输更稳定、更快速、更实时的传输协议,显得格外重要。

快手的业务形态包括短视频和直播,由于业务的多样化,对传输协议的要求也各不一样。

在短视频业务中,短视频上传的成功率与速度对用户体验至关重要。在快手,每天都有海量的视频上传和播放,并且视频的分辨率达到720p。高分辨率提高了视频的清晰度,却也给视频的上传和播放带来挑战。

快手用户多,分布广,短视频上传的网络和地理环境更是非常复杂。在一些网络条件苛刻的地方,例如山区、地铁、闹市等,要么基站覆盖不够好,要么人多网络竞争激烈,保证视频上传的成功率,对于提升用户留存和作品数量均有很大的影响。此外,视频的上传速度直接决定了上传耗时,进而会影响用户上传的取消率。一般而言,耗时越久,取消率越高,所以视频的上传速度也是需要考虑的关键指标。

除了短视频,直播也是快手的主要业务之一。快手的直播用户规模大,且场景丰富,包括户外直播、游戏直播、才艺直播、自拍直播等等。与传统的一些直播平台相比,快手主播直播时的物理和网络环境更加多样化且不可控。此外,快手的直播玩法多样,虽然都属于直播的范畴,对传输的具体要求却有很大的差异。

例如,从延迟的角度,游戏直播能容忍的延迟一般大于普通互动直播,但二者都在秒级范围内。而直播连麦则对延迟的要求极高,一般不能超过400ms。在清晰度方面,游戏直播对清晰度的要求则非常高,目前,快手已经支持蓝光质量的游戏直播,而普通互动直播和连麦,对清晰度和分辨率的要求则远远低于游戏直播。

无论短视频上传,还是直播推流,均是快手内容的源头。短视频上传的成功率和速度,影响了用户的留存和内容供给量;主播的推流质量,则直接影响成千上万粉丝的观看体验。因此,在各种异构且不可控的网络环境下,保证快手内容生产源头的服务质量,对于提升快手的总体用户体验至关重要。

快手开发多媒体传输协议  从内容生产源头优化用户体验

为了满足多样的业务需求,同时能进行深度的优化,快手建立了自己的音视频云端服务,开发了快手多媒体传输协议KTP(Kwai Transport Protocol,快手传输协议),从内容产生的源头优化用户体验。

据介绍,快手KTP的设计,涵盖网络状态估计、网络传输控制、信源信道联合优化等多个维度,支持动态码率自适应、帧率自适应、混合FEC/ARQ、非对称差错保护等。

目前,KTP已全面服务于快手的业务,在性能方面,短视频上传可以达到抗90%丢包,上传失败率相比传统TCP降低27%,取消率降低23%;在直播连麦时,延迟低于400ms,并且对20%丢包做到无感知;在直播推流场景下,当网络丢包率为零时,KTP直播推流的带宽利用率比TCP推流提升约25%,随着丢包率增大,KTP相对TCP的增益越明显,当网络丢包率增大到20%时,KTP直播推流的带宽利用率达到TCP推流的六倍。此外,KTP还支持多路复用,可以做到无感知网络切换,比如用户在WIFI和4G间互相切换时,网络也不会中断。

KTP是一个面向多媒体业务的传输协议,具有很强的扩展性,能够灵活支持各种业务场景,还可以在各个场景之间无缝切换,动态支持各类延时模式。此外,KTP内部各个功能模块相互解耦,能非常容易地集成各种新算法。依托快手的流媒体大数据系统,能快速通过AB测试,验证算法性能。从技术角度来看,KTP是基于UDP而实现的,所有的算法与策略均在UDP之上,与TCP相比,KTP更加灵活可控。

关于KTP的未来展望

KTP的设计目标是突破地域、网络业务的限制,达到高流畅、高清晰、高可靠、低延迟的内容传输,同时在各种极端的弱网环境下能做深度的优化。

为进一步提升用户体验,快手计划在KTP中采用质量自适应技术,通过深度学习的方式,联合优化应用层与网络层,根据网络情况自适应视频质量。此外,在消费(播放)端,KTP计划支持超低延迟的多码率自适应方案,进一步降低播放端的卡顿率与延迟,提升观看体验。

最后,周超博士表示,快手一直秉持积极开放的心态面对与高校和科研机构的合作,不仅能为科研提供海量的研究数据及支持深度学习的计算资源,同时,完善的大数据系统、监控平台、KTP协议在快手也都实现了模块化,任何创新的想法都能够在数亿用户的使用中得到快速的验证,从而推动相关技术的快速发展。

产业多媒体大数据ChinaMM视频快手
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~