视频直播技术_直播如何实现低延迟

借《让子弹飞》中姜文的名言做为开场白:让子弹飞一下子。
浏览器

某名人吐槽说:还要飞一下子哪?这子弹的延迟也忒大了。服务器

 该名人就是鄙人。网络

为何低延迟很重要?架构


低延迟的子弹能够击杀敌军公里以外,低延迟的直播技术能够秒杀粉丝千里以外。测试

互动直播技术已经成为直播平台的标配。没有互动直播技术的直播平台没法跻身直播行业第一梯队。而要得到互动直播技术,实现低延迟是必须的。大数据

所以低延迟很重要。优化

那么,直播技术如何实现低延迟呢?编码

 请容许我根据即构科技直播技术的经验,和各位分享一下如何实现低延迟。spa

 即构科技的连麦互动直播技术,连麦方的延迟400毫秒,观看方的延迟1秒左右。目前映客直播,花椒直播,一直播和栗子直播都采用了即构科技的连麦互动直播技术。所以,这个直播技术经验是通过市场验证的,是从实操中得来的,而不是单凭理论分析获得的。代理

 通常来讲,延迟低于800毫秒, 才可以在直播中连麦,作一些比较高频的互动,好比相声或者谈话节目。若是延迟高于800毫秒,在直播中连麦的效果就没法被观众接受了。所以,延迟400毫秒的直播技术,是有足够的余地去实现连麦互动直播业务的。

要在直播技术中实现低延迟,有一个简单而要务实的哲学:

1)选择一条最优的路径;

2)在这条路径上作到最优;

3)保持全部路径优质。

下面我将按照这个思路来论述如何实现低延迟。 

选择一条最优的路径

要选择一条最优的路径,有不少方法。目前使用比较多的是网络测速,用户我的链接数据分析,和用户群体链接数据分析等几种方法来选择最优的网络路径。

  • 网络测速

推流端在推流以前,向各个路径发送简单的数据包,而后根据数据包响应的时间来推测哪条路径最快。这个方法比较简单,有效然而有限:选出来的路径只是在该测试时间点最快的,而网络情况是随着时间变化的;另外,简单数据包测出来速度比较快,并不表明流媒体传输数据速度也比较快。所以,这个方法获得的结果只能做为一个指标来参考。

  • 大数据分析

为了回避单个采样时间点测速致使的误差,能够采起对历史大数据进行分析,预测哪一个网络路径最优。对历史大数据进行的分析分为两个维度:用户我的链接数据分析和用户群体链接数据分析。

1. 用户我的链接数据分析

每一个主播用户的使用历史数据是有规律可循的。经过分析这些历史数据,能够发现主播用户从哪里接入,在何时接入,接入到哪一个服务器,走什么路径的效果最优。这些历史数据积累得越丰富,历史数据分析得出来的结论就越靠谱。这个方法可以发现我的主播用户周期性的网络链接状况,能找出大部分时间链接效率最优的网络路径。然而,这个方法的缺点是:数据采样只是基于单个用户,采样点太少,没有全局考虑到该用户所在地区的总体网络链接状况。

2. 用户群体链接数据分析

为了弥补用户我的链接数据分析的不足,这里引入另一个维度的数据分析:某地区用户群体链接数据的分析。针对某用户所在区域的用户群进行历史数据分析,能够发现这个区域网络链接随着时间变化的规律,找出在不一样的时间点,在不一样的接入点链接到哪一个服务器最好。

单点网络测速,用户我的链接数据分析,再加上用户群体链接数据分析综合获得结论,就能比较有效地预测哪条路径最优。选路这部分须要不断地优化,才能积累丰富的用户数据,同时适应网络的变化。

在这条路径上作到最优

选好最优的路径之后,剩下的就是要在该路径上作到最优。这条路径包括了下面几个环节:采集,编码,推流,转码,分发,拉流,解码和渲染。在一个实时的音视频系统架构里,每一个环节都会有必定程度的优化空间。行业内的小伙伴在这条路上已经有过不少探索,这里不想重复讨论别人已经探索过的议题,而只重点讨论下面几个关键点。

  • 选择协议

传输协议的选择十分重要。传输协议必定程度上就决定了延迟的范围。选择传输协议的时候要考虑是推流端仍是拉流端。推流端的协议有RTMP, WebRTC和基于UDP的私有协议。

1. RTMP是基于TCP的标准协议,CDN网络广泛支持,也能作到相对比较低的延迟。即构科技的互动直播技术在推流端使用RTMP协议,拉流端兼容三种协议:RTMP,HLS和FLV。HLS协议的延迟比较大,在须要进行连麦互动的场景下,不该该使用HLS协议。

2. WebRTC的好处在于用户体验好,不须要安装东西,分享一个连接就能够看。可是它有一个缺点,就是WebRTC是Google推的一项技术,除了Google Chrome和Opera支持WebRTC,其余浏览器大部分不支持WebRTC。

换一句话说,40%的浏览器支持WebRTC,剩下60%浏览器不支持,因此适用范围就比较局限。而后,在中国国内,WebRTC在Google Chrome上的表现也大打折扣。最后,由于浏览器没有开放核心的能力,因此在浏览器上运行的协议比较难以作到比较低的延迟。

3. 基于UDP的私有协议十分适合作实时音视频系统,它是面向无链接的,避免了TCP作网络质量控制所须要的开销,可以作到比较低的延迟。可是它也有一个缺点,那就是私有协议的兼容性很差。

CDN支持标准的RTMP协议,可是不支持基于UDP的私有协议。为了吸纳UDP的优势,而避免UDP的缺点,即构科技的互动直播技术采用了基于UDP的私有协议做为补充,在有必要的时候用来弥补RTMP协议的不足。好比说,只有在网络环境比较恶劣或者在跨国互通的状况下,才使用基于UDP的私有协议;好比说,只在推流端到媒体服务器这一段才使用基于UDP的私有协议,而从媒体服务器转推流到CDN网络这一段采用RTMP协议,在这两段之间经过把UDP私有协议转换成RTMP协议来进行适配和衔接。这样一来,即构科技的直播方案既拥有超低延迟的优点,又保留了标准协议广泛被CDN网络支持的好处。

  • 前向纠错和丢包重传

前向纠错简称FEC,英文全称Forward Error Correction,是经过提早采起措施来对抗网络损伤。丢包重传主要针对丢包的状况下,有针对性地对丢失的数据包进行高效率的重传。准确来讲,它们的直接目的不是为了下降延迟,而是为了对抗网络损伤。在不可预测的网络环境中,能很好地处理网络抖动带来的负面影响,间接也会下降了延迟,同时保证了稳定性和流畅性。

通常来讲,前向纠错和丢包重传互补使用,前者属于前验的方法,比较节省时间,可是占用多余的带宽;后者属于后验的方法,比较节省带宽,可是会消耗比较多的时间。在网络比较差状况下,丢包率比较高,那么能够经过前向纠错方法来保证信息完整送达。好比说发送冗余信息,确保在必定丢包率之下,接受方也能准确而完整的还原发送方所要发送的信息。在网络相对比较好的状况下,丢包率比较低,那么能够经过丢包重传的方法来保证信息完整送达。好比说针对丢掉的数据包,经过高效的机制进行重传,确保接受方可以完整的收到发送方所要发送的消息。

  • 缓冲自适应

因为有网络抖动的存在,数据包的到达不是匀速的。

最直接的下降延迟的方法就是把缓冲队列的长度设置为零,接收到什么数据包就直接渲染什么数据包,然而这样作的后果就是播放不流畅,会出现卡顿。

所以,延迟和流畅二者自己就是一对矛盾的因素。咱们要作的是寻找低延迟和流畅之间的平衡点,寻找平衡点的有效方法就是创建缓冲队列。在拉流端和混流服务器都须要创建缓冲队列。对于一个实时系统来讲,缓冲队列的长度必须不是固定的,而是自适应的:当网络很好的时候,缓冲队列的长度就会变得比较短,接近零,甚至为零;当网络很差的状况下,缓冲队列的长度会变得比较长,可是不能超过能接受的上限,毕竟缓冲队列的长度本质上就是延迟的时间。

另外,还能够把缓冲自适应技术和快播或慢播技术结合起来使用。当网络由差转好的状况下,能够适当的播得快一点,尽快缩短缓冲队列的长度。当网络由好转差的状况下,能够适当的播得慢一点,让缓冲队列适当变长,保持流畅性。快播和慢播是结合观众的心理学模型,在适合快播和慢播的条件下采用,让观众没有觉察出播放速度的变化,同时总体感受也显得既流畅又低延迟。

  • 码率自适应

因为网络环境的复杂多变,码率要能自动适应网络情况的变化,也就是所谓的码率自适应。 在网络比较差的时候,要下降码率,让直播保持低延迟和流畅性;在网络比较好的时候,要提升码率,让直播保持高清画质。为了作到码率自适应,对协议选择也很考究。RTMP对码率自适应能作的事情比较有限,由于它基于TCP, 而TCP 下层已经作了网络质量控制,当网络出现拥塞的时候,上层应用不会及时获得通知。基于UDP的私有协议更加适合作码率自适应,由于它基于UDP,而UDP只负责发包和收包,把网络质量控制交给应用层来作,这样应用层会有足够的空间来实现码率自适应。

保持全部路径优质

那么,为了在直播技术中实现低延迟,要选择一条最优路径,还要在该路径上作到最优。故事讲完了吗?没有,咱们忘记了一个前提:总体的道路网络必需要足够好。道路网络很差,怎么选都是烂泥土路,选了烂泥土路,如何可以跑的快呢?所以,要实现低延迟,网络基建必需要足够好。网络基建的质量能够经过如下三个方面来提升:

  • 全网充分覆盖

通常来讲,音视频云服务的机房会分布在核心的几个枢纽城市,边远地区的用户的访问质量是得不到保障的。另外,在中国国内,各个网络运营商的覆盖面是参错不齐的,有些网络运营商对一些边远地区也是覆盖不足的。为了作到全网充分覆盖,能够采用多节点代理和重定向,来确保全网充分覆盖无盲点。这个须要通过实际充分测试,才可以验证各种网络能够充分连通。

  • 全方位保障QoE

网络接入点的覆盖面对QoE(Quality of Experience)十分的重要。从即构的经验来看,经过部署遍及全球范围的接入点可以确保这一点。另外,因为在中国国内存在有“两张大网,多张小网”这样一个局面,BGP在这种状况下十分有必要。BGP可以很好地解决不一样网络之间的互通问题。即构全部的网络接入点都使用了BGP。

  • 优质的网络节点资源

音视频云服务是跑在网络基建上面的,下层网络基建的质量必需要优质,并且音视频云服务和下层网络基建也要深度结合。为了实现直播技术的低延迟,最好能对接一线的网络运营商,这样部署的网络节点资源不管是数量仍是质量上都是有充分的保障。这也是即构团队在过去十多年海量用户运营的过程当中总结出来的经验。

综合来讲,要实现直播技术低延迟,必需要选好一条最优的路径,而后在该路径上作到最优,最后要确保全部路径的质量都是好的。道理就是那么简单,实现起来就是那么难,魔鬼都出在细节上。