什么是TCP拥塞控制算法?

最近花了些时间在学习TCP/IP协议上,首要缘由是因为本人长期以来对TCP/IP的认识就只限于三次握手四次分手上,因此但愿深刻了解一下。再者,TCP/IP和Linux系统层级的不少设计均可以用于中间件系统架构上,好比说TCP 拥塞控制算法也能够用在以响应时间来限流的中间件上。更深一层,像TCP/IP协议这种基础知识和原理性的技术,都是通过长时间的考验的,都是前人智慧的结晶,能够给你们不少启示和帮助。面试

本文中会出现一些缩写,由于篇幅问题,没法每一个都进行解释,若是你不明白它的含义,请本身去搜索了解,作一个主动寻求知识的人。算法

TCP协议有两个比较重要的控制算法,一个是流量控制,另外一个就是阻塞控制。网络

TCP协议经过滑动窗口来进行流量控制,它是控制发送方的发送速度从而使接受者来得及接收并处理。而拥塞控制做用于总体网络,它是防止过多的包被发送到网络中,避免出现网络负载过大,网络拥塞的状况。架构

拥塞算法须要掌握其状态机和四种算法。拥塞控制状态机的状态有五种,分别是:"Open,Disorder、CWR、Recovery和Loss状态"。四个算法为"慢启动,拥塞避免,拥塞发生时算法和快速恢复"ide

Congestion Control State Machine

和TCP同样,拥塞控制算法也有其状态机。当发送方收到一个ACK时,Linux TCP经过状态机的状态来决定其接下来的行为,是应该下降拥塞窗口cwnd大小,或者保持cwnd不变,仍是继续增长cwnd。若是处理不当,可能会致使丢包或者超时。学习

什么是TCP拥塞控制算法?

一、Open状态优化

Open状态是拥塞控制状态机的默认状态。这种状态下,当ACK到达时,发送方根据拥塞窗口cwnd(Congestion Window)是小于仍是大于慢启动阈值ssthresh(slow start threshold),来按照慢启动或者拥塞避免算法来调整拥塞窗口。设计

二、Disorder状态中间件

当发送方检测到DACK(重复确认)或者SACK(选择性确认)时,状态机将转变为Disorder状态。在此状态下,发送方遵循飞行(in-flight)包守恒原则,即一个新包只有在一个老包离开网络后才发送,也就是发送方收到老包的ACK后,才会再发送一个新包。blog

三、CWR状态

发送方接收到一个显示拥塞通知时,并不会马上减小拥塞窗口cwnd,而是每收到两个ACK就减小一个段,直到窗口的大小减半为止。当cwnd正在减少而且网络中有没有重传包时,这个状态就叫CWR(Congestion Window Reduced,拥塞窗口减小)状态。CWR状态能够转变成Recovery或者Loss状态。

四、Recovery状态

当发送方接收到足够(推荐为三个)的DACK(重复确认)后,进入该状态。在该状态下,拥塞窗口cnwd每收到两个ACK就减小一个段(segment),直到cwnd等于慢启动阈值ssthresh,也就是刚进入Recover状态时cwnd的一半大小。 发送方保持 Recovery 状态直到全部进入 Recovery状态时正在发送的数据段都成功地被确认,而后发送方恢复成Open状态,重传超时有可能中断 Recovery 状态,进入Loss状态。

五、Loss状态

当一个RTO(重传超时时间)到期后,发送方进入Loss状态。全部正在发送的数据标记为丢失,拥塞窗口cwnd设置为一个段(segment),发送方再次以慢启动算法增大拥塞窗口cwnd。

Loss 和 Recovery 状态的区别是:Loss状态下,拥塞窗口在发送方设置为一个段后增大,而 Recovery 状态下,拥塞窗口只能被减少。Loss 状态不能被其余的状态中断,所以,发送方只有在全部 Loss 开始时正在传输的数据都获得成功确认后,才能退到 Open 状态。

四大算法

拥塞控制主要是四个算法:

1)慢启动;

2)拥塞避免;

3)拥塞发生;

4)快速恢复。

这四个算法不是一天都搞出来的,这个四算法的发展经历了不少时间,到今天都还在优化中。

什么是TCP拥塞控制算法?

慢热启动算法 – Slow Start

所谓慢启动,也就是TCP链接刚创建,一点一点地提速,试探一下网络的承受能力,以避免直接扰乱了网络通道的秩序。

慢启动算法

1) 、链接建好的开始先初始化拥塞窗口cwnd大小为1,代表能够传一个MSS大小的数据。

2)、 每当收到一个ACK,cwnd大小加一,呈线性上升。

3)、 每当过了一个往返延迟时间RTT(Round-Trip Time),cwnd大小直接翻倍,乘以2,呈指数上升。

4)、 还有一个ssthresh(slow start threshold),是一个上限,当cwnd >= ssthresh时,就会进入“拥塞避免算法”(后面会说这个算法)。

拥塞避免算法 – Congestion Avoidance

如同前边说的,当拥塞窗口大小cwnd大于等于慢启动阈值ssthresh后,就进入拥塞避免算法。算法以下:

1)、收到一个ACK,则cwnd = cwnd + 1 / cwnd。

2)、 每当过了一个往返延迟时间RTT,cwnd大小加一。

过了慢启动阈值后,拥塞避免算法能够避免窗口增加过快致使窗口拥塞,而是缓慢的增长调整到网络的最佳值。

拥塞状态时的算法

通常来讲,TCP拥塞控制默认认为网络丢包是因为网络拥塞致使的,因此通常的TCP拥塞控制算法以丢包为网络进入拥塞状态的信号。对于丢包有两种断定方式,一种是超时重传RTO[Retransmission Timeout]超时,另外一个是收到三个重复确认ACK。

超时重传是TCP协议保证数据可靠性的一个重要机制,其原理是在发送一个数据之后就开启一个计时器,在必定时间内若是没有获得发送数据报的ACK报文,那么就从新发送数据,直到发送成功为止。

可是若是发送端接收到3个以上的重复ACK,TCP就意识到数据发生丢失,须要重传。这个机制不须要等到重传定时器超时,因此叫作快速重传,而快速重传后没有使用慢启动算法,而是拥塞避免算法,因此这又叫作快速恢复算法。

超时重传RTO[Retransmission Timeout]超时,TCP会重传数据包。TCP认为这种状况比较糟糕,反应也比较强烈:

  • 因为发生丢包,将慢启动阈值ssthresh设置为当前cwnd的一半,即ssthresh = cwnd / 2.

  • cwnd重置为1

  • 进入慢启动过程

最为早期的TCP Tahoe算法就使用上述处理办法,可是因为一丢包就一切重来,致使cwnd重置为1,十分不利于网络数据的稳定传递。

因此,TCP Reno算法进行了优化。当收到三个重复确认ACK时,TCP开启快速重传Fast Retransmit算法,而不用等到RTO超时再进行重传:

  • cwnd大小缩小为当前的一半

  • ssthresh设置为缩小后的cwnd大小

  • 而后进入快速恢复算法Fast Recovery。

什么是TCP拥塞控制算法?

快速恢复算法 – Fast Recovery

TCP Tahoe是早期的算法,因此没有快速恢复算法,而Reno算法有。在进入快速恢复以前,cwnd和ssthresh已经被更改成原有cwnd的一半。快速恢复算法的逻辑以下:

  • cwnd = cwnd + 3 MSS,加3 MSS的缘由是由于收到3个重复的ACK。

  • 重传DACKs指定的数据包。

  • 若是再收到DACKs,那么cwnd大小增长一。

  • 若是收到新的ACK,代表重传的包成功了,那么退出快速恢复算法。将cwnd设置为ssthresh,而后进入拥塞避免算法。

什么是TCP拥塞控制算法?

如图所示,第五个包发生了丢失,因此致使接收方接收到三次重复ACK,也就是ACK5。因此将ssthresh设置为当时cwnd的一半,也就是6/2 = 3,cwnd设置为3 + 3 = 6。而后重传第五个包。当收到新的ACK时,也就是ACK11,则退出快速恢复阶段,将cwnd从新设置为当前的ssthresh,也就是3,而后进入拥塞避免算法阶段。

后记

本文为你们大体描述了TCP拥塞控制的一些机制,可是这些拥塞控制仍是有不少缺陷和待优化的地方,业界也在不断推出新的拥塞控制算法,好比说谷歌的BBR。这些咱们后续也会继续探讨,请你们继续关注。

写在最后:

欢迎你们关注我新开通的公众号【风平浪静如码】,海量Java相关文章,学习资料都会在里面更新,整理的资料也会放在里面。

以为写的还不错的就点个赞,加个关注呗!点关注,不迷路,持续更新!!!

海量面试、架构资料分享

什么是TCP拥塞控制算法?

相关文章
相关标签/搜索