《浏览器工做原理与实践》<02>TCP协议:如何保证页面文件能被完整送达浏览器?

前言:浏览器

在衡量 Web 页面性能的时候有一个重要的指标叫“FP(First Paint)”,是指从页面加载到首次开始绘制的时长。这个指标直接影响了用户的跳出率,更快的页面响应意味着更多的 PV、更高的参与度,以及更高的转化率。那什么影响 FP 指标呢?其中一个重要的因素是网络加载速度。服务器

 

一个数据包的“旅程”网络

下面我将分别从“数据包如何送达主机”“主机如何将数据包转交给应用”和“数据是如何被完整地送达应用程序”这三个角度来为你讲述数据的传输过程。数据结构

互联网,其实是一套理念和协议组成的体系架构。其中,协议是一套众所周知的规则和标准,若是各方都赞成使用,那么它们之间的通讯将变得毫无障碍。架构

互联网中的数据是经过数据包来传输的。若是发送的数据很大,那么该数据就会被拆分为不少小数据包来传输。好比你如今听的音频数据,是拆分红一个个小的数据包来传输的,并非一个大的文件一次传输过来的。性能

 1. IP:把数据包送达目的主机网站

数据包要在互联网上进行传输,就要符合网际协议(Internet Protocol,简称 IP)标准。互联网上不一样的在线设备都有惟一的地址,地址只是一个数字,这和大部分家庭收件地址相似,你只须要知道一个家庭的具体地址,就能够往这个地址发送包裹,这样物流系统就能把物品送到目的地。视频

计算机的地址就称为 IP 地址,访问任何网站实际上只是你的计算机向另一台计算机请求信息。blog

若是要想把一个数据包从主机 A 发送给主机 B,那么在传输以前,数据包上会被附加上主机 B 的 IP 地址信息,这样在传输过程当中才能正确寻址。额外地,数据包上还会附加上主机 A 自己的 IP 地址,有了这些信息主机 B 才能够回复信息给主机 A。这些附加的信息会被装进一个叫 IP 头的数据结构里。IP 头是 IP 数据包开头的信息,包含 IP 版本、源 IP 地址、目标 IP 地址、生存时间等信息。排序

为了方便理解,先把网络简单分为三层结构,以下图:

 

下面咱们一块儿来看下一个数据包从主机 A 到主机 B 的旅程:

1.上层将含有“极客时间”的数据包交给网络层;

2.网络层再将 IP 头附加到数据包上,组成新的 IP 数据包,并交给底层;

3.底层经过物理网络将数据包传输给主机 B;

4.数据包被传输到主机 B 的网络层,在这里主机 B 拆开数据包的 IP 头信息,并将拆开来的数据部分交给上层;

5.最终,含有“极客时间”信息的数据包就到达了主机 B 的上层了。

 

 

2. UDP:把数据包送达应用程序

IP 是很是底层的协议,只负责把数据包传送到对方电脑,可是对方电脑并不知道把数据包交给哪一个程序,是交给浏览器仍是交给王者荣耀?所以,须要基于 IP 之上开发能和应用打交道的协议,最多见的是“用户数据包协议(User Datagram Protocol)”,简称 UDP

UDP 中一个最重要的信息是端口号,端口号其实就是一个数字,每一个想访问网络的程序都须要绑定一个端口号。经过端口号 UDP 就能把指定的数据包发送给指定的程序了,因此 IP 经过 IP 地址信息把数据包发送给指定的电脑,而 UDP 经过端口号把数据包分发给正确的程序。和 IP 头同样,端口号会被装进 UDP 头里面,UDP 头再和原始数据包合并组成新的 UDP 数据包。UDP 头中除了目的端口,还有源端口号等信息。

为了支持 UDP 协议,我把前面的三层结构扩充为四层结构,在网络层和上层之间增长了传输层,以下图所示:

 

下面咱们一块儿来看下一个数据包从主机 A 旅行到主机 B 的路线:

1.上层将含有“极客时间”的数据包交给传输层;

2.传输层会在数据包前面附加上 UDP 头,组成新的 UDP 数据包,再将新的 UDP 数据包交给网络层;

3.网络层再将 IP 头附加到数据包上,组成新的 IP 数据包,并交给底层;

4.数据包被传输到主机 B 的网络层,在这里主机 B 拆开 IP 头信息,并将拆开来的数据部分交给传输层;

5.在传输层,数据包中的 UDP 头会被拆开,并根据 UDP 中所提供的端口号,把数据部分交给上层的应用程序;

6.最终,含有“极客时间”信息的数据包就旅行到了主机 B 上层应用程序这里。

在使用 UDP 发送数据时,有各类因素会致使数据包出错,虽然 UDP 能够校验数据是否正确,可是对于错误的数据包,UDP 并不提供重发机制,只是丢弃当前的包,并且 UDP 在发送以后也没法知道是否能达到目的地。虽然说 UDP 不能保证数据可靠性,可是传输速度却很是快,因此 UDP 会应用在一些关注速度、但不那么严格要求数据完整性的领域,如在线视频、互动游戏等。

 

 

3. TCP:把数据完整地送达应用程序

对于浏览器请求,或者邮件这类要求数据传输可靠性(reliability)的应用,若是使用 UDP 来传输会存在两个问题

1.数据包在传输过程当中容易丢失

2.大文件会被拆分红不少小的数据包来传输,这些小的数据包会通过不一样的路由,并在不一样的时间到达接收端,而 UDP 协议并不知道如何组装这些数据包,从而把这些数据包还原成完整的文件。

基于这两个问题,咱们引入 TCP 了。TCP(Transmission Control Protocol,传输控制协议)是一种面向链接的、可靠的、基于字节流的传输层通讯协议。相对于 UDP,TCP 有下面两个特色

:

对于数据包丢失的状况,TCP 提供重传机制;

TCP 引入了数据包排序机制,用来保证把乱序的数据包组合成一个完整的文件。和 UDP 头同样,TCP 头除了包含了目标端口和本机端口号外,还提供了用于排序的序列号,以便接收端经过序号来重排数据包。

下面看看 TCP 下的单个数据包的传输流程:

 

经过上图你应该能够了解一个数据包是如何经过 TCP 来传输的。

TCP 单个数据包的传输流程和 UDP 流程差很少,不一样的地方在于,经过 TCP 头的信息保证了一块大的数据传输的完整性。

下面咱们再看下完整的 TCP 链接过程,经过这个过程你能够明白 TCP 是如何保证重传机制和数据包的排序功能的。

从下图能够看出,一个完整的 TCP 链接的生命周期包括了“创建链接”“传输数据”和“断开链接”三个阶段。

 

首先,创建链接阶段。这个阶段是经过“三次握手”来创建客户端和服务器之间的链接。TCP 提供面向链接的通讯传输。面向链接是指在数据通讯开始以前先作好两端之间的准备工做。所谓三次握手,是指在创建一个 TCP 链接时,客户端和服务器总共要发送三个数据包以确认链接的创建。

其次,传输数据阶段。在该阶段,接收端须要对每一个数据包进行确认操做,也就是接收端在接收到数据包以后,须要发送确认数据包给发送端。因此当发送端发送了一个数据包以后,在规定时间内没有接收到接收端反馈的确认消息,则判断为数据包丢失,并触发发送端的重发机制。一样,一个大的文件在传输过程当中会被拆分红不少小的数据包,这些数据包到达接收端后,接收端会按照 TCP 头中的序号为其排序,从而保证组成完整的数据。

最后,断开链接阶段。数据传输完毕以后,就要终止链接了,涉及到最后一个阶段“四次挥手”来保证双方都能断开链接。

到这里你应该就明白了,TCP 为了保证数据传输的可靠性,牺牲了数据包的传输速度,由于“三次握手”和“数据包校验机制”等把传输过程当中的数据包的数量提升了一倍。

 


注: 本文出自极客时间(浏览器工做原理与实践),请你们多多支持李兵老师。若有侵权,请及时告知

相关文章
相关标签/搜索