适合初学者的TCP讲解

前言

首先在编写这篇文章以前呢,我想先澄清一些事情。
这篇文章是我参考阮一峰老师的《TCP协议简介》,仅仅是把它用我本身的话阐述一遍,以便本身以及一些想了解TCP协议的读者来理解。
有写的很差的或者表述不清楚的地方,请各位读者能指正出来,谢谢。缓存

1、TCP存在哪里

介绍TCP以前,应该先要让你们了解一下TCP存在哪里而且有什么做用。bash

用一张图来表述可能更加实在学习

首先,能够看到,TCP是以太网协议和IP协议的上层协议,也是应用层的下层协议。spa

(简单介绍一下以太网协议和IP协议)操作系统

以太网协议:code

最底层的以太网协议(Ethernet)规定了电子信号如何组成数据包(packet),解决了子网内部的点对点通讯。cdn

IP协议:blog

IP协议解决的就是多个局域网互相通讯,好比路由器就是基于IP协议的。路由

(通俗一点理解就是以太网协议解决了局域网的点对点通讯,但不能解决多个局域网互相通讯,这时候就得靠IP协议来解决多个局域网互相通讯的问题)it

那么弄清楚了这俩个协议以后好像仍是不知道TCP到底在哪里。
别急,下面这张图更加实在。

能够看到,无论是IP数据包仍是TCP数据包仍是应用层数据包都包裹在以太网数据包中的。

这个最大的以太网数据包最初只有1518字节,后来增长到了1522字节。

其中有1500字节是以太网数据包的负载,而另外的22字节是头信息。


(CRC是利用除法及余数的原理来做错误侦测)

那么因此另外的那些包数据都是存在于以太网的负载中的。

IP数据包又分为IP标头和IP负载,存在于以太网的负载中。
IP标头(也就是头信息)最少须要20字节,因此它的负载最多就是1500-20=1480字节。

TCP数据包又分为TCP标头和TCP负载,存在于IP数据包中。
TCP标头(也就是头信息)最少须要20字节,因此它的负载最多就是1480-20=1460字节。

但因为IP和TCP协议中每每有额外的头信息,因此最终TCP负载实际就是1400字节左右。

所以,一条1500字节的信息须要两个 TCP 数据包。HTTP/2 协议的一大改进, 就是压缩 HTTP 协议的头信息,使得一个 HTTP 请求能够放在一个 TCP 数据包里面,而不是分红多个,这样就提升了速度。(原话)

经过上面的学习,咱们了解到了IP协议它其实只是一个地址协议,并不能保证包的完整性(也就是若是缓存满了,新进来的包就可能会丢失等等问题)。这时候就须要TCP来知道丢了哪一个包,以及如何从新发送这个包。

总结:

  1. TCP 协议的做用是:保证数据通讯的完整性和可靠性,防止丢包。

  2. 以太网数据包的负载是1500字节,TCP 数据包的负载在1400字节左右。

2、TCP数据包的编号

能够看到一个包的负载时1400字节,那么若是如今要传输的是大量的数据,那这时候就得分红不少个包。
(好比,一个 10MB 的文件,须要发送7100多个包。)

在进行发送的时候,TCP协议就起做用了,它为每一个包编号(sequence number,简称 SEQ),
这样每一个包都有了本身的编号后,接受的一方就能够按顺序还原,就算包丢失以后也能知道是哪一个包丢失了。

编号规则:

第一个包的编号是一个随机的数字,好比第一个包的编号为1,负载长度为100字节,那么第二个包的编号就是101,依次类推。

这就是说,每一个数据包均可以获得两个编号:自身的编号,以及下一个包的编号。接收方由此知道,应该按照什么顺序将它们还原成原始文件。

此时咱们就能够将TCP协议的做用再补充一条:

将每一个要传输的包进行编号,保证数据通讯的完整性和可靠性,防止丢包。

3、TCP数据包的组装

当TCP协议为每一个包编号完成以后,就将TCP数据包发送出去。

在接收到数据包后,组装还原是操做系统完成的。应用程序不会直接处理 TCP 数据包。


能够看到,过程大概就是:

编写好的数据包 -->  传递给操做系统 -->  操做系统按照顺序组装 -->
判断TCP数据包中的端口号  --> 继续传递给监听端口号的那个应用程序复制代码
相关文章
相关标签/搜索