分布式架构基石-TCP通讯协议

为何会有TCP/IP协议

在世界上各地,各类各样的电脑运行着各自不一样的操做系统为你们服务,这些电脑在表达同一种信息的时候所使用的方法是千差万别。就好像圣经中上帝打乱了各地人的口音,让他们没法合做同样。计算机使用者意识到,计算机只是单兵做战并不会发挥太大的做用。只有把它们联合起来,电脑才会发挥出它最大的潜力。因而人们就千方百计的用电线把电脑链接到了一块儿。编程

可是简单的连到一块儿是远远不够的,就好像语言不一样的两我的互相见了面,彻底不能交流信息。于是他们须要定义一些共通的东西来进行交流,TCP/IP就是为此而生。TCP/IP不是一个协议,而是一个协议族的统称。里面包括了IP协议,IMCP协议,TCP协议,以及咱们更加熟悉的http、ftp、pop3协议等等。电脑有了这些,就好像学会了外语同样,就能够和其余的计算机终端作自由的交流了。浏览器

TCP/IP协议分层

TCP/IP协议族按照层次由上到下,层层包装。bash

应用层:
向用户提供一组经常使用的应用程序,好比电子邮件、文件传输访问、远程登陆等。远程登陆TELNET使用TELNET协议提供在网络其它主机上注册的接口。TELNET会话提供了基于字符的虚拟终端。文件传输访问FTP使用FTP协议来提供网络内机器间的文件拷贝功能。服务器

传输层:
提供应用程序间的通讯。其功能包括:1、格式化信息流;2、提供可靠传输。为实现后者,传输层协议规定接收端必须发回确认,而且假如分组丢失,必须从新发送。网络

网络层
负责相邻计算机之间的通讯。其功能包括三方面。
1、处理来自传输层的分组发送请求,收到请求后,将分组装入IP数据报,填充报头,选择去往信宿机的路径,而后将数据报发往适当的网络接口。socket

2、处理输入数据报:首先检查其合法性,而后进行寻径--假如该数据报已到达信宿机,则去掉报头,将剩下部分交给适当的传输协议;假如该数据报还没有到达信宿,则转发该数据报。spa

3、处理路径、流控、拥塞等问题。操作系统

网络接口层
这是TCP/IP软件的最低层,负责接收IP数据报并经过网络发送之,或者从网络上接收物理帧,抽出IP数据报,交给IP层。翻译

IP 是无链接的

IP 用于计算机之间的通讯。指针

IP 是无链接的通讯协议。它不会占用两个正在通讯的计算机之间的通讯线路。这样,IP 就下降了对网络线路的需求。每条线能够同时知足许多不一样的计算机之间的通讯须要。

经过 IP,消息(或者其余数据)被分割为小的独立的包,并经过因特网在计算机之间传送。

IP 负责将每一个包路由至它的目的地。

IP地址

每一个计算机必须有一个 IP 地址才可以连入因特网。

每一个 IP 包必须有一个地址才可以发送到另外一台计算机。

网络上每个节点都必须有一个独立的Internet地址(也叫作IP地址)。如今,一般使用的IP地址是一个32bit的数字,也就是咱们常说的IPv4标准,这32bit的数字分红四组,也就是常见的255.255.255.255的样式。IPv4标准上,地址被分为五类,咱们经常使用的是B类地址。具体的分类请参考其余文档。须要注意的是IP地址是网络号+主机号的组合,这很是重要。

CP/IP 使用 32 个比特来编址。一个计算机字节是 8 比特。因此 TCP/IP 使用了 4 个字节。
一个计算机字节能够包含 256 个不一样的值:
00000000、0000000一、000000十、000000十一、00000100、0000010一、000001十、000001十一、00001000 ....... 直到 11111111。
如今,你知道了为何 TCP/IP 地址是介于 0 到 255 之间的 4 个数字。

IP地址

每一个计算机必须有一个 IP 地址才可以连入因特网。

每一个 IP 包必须有一个地址才可以发送到另外一台计算机。

网络上每个节点都必须有一个独立的Internet地址(也叫作IP地址)。如今,一般使用的IP地址是一个32bit的数字,也就是咱们常说的IPv4标准,这32bit的数字分红四组,也就是常见的255.255.255.255的样式。IPv4标准上,地址被分为五类,咱们经常使用的是B类地址。具体的分类请参考其余文档。须要注意的是IP地址是网络号+主机号的组合,这很是重要。

CP/IP 使用 32 个比特来编址。一个计算机字节是 8 比特。因此 TCP/IP 使用了 4 个字节。
一个计算机字节能够包含 256 个不一样的值:
00000000、0000000一、000000十、000000十一、00000100、0000010一、000001十、000001十一、00001000 ....... 直到 11111111。
如今,你知道了为何 TCP/IP 地址是介于 0 到 255 之间的 4 个数字。

IP 路由器

当一个 IP 包从一台计算机被发送,它会到达一个 IP 路由器。

IP 路由器负责将这个包路由至它的目的地,直接地或者经过其余的路由器。

在一个相同的通讯中,一个包所经由的路径可能会和其余的包不一样。而路由器负责根据通讯量、网络中的错误或者其余参数来进行正确地寻址。

域名

12 个阿拉伯数字很难记忆。使用一个名称更容易。

用于 TCP/IP 地址的名字被称为域名。w3school.com.cn 就是一个域名。

当你键入一个像 http://www.w3school.com.cn 这样的域名,域名会被一种 DNS 程序翻译为数字。

在全世界,数量庞大的 DNS 服务器被连入因特网。DNS 服务器负责将域名翻译为 TCP/IP 地址,同时负责使用新的域名信息更新彼此的系统。

当一个新的域名连同其 TCP/IP 地址一同注册后,全世界的 DNS 服务器都会对此信息进行更新。

TCP/IP

TCP/IP 意味着 TCP 和 IP 在一块儿协同工做。

TCP 负责应用软件(好比你的浏览器)和网络软件之间的通讯。

IP 负责计算机之间的通讯。

TCP 负责将数据分割并装入 IP 包,而后在它们到达的时候从新组合它们。

IP 负责将包发送至接受者。

TCP报文格式

TCP报文格式1.jpg

16位源端口号:16位的源端口中包含初始化通讯的端口。源端口和源IP地址的做用是标识报文的返回地址。

16位目的端口号:16位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。

32位序号:32位的序列号由接收端计算机使用,从新分段的报文成最初形式。当SYN出现,序列码其实是初始序列码(Initial Sequence Number,ISN),而第一个数据字节是ISN+1。这个序列号(序列码)可用来补偿传输中的不一致。

32位确认序号:32位的序列号由接收端计算机使用,重组分段的报文成最初形式。若是设置了ACK控制位,这个值表示一个准备接收的包的序列码。

4位首部长度:4位包括TCP头大小,指示何处数据开始。

保留(6位):6位值域,这些位必须是0。为了未来定义新的用途而保留。

标志:6位标志域。表示为:紧急标志、有意义的应答标志、推、重置链接标志、同步序列号标志、完成发送数据标志。按照顺序排列是:URG、ACK、PSH、RST、SYN、FIN。

16位窗口大小:用来表示想收到的每一个TCP数据段的大小。TCP的流量控制由链接的每一端经过声明的窗口大小来提供。窗口大小为字节数,起始于确认序号字段指明的值,这个值是接收端正指望接收的字节。窗口大小是一个16字节字段,于是窗口大小最大为65535字节。

16位校验和:16位TCP头。源机器基于数据内容计算一个数值,收信息机要与源机器数值 结果彻底同样,从而证实数据的有效性。检验和覆盖了整个的TCP报文段:这是一个强制性的字段,必定是由发送端计算和存储,并由接收端进行验证的。

16位紧急指针:指向后面是优先数据的字节,在URG标志设置了时才有效。若是URG标志没有被设置,紧急域做为填充。加快处理标示为紧急的数据段。

选项:长度不定,但长度必须为1个字节。若是没有选项就表示这个1字节的域等于0。

数据:该TCP协议包负载的数据。

在上述字段中,6位标志域的各个选项功能以下。

URG:紧急标志。紧急标志为"1"代表该位有效。

ACK:确认标志。代表确认编号栏有效。大多数状况下该标志位是置位的。TCP报头内的确认编号栏内包含的确认编号(w+1)为下一个预期的序列编号,同时提示远端系统已经成功接收全部数据。

PSH:推标志。该标志置位时,接收端不将该数据进行队列处理,而是尽量快地将数据转由应用处理。在处理Telnet或rlogin等交互模式的链接时,该标志老是置位的。

RST:复位标志。用于复位相应的TCP链接。

SYN:同步标志。代表同步序列编号栏有效。该标志仅在三次握手创建TCP链接时有效。它提示TCP链接的服务端检查序列编号,该序列编号为TCP链接初始端(通常是客户端)的初始序列编号。在这里,能够把TCP序列编号看做是一个范围从0到4,294,967,295的32位计数器。经过TCP链接交换的数据中每个字节都通过序列编号。在TCP报头中的序列编号栏包括了TCP分段中第一个字节的序列编号。

FIN:结束标志。

TCP三次握手

所谓三次握手(Three-Way Handshake)即创建TCP链接,就是指创建一个TCP链接时,须要客户端和服务端总共发送3个包以确认链接的创建。在socket编程中,这一过程由客户端执行connect来触发,整个流程以下图所示:

TCP三次握手.png

(1)第一次握手:Client将标志位SYN置为1,随机产生一个值seq=J,并将该数据包发送给Server,Client进入SYN_SENT状态,等待Server确认。

(2)第二次握手:Server收到数据包后由标志位SYN=1知道Client请求创建链接,Server将标志位SYN和ACK都置为1,ack=J+1,随机产生一个值seq=K,并将该数据包发送给Client以确认链接请求,Server进入SYN_RCVD状态。

(3)第三次握手:Client收到确认后,检查ack是否为J+1,ACK是否为1,若是正确则将标志位ACK置为1,ack=K+1,并将该数据包发送给Server,Server检查ack是否为K+1,ACK是否为1,若是正确则链接创建成功,Client和Server进入ESTABLISHED状态,完成三次握手,随后Client与Server之间能够开始传输数据了。

简单来讲,就是

一、创建链接时,客户端发送SYN包(SYN=i)到服务器,并进入到SYN-SEND状态,等待服务器确认

二、服务器收到SYN包,必须确认客户的SYN(ack=i+1),同时本身也发送一个SYN包(SYN=k),即SYN+ACK包,此时服务器进入SYN-RECV状态

三、客户端收到服务器的SYN+ACK包,向服务器发送确认报ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手,客户端与服务器开始传送数据。

SYN攻击

在三次握手过程当中,Server发送SYN-ACK以后,收到Client的ACK以前的TCP链接称为半链接(half-open connect),此时Server处于SYN_RCVD状态,当收到ACK后,Server转入ESTABLISHED状态。SYN攻击就是Client在短期内伪造大量不存在的IP地址,并向Server不断地发送SYN包,Server回复确认包,并等待Client的确认,因为源地址是不存在的,所以,Server须要不断重发直至超时,这些伪造的SYN包将产时间占用未链接队列,致使正常的SYN请求由于队列满而被丢弃,从而引发网络堵塞甚至系统瘫痪。SYN攻击时一种典型的DDOS攻击,检测SYN攻击的方式很是简单,即当Server上有大量半链接状态且源IP地址是随机的,则能够判定遭到SYN攻击了,使用以下命令可让之现行:

#netstat -nap | grep SYN_RECV
复制代码

TCP四次挥手

所谓四次挥手(Four-Way Wavehand)即终止TCP链接,就是指断开一个TCP链接时,须要客户端和服务端总共发送4个包以确认链接的断开。在socket编程中,这一过程由客户端或服务端任一方执行close来触发,整个流程以下图所示:

TCP四次挥手.png

因为TCP链接时全双工的,所以,每一个方向都必需要单独进行关闭,这一原则是当一方完成数据发送任务后,发送一个FIN来终止这一方向的链接,收到一个FIN只是意味着这一方向上没有数据流动了,即不会再收到数据了,可是在这个TCP链接上仍然可以发送数据,直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭,而另外一方则执行被动关闭,上图描述的便是如此。

(1)第一次挥手:Client发送一个FIN,用来关闭Client到Server的数据传送,Client进入FIN_WAIT_1状态。

(2)第二次挥手:Server收到FIN后,发送一个ACK给Client,确认序号为收到序号+1(与SYN相同,一个FIN占用一个序号),Server进入CLOSE_WAIT状态。

(3)第三次挥手:Server发送一个FIN,用来关闭Server到Client的数据传送,Server进入LAST_ACK状态。

(4)第四次挥手:Client收到FIN后,Client进入TIME_WAIT状态,接着发送一个ACK给Server,确认序号为收到序号+1,Server进入CLOSED状态,完成四次挥手。

为何创建链接是三次握手,而关闭链接倒是四次挥手呢?

这是由于服务端在LISTEN状态下,收到创建链接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。而关闭链接时,当收到对方的FIN报文时,仅仅表示对方再也不发送数据了可是还能接收数据,己方也未必所有数据都发送给对方了,因此己方能够当即close,也能够发送一些数据给对方后,再发送FIN报文给对方来表示赞成如今关闭链接,所以,己方ACK和FIN通常都会分开发送。

为何TIME_WAIT状态须要通过2MSL(最大报文段生存时间)才能返回到CLOSE状态?

缘由有二:
1、保证TCP协议的全双工链接可以可靠关闭
2、保证此次链接的重复数据段从网络中消失

先说第一点,若是Client直接CLOSED了,那么因为IP协议的不可靠性或者是其它网络缘由,致使Server没有收到Client最后回复的ACK。那么Server就会在超时以后继续发送FIN,此时因为Client已经CLOSED了,就找不到与重发的FIN对应的链接,最后Server就会收到RST而不是ACK,Server就会觉得是链接错误把问题报告给高层。这样的状况虽然不会形成数据丢失,可是却致使TCP协议不符合可靠链接的要求。因此,Client不是直接进入CLOSED,而是要保持TIME_WAIT,当再次收到FIN的时候,可以保证对方收到ACK,最后正确的关闭链接。

再说第二点,若是Client直接CLOSED,而后又再向Server发起一个新链接,咱们不能保证这个新链接与刚关闭的链接的端口号是不一样的。也就是说有可能新链接和老链接的端口号是相同的。通常来讲不会发生什么问题,可是仍是有特殊状况出现:假设新链接和已经关闭的老链接端口号是同样的,若是前一次链接的某些数据仍然滞留在网络中,这些延迟数据在创建新链接以后才到达Server,因为新链接和老链接的端口号是同样的,又由于TCP协议判断不一样链接的依据是socket pair,因而,TCP协议就认为那个延迟的数据是属于新链接的,这样就和真正的新链接的数据包发生混淆了。因此TCP链接还要在TIME_WAIT状态等待2倍MSL,这样能够保证本次链接的全部数据都从网络中消失。

相关文章
相关标签/搜索