linux网络编程系列(七)--tcp粘包及如何解决

1. 什么是粘包

  • 流式套接字 首先说说TCP为何叫流式套接字,顾名思义,是指TCP的数据传输跟流动的水同样,你们能够想象一下,水是连成一片的,它是没有分界线的,而TCP数据传输也是同样的,是没有界限的;缓存

  • 缓存机制 熟悉TCP协议的人都应该知道,TCP发送数据,并非应用程序send之后就发出去了,它是先存储在发送缓冲区的,为了性能考虑,可能会等到多个数据包汇总到一块儿后,操做系统底层再把缓冲区总体发送出去,接收数据也是同样。网络

  • 最大传输单元 在网络传输中,有个MTU-最大传输单元,是1500个字节,就是说每一次发送最多只能发送1500个字节,若是要发送超过这个长度的数据包,就须要分包发送。性能

当出现以上三点的状况时,接收端接收到的数据和发送的数据包大小、次数可能都不一致,咱们没办法肯定发送端发送过来的一个完整包是怎样的,就没办法正确得到咱们须要的数据, 这就是粘包现象。 其实就是说,应用进程并不知道一个完整的数据包究竟是多大,无法进行解析,客户端和服务端须要有一个约定的规则,来确保不出现粘包。操作系统

2. 怎么解决粘包

有如下三种状况能够解决粘包现象:进程

  • 一是约定数据包长度,即发送端和接收端约定同样的发送和接收的数据包长度,这样能够清晰的获取到咱们须要的数据;
  • 二是使用分隔符,好比smtp协议就是在发送时,使用\r\n为分隔符,但若是咱们要发送的数据中也有\r\n呢,就容易搞混淆,因此不是特别推荐;
  • 三是在每一个数据包的开头利用2个或者4个字节填充整个数据包的长度,这样接收端能够先接收2个或者4个字节,就能够准确的知道真正的数据包是多长,从而正确获取须要的数据;
相关文章
相关标签/搜索