UNIX网络编程——基本TCP套接字编程

1、基于TCP协议的网络程序linux

下图是基于TCP协议的客户端/服务器程序的通常流程:ubuntu

                                       

                 

服务器调用socket()、bind()、listen()完成初始化后,调用accept()阻塞等待,处于监听端口的状态,客户端调用socket()初始化后,调用connect()发出SYN段并阻塞等待服务器应答,服务器应答一个SYN-ACK段,客户端收到后从connect()返回,同时应答一个ACK段,服务器收到后从accept()返回。服务器


数据传输的过程:
网络

创建链接后,TCP协议提供全双工的通讯服务,可是通常的客户端/服务器程序的流程是由客户端主动发起请求,服务器被动处理请求,一问一答的方式。所以,服务器从accept()返回后马上调用read(),读socket就像读管道同样,若是没有数据到达就阻塞等待,这时客户端调用write()发送请求给服务器,服务器收到后从read()返回,对客户端的请求进行处理,在此期间客户端调用read()阻塞等待服务器的应答,服务器调用write()将处理结果发回给客户端,再次调用read()阻塞等待下一条请求,客户端收到后从read()返回,发送下一条请求,如此循环下去。dom


若是客户端没有更多的请求了,就调用close()关闭链接,就像写端关闭的管道同样,服务器的read()返回0,这样服务器就知道客户端关闭了链接,也调用close()关闭链接。注意,任何一方调用close()后,链接的两个传输方向都关闭,不能再发送数据了。若是一方调用shutdown()则链接处于半关闭状态,仍可接收对方发来的数据。socket


在学习socket API时要注意应用程序和TCP协议层是如何交互的: tcp

*应用程序调用某个socket函数时TCP协议层完成什么动做,好比调用connect()会发出SYN段函数

 *应用程序如何知道TCP协议层的状态变化,好比从某个阻塞的socket函数返回就代表TCP协议收到了某些段,再好比read()返回0就代表收到了FIN段
学习


补充一下,其实TCP 共有11种状态,上图没有出现的CLOSING 状态,当双方同时关闭链接时会出现此状态,替换掉FIN_WAIT2状态。spa


2、基本socket函数

一、socket函数

包含头文件<sys/socket.h>
功能:建立一个套接字用于通讯
原型:

int socket(int domain, int type, int protocol);

参数
domain :指定通讯协议族(protocol family),AF_INET、AF_INET六、AF_UNIX等
type:指定socket类型,流式套接字SOCK_STREAM,数据报套接字SOCK_DGRAM,原始套接字SOCK_RAW
protocol :协议类型,IPPROTO_TCP等;通常由前两个参数就决定了协议类型,设置为0便可。
返回值:成功返回非负整数, 它与文件描述符相似,咱们把它称为套接口描述字,简称套接字。失败返回-1


二、bind函数

包含头文件<sys/socket.h>
功能:绑定一个本地地址到套接字
原型:

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数
sockfd:socket函数返回的套接字
addr:要绑定的地址
addrlen:地址长度
返回值:成功返回0,失败返回-1

     若是一个TCP客户或者服务器不曾调用bind捆绑一个端口,当调用connect或listen时,内核就要为相应的套接字选择一个临时端口。让内核来选择临时端口对于TCP客户来讲是正常的,除非应该须要一个预留端口然而对于TCP服务器来讲却极为罕见,由于服务器是经过它们的众所周知端口被你们认识的。
     调用bind能够指定IP地址或端口,能够二者都指定,也能够都不指定。

                      
     若是指定端口号为0,那么内核就在bind被调用时选择一个临时端口。然而若是指定IP地址为通配地址,那么内核将等到套接字已链接(TCP)或已在套接字上发出数据报(UDP)时才选择一个本地IP地址
     对于IPv4来讲,统配地址由常值INADDR_ANY来指定,其值通常为0.

struct sockaddr_in servaddr;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
     其实不管是网络字节序仍是主机字节序,INADDR_ANY的值(为0)都是同样的,所以使用htonl并不是必需。
     为了获得内核选择的临时端口值,必须调用函数getsockname来返回协议地址。
     从bind函数返回的一个常见错误时 EADDRINUSE(“Address already in use",地址已使用),后面的博客会讨论SO_REUSEADDR和SO_REUSEPORT这两个套接字选项。
      注意:端口号必须不小于1024,除非该进程具备相应的特权(即为超级用户)。


三、listen函数

包含头文件<sys/socket.h>
功能:将套接字用于监听进入的链接
原型:

int listen(int sockfd, int backlog);
参数
sockfd:socket函数返回的套接字
backlog:规定内核为此套接字排队的最大链接个数

返回值:成功返回0,失败返回-1


     通常来讲,listen函数应该在调用socket和bind函数以后,调用函数accept以前调用。

     listen函数把一个未链接的套接字转换成一个被动套接字,指示内核应接受指向该套接字的链接请求,调用listen致使套接字从CLOSE状态转换到LISTEN状态。

     为了理解其中的backlog参数,对于给定的监听套接字,内核要维护两个队列:

  • 未完成链接队列:已由客户发出并到达服务器,服务器正在等待完成相应的TCP三路握手过程
  • 已完成链接的队列:每一个已完成TCP三次握手过程的客户。

以下图所示:

                              

               

     服务器处于listen状态时收到客户端syn 分节(connect)时在未完成队列中建立一个新的条目,而后用三路握手的第二个分节即服务器的syn 响应及对客户端syn的ack,此条目在第三个分节到达前(客户端对服务器syn的ack)一直保留在未完成链接队列中,若是三路握手完成,该条目将从未完成链接队列搬到已完成链接队列尾部当进程调用accept时,从已完成队列中的头部取出一个条目给进程,当已完成队列为空时进程将睡眠,直到有条目在已完成链接队列中才唤醒。
     backlog被规定为两个队列总和的最大值,大多数实现默认值为5
     一旦队列满,系统会拒绝多余链接请求,因此backlog的值应该基于服务器指望负载和接受链接请求与启动服务的处理能力来选择。
     当客户端发起connect而致使发送syn分节给服务器端握手,若是这时两个队列都是满的,tcp就忽略此分节,而且不发RST,这将致使客户端TCP重发SYN(超时),服务器端忽略syn而不发RST响应的缘由是若是发RST ,客户端connect将当即返回错误,强制客户端进程处理这种状况,而不是让tcp的正常重传机制来处理。实际上全部源自Berkeley的实现都是忽略新的SYN分节。
     还有,backlog为0 时在linux上代表容许不受限制的链接数,这是一个缺陷,由于它可能会致使SYN Flooding(拒绝服务型攻击)。
     linux 系统tcp /ip协议栈有个选项能够设置未连接队列大小tcp_max_syn_backlog

huangcheng@ubuntu:~$ cat /proc/sys/net/ipv4/tcp_max_syn_backlog
512

     每当有一个客户端connect了,listen的队列中就加入一个链接,每当服务器端accept了,就从listen的队列中取出一个链接,转成一个专门用来传输数据的socket(accept函数的返回值)。


四、accept函数

包含头文件<sys/socket.h>
功能:从已完成链接队列返回第一个链接,若是已完成链接队列为空,则阻塞。
原型:

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
参数
sockfd:服务器套接字
addr:将返回对等方的套接字地址
addrlen:返回对等方的套接字地址长度
返回值:成功返回非负整数,失败返回-1

     若是accept成功,那么其返回值是由内核自动生成的一个全新描述符,表明与返回客户的TCP链接。在accept函数的第一个参数为监听套接字描述符,称为它的返回值已链接套接字描述符
     区分这两个套接字很是重要,一个服务器一般仅仅建立一个监听套接字,它在该服务器的生命期内一直存在。内核为每一个由服务器进程接受的客户链接建立一个已链接套接字。当服务器完成对某个给定客户的服务时,相应的已链接套接字就被关闭。
     若是服务器调用accept而且当前没有链接请求,服务器会阻塞直到一个请求到来。若是sockfd处于非阻塞模式,accept会返回-1并将errno设置为EAGAIN或EWOULDBLOCK。



五、connect函数

包含头文件<sys/socket.h>
功能:创建一个链接至addr所指定的套接字
原型:

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数
sockfd:未链接套接字
addr:要链接的套接字地址
addrlen:第二个参数addr长度
返回值:成功返回0,失败返回-1

若是套接字描述符处于 非阻塞模式下,那么在链接不能立刻创建时,connect将会返回-1, 而且将errno设为特殊的错误码EINPROGRESS,不过已经发起的TCP三次握手仍是继续
相关文章
相关标签/搜索