理解TCP和UDPhtml
根据数据传输方式的不一样,基于网络协议的套接字通常分为TCP套接字和UDP套接字。由于TCP套接字是面向链接的,所以又称为基于流(stream)的套接字。TCP是Transmission Control Protocol(传输控制协议)的简写,意为“对数据传输过程的控制”。所以,学习控制方法及范围有助于正确理解TCP套接字算法
TCP/IP协议栈编程
讲解TCP前先介绍TCP所属的TCP/IP协议栈(Stack,层),如图1-1所示:服务器
图1-1 TCP/IP协议栈网络
从图1-1能够看出,TCP/IP协议栈共分为四层,能够理解为数据收发分红了四个层次化过程。也就是说,面对“基于互联网的有效数据传输”的命题,并不是经过一个庞大的协议解决问题,而是经过层次化方案——TCP/IP协议栈解决,经过TCP套接字收发数据须要借助四层,如图1-2所示:并发
图1-2 TCP协议栈socket
反之,经过UDP套接字收发数据时,利用图1-2的四层协议栈来完成:函数
图1-3 UDP协议栈post
各层可能经过操做系统等软件实现,也可能经过相似NIC的硬件设备实现学习
TCP/IP协议的诞生背景
“经过因特网完成有效数据传输”这个课题让许多专家汇集到一块儿,不一样人负责不一样模块,如:硬件、系统、路由。为何要这样作呢?由于编写软件前须要构建硬件系统,在此基础上须要经过软件实现各类算法,因此才须要众多领域的专家进行讨论,以造成各类规定。把“经过因特网完成有效数据传输”问题按照不一样领域划分红小问题后,出现了多种协议,它们经过层级结构创建紧密联系
把协议分红多个层次具备哪些优势?协议设计更容易?这是优势之一,但更重要的缘由是:为了经过标准化操做设计开放式系统。标准自己就在于对外公开,引导更多人遵循。以多个标准为依据所设计的系统称为开放式系统,咱们如今学习的TCP/IP协议栈也属于其中之一。那么开放式系统具备哪些优势呢?比方:路由器用来完成IP层交互任务,某公司原先使用A路由器,可将其替换成B路由器,即使A、B这两种路由器并不是同一产商也能够顺利替换,由于全部的路由器生产产商都会按照IP层标准制造
再举个例子,你们的计算机通常都装有网卡(网络接口卡),即使没安装也不要紧,网卡很容易买到,由于全部的网卡制造商都会遵照链路层的协议标准,这就是开放式系统的优势
链路层
接下来逐层了解TCP/IP协议栈,先讲链路层。链路层是物理连接领域标准化的结果,也是最基本的领域,专门定义LAN、WAN、MAN等网络标准。若两台主机经过网络进行数据进行交换,则须要图1-4所示的物理链接,链路层就负责这些标准:
图1-4 网络链接结构
IP层
准备好物理链接后就要传输数据,为了在复杂的网络中传输数据,首先须要考虑路径的选择。向目标传输数据须要通过哪条路径?解决此问题就是IP层,该层使用的协议就是IP。IP自己是面向消息的、不可靠的协议。每次传输数据时会帮咱们选择路径,但每次传输时的路径并不一致。若是传输中发生路径错误,则选择其余路径;但若是发生数据丢失或损坏,则没法解决。换言之,IP协议没法应对数据错误
TCP/UDP层
IP层解决数据传输中的路径选择问题,只需照此路径传输数据便可。TCP和UDP层以IP层提供的路径信息为基础完成实际的数据传输,故该层又称传输层。UDP比TCP简单,咱们后面还会在讨论,如今只解释TCP。TCP能够保证可靠的数据传输,但它发送数据时以IP层为基础,IP层是面向消息的,是不可靠的,那TCP又是如何保证消息的可靠传输呢?
IP层只关注一个数据包(数据传输的基本单位)的传输过程。所以,即便传输多个数据包,每一个数据包也是由IP层实际传输的,也就是说传输顺序及传输自己都是不可靠的。若只利用IP层传输数据,则有可能后发送的数据包比早发生的数据包先到达目标主机。另外,传输的数据包A、B、C中可能只收到A和C,B可能丢失或接收到时已损坏。但若添加TCP协议则会按照如图1-5的方式进行数据传输:
图1-5 传输控制协议
咱们能够看到,当主机A发送1号数据包给主机B时,必须等到主机B确认1号数据包接收成功,才会接着发送2号数据包,若是主机A发送1号数据包却迟迟收不到主机B回复的接收成功,则会认为是超时,并从新发送一个1号数据包
实现基于TCP的服务端/客户端
图1-6给出了TCP服务器端默认的函数调用顺序,大部分TCP服务器端都按照该顺序调用
图1-6 TCP服务端函数调用顺序
调用socket函数建立套接字,声明并初始化地址信息结构体变量,调用bind函数向套接字分配地址。这两个阶段以前都讨论过了,下面讲解以后的几个过程
进入等待链接请求状态
咱们已调用bind函数给套接字分配了地址,接下来就要经过调用listen函数进入等待链接请求状态。只有调用了listen函数,服务端套接字才能进入可接收链接的状态,换言之,这时,客户端才能调用connect函数(若提早调用则会发生错误)
#include <sys/socket.h> int listen(int sockfd, int backlog);//成功时返回0,失败时返回-1
先解释一下等待链接请求状态的含义和链接请求等待队列。“服务器端处于等待链接请求状态”是指,客户端请求链接时,服务器端受理链接前一直处于等待状态,当有多个客户端一块儿发送链接请求时,服务器端套接字只能处理一个链接请求,而其余的链接请求,只能暂时放在请求队列,即listen函数的第二个参数
受理客户端链接请求
调用listen函数后,如有新的链接请求,则应按序受理。受理请求意味着进入可接收数据的状态,这里进入这种状态的所需部件固然仍是套接字,可能有人会想使用服务器端套接字,但服务器端套接字已经用于监听,若是将其用于与客户端交换数据,那么谁来监听客户端的链接请求呢?所以须要另一个套接字,但不必亲自建立,accept函数将自动建立套接字,并链接到发起请求的客户端
#include <sys/socket.h> int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);//成功时返回建立的套接字文件描述符,失败时返回-1
accept函数受理链接请求等待队列中待处理的客户端链接请求,函数调用成功时,accept函数内部将产生用于数据I/O的套接字,并返回其文件描述符。须要强调的是,套接字是自动建立的,并自动与发起链接请求的客户端创建链接
这里,咱们从新回顾TCP/IP网络编程之网络编程和套接字这一章中的hello_server.c
hello_server.c
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> void error_handling(char *message); int main(int argc, char *argv[]) { int serv_sock; int clnt_sock; struct sockaddr_in serv_addr; struct sockaddr_in clnt_addr; socklen_t clnt_addr_size; char message[] = "Hello world!"; if (argc != 2) { printf("Usage: %s <port>\n", argv[0]); exit(1); } serv_sock = socket(AF_INET, SOCK_STREAM, 0); if (serv_sock == -1) error_handling("sock() error"); memset(&serv_addr, 0, sizeof(serv_addr)); serv_addr.sin_family = AF_INET; serv_addr.sin_addr.s_addr = htonl(INADDR_ANY); serv_addr.sin_port = htons(atoi(argv[1])); if (bind(serv_sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1) error_handling("bind() error"); if (listen(serv_sock, 5) == -1) error_handling("listen() error"); clnt_addr_size = sizeof(clnt_addr); clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_addr, &clnt_addr_size); if (clnt_sock == -1) error_handling("accept() error"); write(clnt_sock, message, sizeof(message)); close(clnt_sock); close(serv_sock); return 0; } void error_handling(char *message) { fputs(message, stderr); fputc('\n', stderr); exit(1); }
TCP客户端的默认函数调用顺序
接下来说解客户端的实现顺序,咱们前面说过,客户端的套接字实现比服务器端要简单的多,由于建立套接字和请求链接就是客户端的所有内容,如图1-7:
图1-7 TCP客户端函数调用顺序
与服务器端相比,区别就在于“请求链接”,它是建立客户端套接字后向服务器端发起的链接请求。服务器端调用listen函数后建立链接请求等待队列,以后客户端便可请求链接。那如何发起链接请求呢?经过connect函数完成:
#include <sys/socket.h> int connect(int sock_fd, struct sockaddr *serv_addr, socklen_t addrlen);//成功时返回0,失败时返回-1
客户端调用connect函数后,发生如下状况之一才会返回:
须要注意,所谓的“接收链接”并不意味着服务器端调用accept函数,实际上是服务器端把链接请求信息记录到等待队列,所以connect函数返回后并不当即进行数据交换
这里,咱们再回顾以前的hello_client.c
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> void error_handling(char *message); int main(int argc, char *argv[]) { int sock; struct sockaddr_in serv_addr; char message[30]; int str_len; if (argc != 3) { printf("Usage: %s <IP> <port>\n", argv[0]); exit(1); } sock = socket(AF_INET, SOCK_STREAM, 0); if (sock == -1) error_handling("sock() error"); memset(&serv_addr, 0, sizeof(serv_addr)); serv_addr.sin_family = AF_INET; serv_addr.sin_addr.s_addr = inet_addr(argv[1]); serv_addr.sin_port = htons(atoi(argv[2])); if (connect(sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1) error_handling("connect() error!"); str_len = read(sock, message, sizeof(message) - 1); if (str_len == -1) error_handling("read() error!"); printf("Message from server: %s\n", message); close(sock); return 0; } void error_handling(char *message) { fputs(message, stderr); fputc('\n', stderr); exit(1); }
基于TCP的服务器端/客户端函数调用关系
前面讲解了TCP服务器端/客户端的实现顺序,实际上两者并不是相互独立,让咱们画一下它们之间的交互过程,如图1-8所示
图1-8 函数调用关系
图1-8的整体流程以下:服务器端建立套接字后联系调用bind、listen函数进入等待状态,客户端经过调用connect函数发起链接请求,须要注意的是,客户端只能等到服务器端调用listen函数后才能调用connect函数。同时要清楚,客户端调用connect前,服务器端可能先调用了accept函数。固然,此时服务器端在调用accept函数时进入了阻塞状态,直到客户端调用connect函数为止
实现迭代服务器端/客户端
如今,让咱们来编写一个回声服务器端/客户端,所谓回声,就是服务器端将客户端传输的字符串数据原封不动地回传给客户端,不过在此以前,须要解释一下何为迭代服务器端。以前咱们所看到的Hello world服务器端处理完一个客户端链接请求则退出程序,链接请求等待队列是实际上没太大意义,这并不是咱们所需的服务器端,设置好等待队列后,应向全部客户端提供服务,若是在受理完一个客户端请求链接后,还须要再受理其余的请求链接,改怎么扩展代码?最简单的办法就是经过循环语句返回调动accept函数,如图1-9
图1-9 迭代服务器端的函数调用顺序
图1-9能够看出,调用accept函数后,紧接着调用I/O相关的read、write函数,而后调用close函数。这并不是针对服务器端套接字,而是针对accept函数调用时所建立的套接字。调用close函数就意味着结束了针对某一客户端的服务,此时若是还想服务于其余客户端,就要从新调用accept函数。目前,咱们的服务器端套接字同一时刻只能服务于一个客户端链接,未来学完进程和线程后,就能够编写同时服务多个客户端的服务器端了
迭代回声服务器端/客户端
即时服务器端以迭代方式运转,客户端代码亦无太大区别,接下来建立迭代回声服务器端及与之配套的回声客户端,首先整理一下程序的基本运行方式:
echo_server.c
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> #define BUF_SIZE 1024 void error_handling(char *message); int main(int argc, char *argv[]) { int serv_sock, clnt_sock; char messag[1024]; int str_len, i; struct sockaddr_in serv_adr, clnt_adr; socklen_t clnt_adr_sz; if (argc != 2) { printf("Usage:%s<port>\n", argv[0]); exit(1); } serv_sock = socket(PF_INET, SOCK_STREAM, 0); if (serv_sock == -1) error_handling("socket()error"); memset(&serv_adr, 0, sizeof(serv_adr)); serv_adr.sin_family = AF_INET; serv_adr.sin_addr.s_addr = htonl(INADDR_ANY); serv_adr.sin_port = htons(atoi(argv[1])); if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1) error_handling("bind()error"); if (listen(serv_sock, 5) == -1) error_handling("listen()error"); clnt_adr_sz = sizeof(clnt_adr); for (i = 0; i < 5; i++) { clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &clnt_adr_sz); if (clnt_sock == -1) error_handling("accept()error"); else printf("Connected client %d \n", i + 1); while ((str_len = read(clnt_sock, messag, 1024)) != 0) write(clnt_sock, messag, str_len); close(clnt_sock); } close(serv_sock); return 0; } void error_handling(char *message) { fputs(message, stderr); fputc('\n', stderr); exit(1); }
echo_client.c
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> void error_handling(char *message); int main(int argc, char *argv[]) { int sock; char message[1024]; int str_len; struct sockaddr_in serv_adr; if (argc != 3) { printf("Usage:%s<IP><port>\n", argv[0]); exit(1); } sock = socket(PF_INET, SOCK_STREAM, 0); if (sock == -1) error_handling("socket()error"); memset(&serv_adr, 0, sizeof(serv_adr)); serv_adr.sin_family = AF_INET; serv_adr.sin_addr.s_addr = inet_addr(argv[1]); serv_adr.sin_port = htons(atoi(argv[2])); if (connect(sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1) error_handling("connect()error"); else puts("Connected.........."); while (1) { fputs("Input message(Q to quit):", stdout); fgets(message, 1024, stdin); if (!strcmp(message, "q\n") || !strcmp(message, "Q\n")) break; write(sock, message, strlen(message)); str_len = read(sock, message, 1024 - 1); message[str_len] = 0; printf("Message from server:%s", message); } close(sock); return 0; } void error_handling(char *message) { fputs(message, stderr); fputc('\n', stderr); exit(1); }
编译echo_server.c并运行,服务器端套接字将等待客户端链接请求
# gcc echo_server.c -o echo_server # ./echo_server 8500
编译echo_client.c并分三次运行
# gcc echo_client.c -o echo_client # ./echo_client 127.0.0.1 8500 Connected.......... Input message(Q to quit):Hello Message from server:Hello Input message(Q to quit):world Message from server:world Input message(Q to quit):Q # ./echo_client 127.0.0.1 8500 Connected.......... Input message(Q to quit):Java Message from server:Java Input message(Q to quit):Python Message from server:Python Input message(Q to quit):Golang Message from server:Golang Input message(Q to quit):Q # ./echo_client 127.0.0.1 8500 Connected.......... Input message(Q to quit):Spring Message from server:Spring Input message(Q to quit):Flask Message from server:Flask Input message(Q to quit):Gin Message from server:Gin Input message(Q to quit):Q
最后可看到服务器端套接字程序打印以下:
# ./echo_server 8500 Connected client 1 Connected client 2 Connected client 3
能够看到,服务器端套接字共处理了3次客户端链接请求
回声客户端存在的问题
下面是echo_client.c的代码
write(sock, message, strlen(message)); str_len = read(sock, message, 1024 - 1); message[str_len] = 0; printf("Message from server:%s", message);
以上的代码有个错误假设:每次调用read、write函数时都会以字符串为单位执行实际的I/O操做。可是别忘了,TCP不存在数据边界。所以,屡次调用write函数传递字符串有可能一次性传递到服务端,此时,客户端有可能从服务端收到多个字符串,这不是咱们但愿看到的结果
还要考虑另一种状况:字符串太长,须要分两次数据包发送,客户端有可能在还没有收到所有数据包时就调用read函数。这些都是TCP特性的问题,咱们将在下一章给出解决的办法