TCP的套接字

摘自:《深入理解计算机网络》 王达著 机械工业出版社
相关知识链接
1. IPV4数据报头部格式
2. IPv6数据报头部格式
3. IPv4数据报的封装与解封装
4. IPv4数据报的分段与重组
5. ARP协议报文格式及ARP表
6. ARP地址解析原理
7. ICMP协议及报文格式
8. IPv6协议族的其它协议
9. TCP的主要特性

TCP套接字

在OSI/RM的传输层服务时,传输通信两端的端点就是TSAP地址,对应的就是传输层协议端口。在TCP/IP网络中,同样有端点的概念,但它不是采用OSI/RM中的TSAP叫法,而是称为“套接字(Socket)”,就像在TCP中仍然把所传输的数据称为“数据段”,而没有采用OSI/RM中的TPDU叫法一样。当然,需要说明的是,Socket并不能直接等于TSAP,它们只是类似,实际上Socket只是利用了TSAP地址,因为在它所包括的一组参数中就有TSAP地址——端口。“套接字”最早使用与UNIX操作系统,后来被广泛地应用于Windows和Linux系统中,成为事实上的TCP标准。

套接字概述

在TCP/IP网络中,区分不同的应用程序进程间的网络通信和连接时主要有以下3个参数:通信的目的地址、使用的传输协议(TCP或UDP)和使用的端口号(此处说明一下,Socket不仅在TCP有,在UDP同样有)。通过将这3个参数结合起来,与一个Socket进行绑定,应用层就可以与传输层一起通过套接字接口区分来自不同应用程序进程或网络连接的通信,实现数据传输的并发服务。为了区别不同的应用程序进程和连接,许多计算机操作系统为应用程序与TCP/IP交互提供了称为套接字(Socket)的接口。

Socket可以看成是在两个网络应用程序进行通信连接时的一个端点(或者称为“逻辑接口“),它是连接应用程序和网络驱动程序的桥梁,如下图所示。从位置上看,它与TSAP是不一样的,因为TSAP是位于传输层上边缘(但仍属于传输层),而Socket是完全位于应用层,但是它调用了传输层的端口。Socket包括了TSAP地址,同样它还包括了在本章前面所介绍的服务原语,具体内容将在后面介绍。


Socket接口的位置
图1:Socket接口的位置

在TCP/IP通信中,应用程序把数据传送给Socket,然后由Socket通过传输层向下提交给网络驱动程序并向网络上发送出去。计算机从网络上收到与该Socket绑定IP地址和端口号相关数据后,由网络驱动程序通过传输层向上提交给应用层的Socket,最后应用程序从Socket中提取所要接受的数据。通信双发计算机上的网络应用程序就是这样通过Socket进行数据的发送和接受的,基本交互过程如下图所示。


Socket在TCP/IP通信中的交互使用
图2:Socket在TCP/IP通信中的交互使用

从上图可以看出,在应用层上,针对每个应用进程都有一个Socket,用来调来传输层的一个特定端口(当然,这个端口对于常规服务来说是固定的,而对于非常规服务来说是不固定的)。也就是说,应用层的Socket和传输层的端口都有很多,但位于网络层,对于一台具体的主机和具体的网络来说,它的IP地址却是唯一的,也只有Socket和端口与IP地址之间是“多对一”的关系。

Socket 原语

在TCP Socket中,包括了如下表所示的一组(供8个)TCP数据传输服务原语。表中前4个原语由服务器按照顺序执行(但并不是说服务器仅调用这4个原语)。其中,SOCKET原语用来创建一个新的端点,并且在传输实体中为它们分配相应的空间。SOCKET原语调用成功后,返回一个普通文件的文件描述符,以便在后续其他的原语调用中使用。但由于新创建的套接字并没有网络地址,需要通过BIND原语为它进行分配,所以BIND原语的用途就是为新建的套接字绑定一个本地网络地址。

原语名称 含义
SOCKET 创建一个新的通信端点
BIND 讲一个本地地址关联到套接字上
LISTEN 通告愿意接受连接,并给出队列大小
ACCEPT 阻塞调用方,知道有人试图进行连接
CONNECT 主动尝试建立连接
SEND 在指定的连接上发送数据
RECV 从指定的连接上接受数据
CLOSE 释放指定的连接

BIND原语执行后需要调用LISTEN原语,它为新建的套接字分配一定的缓存空间,以便让后面要进来的连接进行排队,这样就可以使多个客户可以同时对一个服务器进行访问。但此时服务器还不是阻塞状态,也就是服务器仍没有进入等待连接状态,这里再需要调用一个ACCEPT原语。当一个请求连接的TCP数据段到来时,传输实体会通过调用ACCEPT原语创建一个新的套接字,并返回一个与其文件关联的文件描述符。这个新的套接字与原来由SOCKET原语创建的套接字具有相同属性。这时,服务器就可以调用一个进程来处理这个套接字上的新的连接,而服务器本上又回去仅需等待源套接字上的下一个连接。

以上介绍的是由服务器调用的4个原语,而在客户端使用的原语主要包括SOCKET、CONNECT、SEND、RECV。首先,有SOCKET原语创建一个新的套接字,但由于服务器并不关心它所用的IP地址,所以客户端不必调用BIND原语。然后,通过CONNECT原语阻塞客户端,并主动发起一个TCP传输连接。当CONNET原语调用完成,即收到服务器端发来的确认数据后,客户端解除阻塞状态,建立传输连接。到此为止,双方都可以使用SEND和RECV原语在建立起来的全双工连接上进行数据的接受或发送。

服务器和客户端都可以调用CLOSE原语,用来释放当前TCP传输连接。当双方都执行了CLOSE原语后,连接才会真正的释放。

TCP Socket原语调用的基本流程如下图所示:


TCP Socket原语调用的基本流程
TCP Socket原语调用的基本流程