Linux 环境进程间通讯(六)：

时间 2019-12-11

标签 linux 环境进程通讯栏目 Linux 繁體版

原文原文链接

linux下进程间通讯的几种主要手段：node

管道（Pipe）及有名管道（named pipe）：管道可用于具备亲缘关系进程间的通讯，有名管道克服了管道没有名字的限制，所以，除具备管道所具备的功能外，它还容许无亲缘关系进程间的通讯；
信号（Signal）：信号是比较复杂的通讯方式，用于通知接受进程有某种事件发生，除了用于进程间通讯外，进程还能够发送信号给进程自己；linux除了支持Unix早期信号语义函数sigal外，还支持语义符合Posix.1标准的信号函数sigaction（实际上，该函数是基于BSD的，BSD为了实现可靠信号机制，又可以统一对外接口，用sigaction函数从新实现了signal函数）；
报文（Message）队列（消息队列）：消息队列是消息的连接表，包括Posix消息队列system V消息队列。有足够权限的进程能够向队列中添加消息，被赋予读权限的进程则能够读走队列中的消息。消息队列克服了信号承载信息量少，管道只能承载无格式字节流以及缓冲区大小受限等缺点。
共享内存：使得多个进程能够访问同一块内存空间，是最快的可用IPC形式。是针对其余通讯机制运行效率较低而设计的。每每与其它通讯机制，如信号量结合使用，来达到进程间的同步及互斥。
信号量（semaphore）：主要做为进程间以及同一进程不一样线程之间的同步手段。
套接口（Socket）：更为通常的进程间通讯机制，可用于不一样机器之间的进程间通讯。起初是由Unix系统的BSD分支开发出来的，但如今通常能够移植到其它类Unix系统上：Linux和System V的变种都支持套接字。

本文讲述进程间通讯方法——共享内存linux

原文：http://www.ibm.com/developerworks/cn/linux/l-ipc/part6/编程

一个套接口能够看做是进程间通讯的端点（endpoint），每一个套接口的名字都是惟一的（惟一的含义是不言而喻的），其余进程能够发现、链接而且与之通讯。通讯域用来讲明套接口通讯的协议，不一样的通讯域有不一样的通讯协议以及套接口的地址结构等等，所以，建立一个套接口时，要指明它的通讯域。比较常见的是unix域套接口（采用套接口机制实现单机内的进程间通讯）及网际通讯域。服务器

一、背景知识网络

linux目前的网络内核代码主要基于伯克利的BSD的unix实现，整个结构采用的是一种面向对象的分层机制。层与层之间有严格的接口定义。这里咱们引用[1]中的一个图表来描述linux支持的一些通讯协议：数据结构

咱们这里只关心IPS，即因特网协议族，也就是一般所说的TCP/IP网络。咱们这里假设读者具备网络方面的一些背景知识，如了解网络的分层结构，一般所说的7层结构；了解IP地址以及路由的一些基本知识。dom

目前linux网络API是基于BSD套接口的（系统V提供基于流I/O子系统的用户接口，可是linux内核目前不支持流I/O子系统）。套接口能够说是网络编程中一个很是重要的概念，linux以文件的形式实现套接口，与套接口相应的文件属于sockfs特殊文件系统，建立一个套接口就是在sockfs中建立一个特殊文件，并创建起为实现套接口功能的相关数据结构。换句话说，对每个新建立的BSD套接口，linux内核都将在sockfs特殊文件系统中建立一个新的inode。描述套接口的数据结构是socket，将在后面给出。socket

二、重要数据结构

下面是在网络编程中比较重要的几个数据结构，读者能够在后面介绍编程API部分再回过头来了解它们。async

（1）表示套接口的数据结构struct socket函数

套接口是由socket数据结构表明的，形式以下：

struct socket
{
socket_state  state;     /* 指明套接口的链接状态，一个套接口的链接状态能够有如下几种
套接口是空闲的，尚未进行相应的端口及地址的绑定；尚未链接；正在链接中；已经链接；正在解除链接。 */
  unsigned long    flags;
  struct proto_ops  ops;  /* 指明可对套接口进行的各类操做 */
  struct inode    inode;    /* 指向sockfs文件系统中的相应inode */
  struct fasync_struct  *fasync_list;  /* Asynchronous wake up list  */
  struct file    *file;          /* 指向sockfs文件系统中的相应文件  */
struct sock    sk;  /* 任何协议族都有其特定的套接口特性，该域就指向特定协议族的套接口对
象。 */
  wait_queue_head_t  wait;
  short      type;
  unsigned char    passcred;
};

（2）描述套接口通用地址的数据结构struct sockaddr

因为历史的缘故，在bind、connect等系统调用中，特定于协议的套接口地址结构指针都要强制转换成该通用的套接口地址结构指针。结构形式以下：

struct sockaddr {
	sa_family_t	sa_family;	/* address family, AF_xxx	*/
	char		sa_data[14];	/* 14 bytes of protocol address	*/
};

（3）描述因特网地址结构的数据结构struct sockaddr_in（这里局限于IP4）：

struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);	/* 描述协议族 */
    in_port_t sin_port;			/* 端口号 */
    struct in_addr sin_addr;		/* 因特网地址 */
    /* Pad to size of `struct sockaddr'.  */
    unsigned char sin_zero[sizeof (struct sockaddr) -
			   __SOCKADDR_COMMON_SIZE -
			   sizeof (in_port_t) -
			   sizeof (struct in_addr)];
  };

通常来讲，读者最关心的是前三个域，即通讯协议、端口号及地址。

三、套接口编程的几个重要步骤：

（1）建立套接口，由系统调用socket实现：

int socket( int domain, int type, int ptotocol);

参数domain指明通讯域，如PF_UNIX（unix域），PF_INET（IPv4），PF_INET6(IPv6)等；type指明通讯类型，如SOCK_STREAM(面向链接方式)、SOCK_DGRAM(非面向链接方式)等。通常来讲，参数protocol可设置为0，除非用在原始套接口上（原始套接口有一些特殊功能，后面还将介绍）。

注：socket（）系统调用为套接口在sockfs文件系统中分配一个新的文件和dentry对象，并经过文件描述符把它们与调用进程联系起来。进程能够像访问一个已经打开的文件同样访问套接口在sockfs中的对应文件。但进程毫不能调用open()来访问该文件（sockfs文件系统没有可视安装点，其中的文件永远不会出如今系统目录树上），当套接口被关闭时，内核会自动删除sockfs中的inodes。

（2）绑定地址

根据传输层协议（TCP、UDP）的不一样，客户机及服务器的处理方式也有很大不一样。可是，无论通讯双方使用何种传输协议，都须要一种标识本身的机制。

通讯双方通常由两个方面标识：地址和端口号（一般，一个IP地址和一个端口号经常被称为一个套接口）。根据地址能够寻址到主机，根据端口号则能够寻址到主机提供特定服务的进程，实际上，一个特定的端口号表明了一个提供特定服务的进程。

对于使用TCP传输协议通讯方式来讲，通讯双方须要给本身绑定一个惟一标识本身的套接口，以便创建链接；对于使用UDP传输协议，只须要服务器绑定一个标识本身的套接口就能够了，用户则不须要绑定(在须要时，如调用connect时[注1]，内核会自动分配一个本地地址和本地端口号)。绑定操做由系统调用bind()完成：

int bind( int sockfd, const struct sockaddr * my_addr, socklen_t my_addr_len)

第二个参数对于Ipv4来讲，实际上须要填充的结构是struct sockaddr_in，前面已经介绍了该结构。这里只想强调该结构的第一个域，它代表该套接口使用的通讯协议，如AF_INET。联系socket系统调用的第一个参数，读者可能会想到PF_INET与AF_INET究竟有什么不一样？实际上，原来的想法是每一个通讯域（如PF_INET）可能对应多个协议（如AF_INET），而事实上支持多个协议的通讯域一直没有实现。所以，在linux内核中，AF_***与PF_***被定义为同一个常数，所以，在编程时能够不加区分地使用他们。

注1：在采用非面向链接通讯方式时，也会用到connect()调用，不过与在面向链接中的connect（）调用有本质的区别：在非面向链接通讯中，connect调用只是先设置一下对方的地址，内核为本地套接口记下对方的地址，而后采用send()来发送数据，这样避免每次发送时都要提供相同的目的地址。其中的connect()调用不涉及握手过程；而在面向链接的通讯方式中，connect()要完成一个严格的握手过程。

（3）请求创建链接（由TCP客户发起）

对于采用面向链接的传输协议TCP实现通讯来讲，一个比较重要的步骤就是通讯双方创建链接（若是采用udp传输协议则不须要），由系统调用connect()完成：

int connect( int sockfd, const struct sockaddr * servaddr, socklen_t addrlen)

第一个参数为本地调用socket后返回的描述符，第二个参数为服务器的地址结构指针。connect（）向指定的套接口请求创建链接。

注：与connect（）相对应，在服务器端，经过系统调用listen()，指定服务器端的套接口为监听套接口，监听每个向服务器套接口发出的链接请求，并经过握手机制创建链接。内核为listen()维护两个队列：已完成链接队列和未完成链接队列。

（4）接受链接请求（由TCP服务器端发起）

服务器端经过监听套接口，为全部链接请求创建了两个队列：已完成链接队列和未完成链接队列（每一个监听套接口都对应这样两个队列，固然，通常服务器只有一个监听套接口）。经过accept()调用，服务器将在监听套接口的已链接队列头中，返回用于表明当前链接的套接口描述字。

int accept( int sockfd, struct sockaddr * cliaddr, socklen_t * addrlen)

第一个参数指明哪一个监听套接口，通常是由listen（）系统调用指定的（因为每一个监听套接口都对应已链接和未链接两个队列，所以它的内部机制实质是经过sockfd指定在哪一个已链接队列头中返回一个用于当前客户的链接，若是相应的已链接队列为空，accept进入睡眠）。第二个参数指明客户的地址结构，若是对客户的身份不感兴趣，可指定其为空。

注：对于采用TCP传输协议进行通讯的服务器和客户机来讲，必定要通过客户请求创建链接，服务器接受链接请求这一过程；而对采用UDP传输协议的通讯双方则不须要这一步骤。

（5）通讯

客户机能够经过套接口接收服务器传过来的数据，也能够经过套接口向服务器发送数据。前面全部的准备工做（建立套接口、绑定等操做）都是为这一步骤准备的。

经常使用的从套接口中接收数据的调用有：recv、recvfrom、recvmsg等，经常使用的向套接口中发送数据的调用有send、sendto、sendmsg等。

int recv(int s, void *
        buf, size_t 
        len, int 
        flags)
int recvfrom(int s,  void *
        buf,  size_t 
        len, int 
        flags, struct sockaddr *
        from, socklen_t *
        fromlen)
int recvmsg(int s, struct msghdr *
        msg, int 
        flags)
int send(int s,const void *
        msg, size_t 
        len, int 
        flags)
int sendto(int s, const void *
        msg, size_t 
        len, int 
        flags const struct sockaddr *
        to, socklen_t 
        tolen)
int sendmsg(int s, const struct msghdr *
        msg, int 
        flags)

这里再也不对这些调用做具体的说明，只想强调一下，recvfrom（）以及recvmsg（）可用于面向链接的套接口，也可用于面向非链接的套接口；而recv（）通常用于面向链接的套接口。另外，在调用了connect()以后，就应给调用send()而不是sendto()了，由于调用了connect以后，目标就已经肯定了。

前面讲到，socket（）系统调用返回套接口描述字，实际上它是一个文件描述符。因此，能够对套接口进行一般的读写操做，即便用read()及write()方法。在实际应用中，因为面向链接的通讯（采用TCP传输协议）是可靠的，同时又保证字节流原有的顺序，因此更适合用read及write方法。而非面向链接的通讯（采用UDP传输协议）是不可靠的，字节流也不必定保持原有的顺序，因此通常不宜用read及write方法。

（6）通讯的最后一步是关闭套接口

由close()来完成此项功能，它惟一的参数是套接口描述字，再也不赘述。

四、典型调用代码：

处处能够发现基于套接口的客户机及服务器程序，这里再也不给出完整的范例代码，只是给出它们的典型调用代码，并给出简要说明。

（1）典型的TCP服务器代码：

... ...
int listen_fd, connect_fd;
struct sockaddr_in serv_addr, client_addr;
... ...
listen_fd = socket ( PF_INET, SOCK_STREAM, 0 );

/* 建立网际Ipv4域的（由PF_INET指定）面向链接的（由SOCK_STREAM指定，
若是建立非面向链接的套接口则指定为SOCK_DGRAM）
的套接口。第三个参数0表示由内核肯定缺省的传输协议，
对于本例，因为建立的是可靠的面向链接的基于流的套接口，
内核将选择TCP做为本套接口的传输协议） */

bzero( &serv_addr, sizeof(serv_addr) );
serv_addr.sin_family = AF_INET ;  /* 指明通讯协议族 */
serv_addr.sin_port = htons( 49152 ) ;       /* 分配端口号 */
inet_pton(AF_INET, " 192.168.0.11", &serv_addr.sin_sddr) ;
/* 分配地址，把点分十进制IPv4地址转化为32位二进制Ipv4地址。 */
bind( listen_fd, (struct sockaddr*) serv_addr, sizeof ( struct sockaddr_in )) ; 
/* 实现绑定操做 */
listen( listen_fd, max_num) ; 
/* 套接口进入侦听状态，max_num规定了内核为此套接口排队的最大链接个数 */
for( ; ; ) {
... ...
connect_fd = accept( listen_fd, (struct sockaddr*)client_addr, &len ) ; /* 得到链接fd. */
... ...					/* 发送和接收数据 */
}

注：端口号的分配是有一些惯例的，不一样的端口号对应不一样的服务或进程。好比通常都把端口号21分配给FTP服务器的TCP/IP实现。端口号通常分为3段，0-1023（受限的众所周知的端口，由分配数值的权威机构IANA管理），1024-49151（能够从IANA那里申请注册的端口），49152-65535（临时端口，这就是为何代码中的端口号为49152）。

对于多字节整数在内存中有两种存储方式：一种是低字节在前，高字节在后，这样的存储顺序被称为低端字节序（little-endian）；高字节在前，低字节在后的存储顺序则被称为高端字节序（big-endian）。网络协议在处理多字节整数时，采用的是高端字节序，而不一样的主机可能采用不一样的字节序。所以在编程时必定要考虑主机字节序与网络字节序间的相互转换。这就是程序中使用htons函数的缘由，它返回网络字节序的整数。

（2）典型的TCP客户代码：

... ...
int socket_fd;
struct sockaddr_in serv_addr ;
... ...
socket_fd = socket ( PF_INET, SOCK_STREAM, 0 );
bzero( &serv_addr, sizeof(serv_addr) );
serv_addr.sin_family = AF_INET ;  /* 指明通讯协议族 */
serv_addr.sin_port = htons( 49152 ) ;       /* 分配端口号 */
inet_pton(AF_INET, " 192.168.0.11", &serv_addr.sin_sddr) ;
/* 分配地址，把点分十进制IPv4地址转化为32位二进制Ipv4地址。 */
connect( socket_fd, (struct sockaddr*)serv_addr, sizeof( serv_addr ) ) ; /* 向服务器发起链接请求 */
... ...							/* 发送和接收数据 */
... ...

对比两段代码能够看出，许多调用是服务器或客户机所特有的。另外，对于非面向链接的传输协议，代码还有简单些，没有链接的发起请求和接收请求部分。

五、网络编程中的其余重要概念

下面列出了网络编程中的其余重要概念，基本上都是给出这些概念可以实现的功能，读者在编程过程当中若是须要这些功能，可查阅相关概念。

（1）、I/O复用的概念

I/O复用提供一种能力，这种能力使得当一个I/O条件知足时，进程可以及时获得这个信息。I/O复用通常应用在进程须要处理多个描述字的场合。它的一个优点在于，进程不是阻塞在真正的I/O调用上，而是阻塞在select()调用上，select()能够同时处理多个描述字，若是它所处理的全部描述字的I/O都没有处于准备好的状态，那么将阻塞；若是有一个或多个描述字I/O处于准备好状态，则select()不阻塞，同时会根据准备好的特定描述字采起相应的I/O操做。

（2）、Unix通讯域

前面主要介绍的是PF_INET通讯域，实现网际间的进程间通讯。基于Unix通讯域（调用socket时指定通讯域为PF_LOCAL便可）的套接口能够实现单机之间的进程间通讯。采用Unix通讯域套接口有几个好处：Unix通讯域套接口一般是TCP套接口速度的两倍；另外一个好处是，经过Unix通讯域套接口能够实如今进程间传递描述字。全部可用描述字描述的对象，如文件、管道、有名管道及套接口等，在咱们以某种方式获得该对象的描述字后，均可以经过基于Unix域的套接口来实现对描述字的传递。接收进程收到的描述字值不必定与发送进程传递的值一致（描述字是特定于进程的），可是特们指向内核文件表中相同的项。

（3）、原始套接口

原始套接口提供通常套接口所不提供的功能：

原始套接口能够读写一些用于控制的控制协议分组，如ICMPv4等，进而可实现一些特殊功能。
原始套接口能够读写特殊的IPv4数据包。内核通常只处理几个特定协议字段的数据包，那么一些须要不一样协议字段的数据包就须要经过原始套接口对其进行读写；
经过原始套接口能够构造本身的Ipv4头部，也是比较有意思的一点。

建立原始套接口须要root权限。

（4）、对数据链路层的访问

对数据链路层的访问，使得用户能够侦听本地电缆上的全部分组，而不须要使用任何特殊的硬件设备，在linux下读取数据链路层分组须要建立SOCK_PACKET类型的套接口，并须要有root权限。

（5）、带外数据（out-of-band data）

若是有一些重要信息要马上经过套接口发送（不通过排队），请查阅与带外数据相关的文献。

（6）、多播

linux内核支持多播，可是在默认状态下，多数linux系统都关闭了对多播的支持。所以，为了实现多播，可能须要从新配置并编译内核。具体请参考[4]及[2]。

结论：linux套接口编程的内容能够说是极大丰富，同时它涉及到许多的网络背景知识，有兴趣的读者可在[2]中找到比较系统而全面的介绍。

至此，本专题系列（linux环境进程间通讯）所有结束了。实际上，进程间通讯的通常意义一般指的是消息队列、信号灯和共享内存，能够是posix的，也能够是SYS v的。本系列同时介绍了管道、有名管道、信号以及套接口等，是更为通常意义上的进程间通讯机制。

参考资料

Understanding the Linux Kernel, 2nd Edition, By Daniel P. Bovet, Marco Cesati , 对各主题阐述得重点突出，脉络清晰。网络部分分析集中在TCP/IP协议栈的数据连路层、网络层以及传输层。
UNIX网络编程第一卷：套接口API和X/Open传输接口API，做者：W.Richard Stevens，译者：杨继张，清华大学出版社。不只对套接口网络编程有极好的描述，并且极为详尽的阐述了相关的网络背景知识。不管是入门仍是深刻研究，都是不可多得的好资料。
Linux内核源代码情景分析（下），毛德操、胡希明著，浙江大学出版社，给出了unix域套接口部分的内核代码分析。
GNU/Linux编程指南，入门、应用、精通，第二版，Kurt Wall等著，张辉译