linux下进程间通讯的几种主要手段:node
本文讲述进程间通讯方法——共享内存linux
原文:http://www.ibm.com/developerworks/cn/linux/l-ipc/part6/编程
一个套接口能够看做是进程间通讯的端点(endpoint),每一个套接口的名字都是惟一的(惟一的含义是不言而喻的),其余进程能够发现、链接而且与之通讯。通讯域用来讲明套接口通讯的协议,不一样的通讯域有不一样的通讯协议以及套接口的地址结构等等,所以,建立一个套接口时,要指明它的通讯域。比较常见的是unix域套接口(采用套接口机制实现单机内的进程间通讯)及网际通讯域。服务器
linux目前的网络内核代码主要基于伯克利的BSD的unix实现,整个结构采用的是一种面向对象的分层机制。层与层之间有严格的接口定义。这里咱们引用[1]中的一个图表来描述linux支持的一些通讯协议:数据结构
咱们这里只关心IPS,即因特网协议族,也就是一般所说的TCP/IP网络。咱们这里假设读者具备网络方面的一些背景知识,如了解网络的分层结构,一般所说的7层结构;了解IP地址以及路由的一些基本知识。dom
目前linux网络API是基于BSD套接口的(系统V提供基于流I/O子系统的用户接口,可是linux内核目前不支持流I/O子系统)。套接口能够说是网络编程中一个很是重要的概念,linux以文件的形式实现套接口,与套接口相应的文件属于sockfs特殊文件系统,建立一个套接口就是在sockfs中建立一个特殊文件,并创建起为实现套接口功能的相关数据结构。换句话说,对每个新建立的BSD套接口,linux内核都将在sockfs特殊文件系统中建立一个新的inode。描述套接口的数据结构是socket,将在后面给出。socket
下面是在网络编程中比较重要的几个数据结构,读者能够在后面介绍编程API部分再回过头来了解它们。async
套接口是由socket数据结构表明的,形式以下:
struct socket { socket_state state; /* 指明套接口的链接状态,一个套接口的链接状态能够有如下几种 套接口是空闲的,尚未进行相应的端口及地址的绑定;尚未链接;正在链接中;已经链接;正在解除链接。 */ unsigned long flags; struct proto_ops ops; /* 指明可对套接口进行的各类操做 */ struct inode inode; /* 指向sockfs文件系统中的相应inode */ struct fasync_struct *fasync_list; /* Asynchronous wake up list */ struct file *file; /* 指向sockfs文件系统中的相应文件 */ struct sock sk; /* 任何协议族都有其特定的套接口特性,该域就指向特定协议族的套接口对 象。 */ wait_queue_head_t wait; short type; unsigned char passcred; }; |
(2)描述套接口通用地址的数据结构struct sockaddr
因为历史的缘故,在bind、connect等系统调用中,特定于协议的套接口地址结构指针都要强制转换成该通用的套接口地址结构指针。结构形式以下:
struct sockaddr { sa_family_t sa_family; /* address family, AF_xxx */ char sa_data[14]; /* 14 bytes of protocol address */ }; |
(3)描述因特网地址结构的数据结构struct sockaddr_in(这里局限于IP4):
struct sockaddr_in { __SOCKADDR_COMMON (sin_); /* 描述协议族 */ in_port_t sin_port; /* 端口号 */ struct in_addr sin_addr; /* 因特网地址 */ /* Pad to size of `struct sockaddr'. */ unsigned char sin_zero[sizeof (struct sockaddr) - __SOCKADDR_COMMON_SIZE - sizeof (in_port_t) - sizeof (struct in_addr)]; }; |
通常来讲,读者最关心的是前三个域,即通讯协议、端口号及地址。
int socket( int domain, int type, int ptotocol); |
参数domain指明通讯域,如PF_UNIX(unix域),PF_INET(IPv4),PF_INET6(IPv6)等;type指明通讯类型,如SOCK_STREAM(面向链接方式)、SOCK_DGRAM(非面向链接方式)等。通常来讲,参数protocol可设置为0,除非用在原始套接口上(原始套接口有一些特殊功能,后面还将介绍)。
注:socket()系统调用为套接口在sockfs文件系统中分配一个新的文件和dentry对象,并经过文件描述符把它们与调用进程联系起来。进程能够像访问一个已经打开的文件同样访问套接口在sockfs中的对应文件。但进程毫不能调用open()来访问该文件(sockfs文件系统没有可视安装点,其中的文件永远不会出如今系统目录树上),当套接口被关闭时,内核会自动删除sockfs中的inodes。
根据传输层协议(TCP、UDP)的不一样,客户机及服务器的处理方式也有很大不一样。可是,无论通讯双方使用何种传输协议,都须要一种标识本身的机制。
通讯双方通常由两个方面标识:地址和端口号(一般,一个IP地址和一个端口号经常被称为一个套接口)。根据地址能够寻址到主机,根据端口号则能够寻址到主机提供特定服务的进程,实际上,一个特定的端口号表明了一个提供特定服务的进程。
对于使用TCP传输协议通讯方式来讲,通讯双方须要给本身绑定一个惟一标识本身的套接口,以便创建链接;对于使用UDP传输协议,只须要服务器绑定一个标识本身的套接口就能够了,用户则不须要绑定(在须要时,如调用connect时[注1],内核会自动分配一个本地地址和本地端口号)。绑定操做由系统调用bind()完成:
int bind( int sockfd, const struct sockaddr * my_addr, socklen_t my_addr_len) |
第二个参数对于Ipv4来讲,实际上须要填充的结构是struct sockaddr_in,前面已经介绍了该结构。这里只想强调该结构的第一个域,它代表该套接口使用的通讯协议,如AF_INET。联系socket系统调用的第一个参数,读者可能会想到PF_INET与AF_INET究竟有什么不一样?实际上,原来的想法是每一个通讯域(如PF_INET)可能对应多个协议(如AF_INET),而事实上支持多个协议的通讯域一直没有实现。所以,在linux内核中,AF_***与PF_***被定义为同一个常数,所以,在编程时能够不加区分地使用他们。
注1:在采用非面向链接通讯方式时,也会用到connect()调用,不过与在面向链接中的connect()调用有本质的区别:在非面向链接通讯中,connect调用只是先设置一下对方的地址,内核为本地套接口记下对方的地址,而后采用send()来发送数据,这样避免每次发送时都要提供相同的目的地址。其中的connect()调用不涉及握手过程;而在面向链接的通讯方式中,connect()要完成一个严格的握手过程。
对于采用面向链接的传输协议TCP实现通讯来讲,一个比较重要的步骤就是通讯双方创建链接(若是采用udp传输协议则不须要),由系统调用connect()完成:
int connect( int sockfd, const struct sockaddr * servaddr, socklen_t addrlen) |
第一个参数为本地调用socket后返回的描述符,第二个参数为服务器的地址结构指针。connect()向指定的套接口请求创建链接。
注:与connect()相对应,在服务器端,经过系统调用listen(),指定服务器端的套接口为监听套接口,监听每个向服务器套接口发出的链接请求,并经过握手机制创建链接。内核为listen()维护两个队列:已完成链接队列和未完成链接队列。
服务器端经过监听套接口,为全部链接请求创建了两个队列:已完成链接队列和未完成链接队列(每一个监听套接口都对应这样两个队列,固然,通常服务器只有一个监听套接口)。经过accept()调用,服务器将在监听套接口的已链接队列头中,返回用于表明当前链接的套接口描述字。
int accept( int sockfd, struct sockaddr * cliaddr, socklen_t * addrlen) |
第一个参数指明哪一个监听套接口,通常是由listen()系统调用指定的(因为每一个监听套接口都对应已链接和未链接两个队列,所以它的内部机制实质是经过sockfd指定在哪一个已链接队列头中返回一个用于当前客户的链接,若是相应的已链接队列为空,accept进入睡眠)。第二个参数指明客户的地址结构,若是对客户的身份不感兴趣,可指定其为空。
注:对于采用TCP传输协议进行通讯的服务器和客户机来讲,必定要通过客户请求创建链接,服务器接受链接请求这一过程;而对采用UDP传输协议的通讯双方则不须要这一步骤。
客户机能够经过套接口接收服务器传过来的数据,也能够经过套接口向服务器发送数据。前面全部的准备工做(建立套接口、绑定等操做)都是为这一步骤准备的。
经常使用的从套接口中接收数据的调用有:recv、recvfrom、recvmsg等,经常使用的向套接口中发送数据的调用有send、sendto、sendmsg等。
int recv(int s, void * buf, size_t len, int flags) int recvfrom(int s, void * buf, size_t len, int flags, struct sockaddr * from, socklen_t * fromlen) int recvmsg(int s, struct msghdr * msg, int flags) int send(int s,const void * msg, size_t len, int flags) int sendto(int s, const void * msg, size_t len, int flags const struct sockaddr * to, socklen_t tolen) int sendmsg(int s, const struct msghdr * msg, int flags) |
这里再也不对这些调用做具体的说明,只想强调一下,recvfrom()以及recvmsg()可用于面向链接的套接口,也可用于面向非链接的套接口;而recv()通常用于面向链接的套接口。另外,在调用了connect()以后,就应给调用send()而不是sendto()了,由于调用了connect以后,目标就已经肯定了。
前面讲到,socket()系统调用返回套接口描述字,实际上它是一个文件描述符。因此,能够对套接口进行一般的读写操做,即便用read()及write()方法。在实际应用中,因为面向链接的通讯(采用TCP传输协议)是可靠的,同时又保证字节流原有的顺序,因此更适合用read及write方法。而非面向链接的通讯(采用UDP传输协议)是不可靠的,字节流也不必定保持原有的顺序,因此通常不宜用read及write方法。
由close()来完成此项功能,它惟一的参数是套接口描述字,再也不赘述。
处处能够发现基于套接口的客户机及服务器程序,这里再也不给出完整的范例代码,只是给出它们的典型调用代码,并给出简要说明。
... ... int listen_fd, connect_fd; struct sockaddr_in serv_addr, client_addr; ... ... listen_fd = socket ( PF_INET, SOCK_STREAM, 0 ); /* 建立网际Ipv4域的(由PF_INET指定)面向链接的(由SOCK_STREAM指定, 若是建立非面向链接的套接口则指定为SOCK_DGRAM) 的套接口。第三个参数0表示由内核肯定缺省的传输协议, 对于本例,因为建立的是可靠的面向链接的基于流的套接口, 内核将选择TCP做为本套接口的传输协议) */ bzero( &serv_addr, sizeof(serv_addr) ); serv_addr.sin_family = AF_INET ; /* 指明通讯协议族 */ serv_addr.sin_port = htons( 49152 ) ; /* 分配端口号 */ inet_pton(AF_INET, " 192.168.0.11", &serv_addr.sin_sddr) ; /* 分配地址,把点分十进制IPv4地址转化为32位二进制Ipv4地址。 */ bind( listen_fd, (struct sockaddr*) serv_addr, sizeof ( struct sockaddr_in )) ; /* 实现绑定操做 */ listen( listen_fd, max_num) ; /* 套接口进入侦听状态,max_num规定了内核为此套接口排队的最大链接个数 */ for( ; ; ) { ... ... connect_fd = accept( listen_fd, (struct sockaddr*)client_addr, &len ) ; /* 得到链接fd. */ ... ... /* 发送和接收数据 */ } |
注:端口号的分配是有一些惯例的,不一样的端口号对应不一样的服务或进程。好比通常都把端口号21分配给FTP服务器的TCP/IP实现。端口号通常分为3段,0-1023(受限的众所周知的端口,由分配数值的权威机构IANA管理),1024-49151(能够从IANA那里申请注册的端口),49152-65535(临时端口,这就是为何代码中的端口号为49152)。
对于多字节整数在内存中有两种存储方式:一种是低字节在前,高字节在后,这样的存储顺序被称为低端字节序(little-endian);高字节在前,低字节在后的存储顺序则被称为高端字节序(big-endian)。网络协议在处理多字节整数时,采用的是高端字节序,而不一样的主机可能采用不一样的字节序。所以在编程时必定要考虑主机字节序与网络字节序间的相互转换。这就是程序中使用htons函数的缘由,它返回网络字节序的整数。
... ... int socket_fd; struct sockaddr_in serv_addr ; ... ... socket_fd = socket ( PF_INET, SOCK_STREAM, 0 ); bzero( &serv_addr, sizeof(serv_addr) ); serv_addr.sin_family = AF_INET ; /* 指明通讯协议族 */ serv_addr.sin_port = htons( 49152 ) ; /* 分配端口号 */ inet_pton(AF_INET, " 192.168.0.11", &serv_addr.sin_sddr) ; /* 分配地址,把点分十进制IPv4地址转化为32位二进制Ipv4地址。 */ connect( socket_fd, (struct sockaddr*)serv_addr, sizeof( serv_addr ) ) ; /* 向服务器发起链接请求 */ ... ... /* 发送和接收数据 */ ... ... |
对比两段代码能够看出,许多调用是服务器或客户机所特有的。另外,对于非面向链接的传输协议,代码还有简单些,没有链接的发起请求和接收请求部分。
下面列出了网络编程中的其余重要概念,基本上都是给出这些概念可以实现的功能,读者在编程过程当中若是须要这些功能,可查阅相关概念。
I/O复用提供一种能力,这种能力使得当一个I/O条件知足时,进程可以及时获得这个信息。I/O复用通常应用在进程须要处理多个描述字的场合。它的一个优点在于,进程不是阻塞在真正的I/O调用上,而是阻塞在select()调用上,select()能够同时处理多个描述字,若是它所处理的全部描述字的I/O都没有处于准备好的状态,那么将阻塞;若是有一个或多个描述字I/O处于准备好状态,则select()不阻塞,同时会根据准备好的特定描述字采起相应的I/O操做。
前面主要介绍的是PF_INET通讯域,实现网际间的进程间通讯。基于Unix通讯域(调用socket时指定通讯域为PF_LOCAL便可)的套接口能够实现单机之间的进程间通讯。采用Unix通讯域套接口有几个好处:Unix通讯域套接口一般是TCP套接口速度的两倍;另外一个好处是,经过Unix通讯域套接口能够实如今进程间传递描述字。全部可用描述字描述的对象,如文件、管道、有名管道及套接口等,在咱们以某种方式获得该对象的描述字后,均可以经过基于Unix域的套接口来实现对描述字的传递。接收进程收到的描述字值不必定与发送进程传递的值一致(描述字是特定于进程的),可是特们指向内核文件表中相同的项。
原始套接口提供通常套接口所不提供的功能:
建立原始套接口须要root权限。
对数据链路层的访问,使得用户能够侦听本地电缆上的全部分组,而不须要使用任何特殊的硬件设备,在linux下读取数据链路层分组须要建立SOCK_PACKET类型的套接口,并须要有root权限。
若是有一些重要信息要马上经过套接口发送(不通过排队),请查阅与带外数据相关的文献。
linux内核支持多播,可是在默认状态下,多数linux系统都关闭了对多播的支持。所以,为了实现多播,可能须要从新配置并编译内核。具体请参考[4]及[2]。
结论:linux套接口编程的内容能够说是极大丰富,同时它涉及到许多的网络背景知识,有兴趣的读者可在[2]中找到比较系统而全面的介绍。
至此,本专题系列(linux环境进程间通讯)所有结束了。实际上,进程间通讯的通常意义一般指的是消息队列、信号灯和共享内存,能够是posix的,也能够是SYS v的。本系列同时介绍了管道、有名管道、信号以及套接口等,是更为通常意义上的进程间通讯机制。
参考资料