Linux学习之socket编程(一)

socket编程

socket的概念:  

  在TCP/IP协议中,“IP地址+TCP或UDP端口号”惟一标识网络通信中的一个进程,“IP地址+端口号”就称为socket。
  在TCP协议中,创建链接的两个进程各自有一个socket来标识,那么这两个socket组成的socket pair就惟一标识一个链接。socket自己有“插座”的意思,所以用来描述网络连
接的一对一关系。
  TCP/IP协议最先在BSD UNIX上实现,为TCP/IP协议设计的应用层编程接口称为socketAPI。
  本章的主要内容是socket API,主要介绍TCP协议的函数接口,最后介绍UDP协议和UNIXDomain Socket的函数接口。linux

socket编程

socket-apiapi

1.基础知识

网络字节序  

  咱们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分,磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分。网络数据流一样有大端小端之分,那么如何定义网络数据流的地址呢?发送主机一般将发送缓冲区中的数据按内存地址从低到高的顺序发出,接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存,所以,网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高地址。
  TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节。例如上一节的UDP段格式,地址0-1是16位的源端口号,若是这个端口号是1000(0x3e8),则地址0是0x03,地址1是0xe8,也就是先发0x03,再发0xe8,这16位在发送主机的缓冲区中也应该是低地址存0x03,高地址存0xe8。可是,若是发送主机是小端字节序的,这16位被解释成0xe803,而不是1000。所以,发送主机把1000填到发送缓冲区以前须要作字节序的转换。一样地,接收主机若是是小端字节序的,接到16位的源端口号也要作字节序的转换。若是主机是大端字节序的,发送和接收都不须要作转换。同理,32位的IP地址也要考虑网络字节序和主机字节序的问题。
  为使网络程序具备可移植性,使一样的C代码在大端和小端计算机上编译后都能正常运行,能够调用如下库函数作网络字节序和主机字节序的转换。服务器

#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
h表示host,n表示network,l表示32位长整数,s表示16位短整数。
若是主机是小端字节序,这些函数将参数作相应的大小端转换而后返回,若是主机是大端字节序,这些函数不作转
换,将参数原封不动地返回。

IP地址转换函数

#include <arpa/inet.h>
int inet_pton(int af, const char *src, void *dst);//把字符串的ip转换成32位二进制的整型
const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);//把32位二进制的整型转成字符串的ip
转换成
支持IPv4和IPv6 可重入函数

  其中inet_pton和inet_ntop不只能够转换IPv4的in_addr,还能够转换IPv6的in6_addr,所以函数接口是void *addrptr网络

sockaddr数据结构

  strcut sockaddr 不少网络编程函数诞生早于IPv4协议,那时候都使用的是sockaddr结构体,为了向前兼容,如今sockaddr退化成了(void *)的做用,传递一个地址给函数,至于这个函数是sockaddr_in仍是sockaddr_in6,由地址族肯定,而后函数内部再强制类型转化为所需的地址类型

数据结构

 



sockaddr数据结构dom

struct sockaddr {
sa_family_t sa_family; /* address family, AF_xxx */
char sa_data[14]; /* 14 bytes of protocol address */
};

//ipv4
struct sockaddr_in { __kernel_sa_family_t sin_family; /* Address family */ __be16 sin_port; /* Port number */ struct in_addr sin_addr; /* Internet address */ /* Pad to size of `struct sockaddr'. */ unsigned char __pad[__SOCK_SIZE__ - sizeof(short int) - sizeof(unsigned short int) - sizeof(struct in_addr)];//填充字节 }; /* Internet address. */ struct in_addr { __be32 s_addr; };

//ipv6
struct sockaddr_in6 { unsigned short int sin6_family; /* AF_INET6 */ __be16 sin6_port; /* Transport layer port # */ __be32 sin6_flowinfo; /* IPv6 flow information */ struct in6_addr sin6_addr; /* IPv6 address */ __u32 sin6_scope_id; /* scope id (new in RFC2553) */ }; struct in6_addr { union { __u8 u6_addr8[16]; __be16 u6_addr16[8]; __be32 u6_addr32[4]; } in6_u; #define s6_addr in6_u.u6_addr8 #define s6_addr16 in6_u.u6_addr16 #define s6_addr32 in6_u.u6_addr32 }; #define UNIX_PATH_MAX 108 struct sockaddr_un { __kernel_sa_family_t sun_family; /* AF_UNIX */ char sun_path[UNIX_PATH_MAX]; /* pathname 相似于有名管道*/ };

 

Pv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位端口号和32位IP地址,IPv6地址用sockaddr_in6结构体表示,包括16位端口号、128位IP地址和一些控制字段。UNIX Domain Socket的地址格式定义在sys/un.h中,用sock-addr_un结构体表示。各类socket地址结构体的开头都是相同的,前16位表示整个结构体的长度(并非全部UNIX的实现都有长度字段,如Linux就没有),后16位表示地址类型。IPv四、IPv6和Unix Domain Socket的地址类型分别定义为常数AF_INET、AF_INET六、AF_UNIX。这样,只要取得某种sockaddr结构体的首地址,不须要知道具体是哪一种类型的sockaddr结构体,就能够根据地址类型字段肯定结构体中的内容。所以,socket API能够接受各类类型的sockaddr结构体指针作参数,例如bind、accept、connect等函数,这些函数的参数应该设计成void *类型以便接受各类类型的指针,可是sock API的实现早于ANSI C标准化,那时尚未void *类型,所以这些函数的参数都用struct sockaddr *类型表示,在传递参数以前要强制类型转换一下,例如:socket

struct sockaddr_in servaddr;
/* initialize servaddr */
bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));//传递参数时强转  

2.网络套接字函数

socket(构造出一条通道)

#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int socket(int domain, int type, int protocol);

domain:
  AF_INET 这是大多数用来产生socket的协议,使用TCP或UDP来传输,用IPv4的地址
  AF_INET6 与上面相似,不过是来用IPv6的地址
  AF_UNIX 本地协议,使用在Unix和Linux系统上,通常都是当客户端和服务器在同一台及其上的时候使用
type:   SOCK_STREAM 这个协议是按照顺序的、可靠的、数据完整的基于字节流的链接。这是一个使用最多的socket类型,这个socket是使用TCP来进行传输。   SOCK_DGRAM 这个协议是无链接的、固定长度的传输调用。该协议是不可靠的,使用UDP来进行它的链接。   SOCK_SEQPACKET 这个协议是双线路的、可靠的链接,发送固定长度的数据包进行传输。必须把这个包完整的接受才能进行读取   SOCK_RAW 这个socket类型提供单一的网络访问,这个socket类型使用ICMP公共协议。(ping、traceroute使用该协议)   SOCK_RDM 这个类型是不多使用的,在大部分的操做系统上没有实现,它是提供给数据链路层使用,不保证数包的顺序 protocol:   
0 默认协议 返回值:   成功返回一个新的文件描述符,失败返回-1,设置errno

   socket()打开一个网络通信端口,若是成功的话,就像open()同样返回一个文件描述符,应用程序能够像读写文件同样用read/write在网络上收发数据,若是socket()调用出错则返回-1。对于IPv4,domain参数指定为AF_INET。对于TCP协议,type参数指定为SOCK_STREAM,表示面向流的传输协议。若是是UDP协议,则type参数指定为SOCK_DGRAM,表示面向数据报的传输协议。protocol参数的介绍从略,指定为0便可。tcp

bind

#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
//绑定后,如有用户访问addr地址时,会经过sockfd进行数据传递 sockfd: socket文件描述符 addr: 构造出IP地址加端口号 addrlen:
sizeof(addr)长度 返回值: 成功返回0,失败返回-1, 设置errno

  服务器程序所监听的网络地址和端口号一般是固定不变的,客户端程序得知服务器程序的地址和端口号后就能够向服务器发起链接,所以服务器须要调用bind绑定一个固定的网络地址和端口号。
  bind()的做用是将参数sockfd和addr绑定在一块儿,使sockfd这个用于网络通信的文件描述符监听addr所描述的地址和端口号。前面讲过,struct sockaddr *是一个通用指针类型,addr参数实际上能够接受多种协议的sockaddr结构体,而它们的长度各不相同,因此须要第三个参数addrlen指定结构体的长度。函数

struct sockaddr_in servaddr;
bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);//本机的任意一个IP地址均可以
servaddr.sin_port = htons(8000);

  首先将整个结构体清零,而后设置地址类型为AF_INET,网络地址为INADDR_ANY,这个宏表示本地的任意IP地址,由于服务器可能有多个网卡,每一个网卡也可能绑定多个IP地址,这样设置能够在全部的IP地址上监听,直到与某个客户端创建了链接时才肯定下来到底用哪一个IP地址,端口号为8000。
listen

#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int listen(int sockfd, int backlog);//让sockfd所指向的socktet具备监听的能力

sockfd:
    socket文件描述符
backlog:
    排队创建3次握手队列和刚刚创建3次握手队列的连接数和(默认为128  )

 

  查看系统默认backlog

cat /proc/sys/net/ipv4/tcp_max_syn_backlog

  典型的服务器程序能够同时服务于多个客户端,当有客户端发起链接时,服务器调用的accept()返回并接受这个链接,若是有大量的客户端发起链接而服务器来不及处理,还没有accept的客户端就处于链接等待状态,listen()声明sockfd处于监听状态,而且最多容许有backlog个客户端处于链接待状态,若是接收到更多的链接请求就忽略。listen()成功返回0,失败返回-1。

  若客户端(ip加端口)向服务器发起连接,如下这些过程都是在内核进行的,在通过bind和socket函数后,服务器建立出一个socket(和ip+端口号绑定),在创建链接时候,TCP是经过三次握手创建,内核中会出两个队列,一个刚刚3次握手成功,另个是等待3次握手(三次握手整个过程没有彻底完成)。队列长度有限,若队列满了,再来信号,报错RST。accept阻塞在socktet,监听等待。若accept接受到链接,返回一个socket的文件描述符,专门用于和发起连接的客户端通讯。connect负责发起链接,创建一个socket(会临时分配一个端口号),向服务端发数据。

accept

#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
sockdf:

socket文件描述符
addr:
    传出参数,返回连接客户端地址信息,含IP地址和端口号
addrlen:
    传入传出参数(值-结果),传入sizeof(addr)大小,函数返回时返回真正接收到地址结构体的大小(IPv4或IPv6)
返回值:
    成功返回一个新的socket文件描述符,用于和客户端通讯,失败返回-1,设置errno

 

  三方握手完成后,服务器调用accept()接受链接,若是服务器调用accept()时尚未客户端的链接请求,就阻塞等待直到有客户端链接上来。addr是一个传出参数,accept()返回时传出客户端的地址和端口号。addrlen参数是一个传入传出参数(value-resultargument),传入的是调用者提供的缓冲区addr的长度以免缓冲区溢出问题,传出的是客户端地址结构体的实际长度(有可能没有占满调用者提供的缓冲区)。若是给addr参数传NULL,表示不关心客户端的地址。
  服务器程序结构是这样的:

while (1) {
    cliaddr_len = sizeof(cliaddr);
    connfd = accept(listenfd, (struct sockaddr *)&cliaddr,     &cliaddr_len);
    n = read(connfd, buf, MAXLINE);
    ......
    close(connfd);
}

 

 connect

#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

sockdf:
    socket文件描述符
addr:
    传入参数,指定服务器端地址信息,含IP地址和端口号
addrlen:
    传入参数,传入sizeof(addr)大小
返回值:
    成功返回0,失败返回-1,设置errno

 

  客户端须要调用connect()链接服务器,connect和bind的参数形式一致,区别在于bind的参数是本身的地址,而connect的参数是对方的地址。connect()成功返回0,出错返回-1。

3.C/S模型-TCP

 

TCP协议通讯流程

  服务器调用socket()、bind()、listen()完成初始化后,调用accept()阻塞等待,处于监听端口的状态,客户端调用socket()初始化后,调用connect()发出SYN段并阻塞等待服务器应答,服务器应答一个SYN-ACK段,客户端收到后从connect()返回,同时应答一个ACK段,服务器收到后从accept()返回。
  数据传输的过程:
  创建链接后,TCP协议提供全双工的通讯服务,可是通常的客户端/服务器程序的流程是由客户端主动发起请求,服务器被动处理请求,一问一答的方式。所以,服务器从accept()返回后马上调用read(),读socket就像读管道同样,若是没有数据到达就阻塞等待,这时客户端调用write()发送请求给服务器,服务器收到后从read()返回,对客户端的请求进行处理,在此期间客户端调用read()阻塞等待服务器的应答,服务器调用write()将处理结果发回给客户端,再次调用read()阻塞等待下一条请求,客户端收到后从read()返回,发送下一条请求,如此循环下去。

  若是客户端没有更多的请求了,就调用close()关闭链接,就像写端关闭的管道同样,服务器的read()返回0,这样服务器就知道客户端关闭了链接,也调用close()关闭链接。注意,任何一方调用close()后,链接的两个传输方向都关闭,不能再发送数据了。若是一方调用shutdown()则链接处于半关闭状态,仍可接收对方发来的数据。

  在学习socket API时要注意应用程序和TCP协议层是如何交互的: *应用程序调用某个socket函数时TCP协议层完成什么动做,好比调用connect()会发出SYN段 *应用程序如何知道TCP协议层的状态变化,好比从某个阻塞的socket函数返回就代表TCP协议收到了某些段,再好比read()返回0就代表收到了FIN段。

实例:

mkdir server_test

touch server.c

touch client.c

touch Makefile

 

 

server.c

#include <sys/types.h>      
#include <sys/socket.h> #include <arpa/inet.h> #include <stdio.h> #include <string.h> #include <sys/types.h> #include <netinet/in.h> #define SERVER_PORT 8000 #define MAXLINE 4096 int main(void) { struct sockaddr_in serveraddr, clientaddr; int sockfd, addrlen, confd, len, i; char ipstr[128]; char buf[MAXLINE]; //1.socket sockfd = socket(AF_INET, SOCK_STREAM, 0); //2.bind bzero(&serveraddr, sizeof(serveraddr)); /* 地址族协议IPv4 */ serveraddr.sin_family = AF_INET; /* IP地址 */ serveraddr.sin_addr.s_addr = htonl(INADDR_ANY); serveraddr.sin_port = htons(SERVER_PORT); bind(sockfd, (struct sockaddr *)&serveraddr, sizeof(serveraddr)); //3.listen listen(sockfd, 128); while (1) { //4.accept阻塞监听客户端连接请求 addrlen = sizeof(clientaddr); confd = accept(sockfd, (struct sockaddr *)&clientaddr, &addrlen);//返回的是客户端和服务端专用通道的socket描述符 //输出客户端IP地址和端口号 inet_ntop(AF_INET, &clientaddr.sin_addr.s_addr, ipstr, sizeof(ipstr)); printf("client ip %s\tport %d\n", inet_ntop(AF_INET, &clientaddr.sin_addr.s_addr, ipstr, sizeof(ipstr)), ntohs(clientaddr.sin_port)); //和客户端交互数据操做confd //5.处理客户端请求 len = read(confd, buf, sizeof(buf)); i = 0; while (i < len) { buf[i] = toupper(buf[i]); i++; } write(confd, buf, len); close(confd); } close(sockfd); return 0; }

 

nc  ip 端口
链接

 

client.c

#include <netinet/in.h>
#include <stdio.h> #include <sys/types.h> #include <sys/socket.h> #include <arpa/inet.h> #include <string.h> #include <stdlib.h> #include <sys/stat.h> #include <unistd.h> #include <fcntl.h> #define SERVER_PORT 8000 #define MAXLINE 4096 int main(int argc, char *argv[]) { struct sockaddr_in serveraddr; int confd, len; char ipstr[] = "192.168.6.254"; char buf[MAXLINE]; if (argc < 2) { printf("./client str\n"); exit(1); } //1.建立一个socket confd = socket(AF_INET, SOCK_STREAM, 0); //2.初始化服务器地址 bzero(&serveraddr, sizeof(serveraddr)); serveraddr.sin_family = AF_INET; //"192.168.6.254" inet_pton(AF_INET, ipstr, &serveraddr.sin_addr.s_addr); serveraddr.sin_port = htons(SERVER_PORT); //3.连接服务器 connect(confd, (struct sockaddr *)&serveraddr, sizeof(serveraddr)); //4.请求服务器处理数据 write(confd, argv[1], strlen(argv[1])); len = read(confd, buf, sizeof(buf)); write(STDOUT_FILENO, buf, len); //5.关闭socket  close(confd); return 0; }

 Makefile

all:server client


server:server.c
    gcc $< -o $@

client:client.c
    gcc $< -o $@


.PHONY:clean
clean:
    rm -f server
    rm -f client

 

  因为客户端不须要固定的端口号,所以没必要调用bind(),客户端的端口号由内核自动分配。注意,客户端不是不容许调用bind(),只是没有必要调用bind()固定一个端口号,服务器也不是必须调用bind(),但若是服务器不调用bind(),内核会自动给服务器分配监听端口,每次启动服务器时端口号都不同,客户端要链接服务器就会遇到麻烦。客户端和服务器启动后能够查看连接状况:

netstat -apn|grep 8000

(来源传智播客邢文鹏linux系统编程的笔记)

相关文章
相关标签/搜索