一步步学Linux网络编程--ping命令的实现分析

先来讲说ping程序的原理吧,其实挺简单,就是一个主机系统向另一个主机系统说:I love you(ICMP报文),而后那个主机若是相信你或者说想和你通讯,和你心知心,那它就把收到的I love you(ICMP)报文原样返回.好嘛,源主机收到这个回应后,就happy了,由于对方是和本身心连心的。若是对方没有收到这个消息,或者对你不感冒,不肯意理你,不回你这个报文,或者说些不知云是云雾是雾的话,对不起啦,感情是两我的的事情哦.

     要想深入了解,需有入目三分的实力,这个ping也同样,我们先来看看它采用的TCP/IP协议,我刚说了,它发送的是ICMP回显请求,回答的是回显应答报文。谈起这个ICMP(Internet Control Message,网际控制报文协议)是为网关和目标主机而提供的一种差错控制机制,使它们在遇到差错时能把错误报告给报文源发方.是IP层的一个协议。可是因为差错报告在发送给报文源发方时可能也要通过若干子网,所以牵涉到路由选择等问题,因此ICMP报文需经过IP协议来发送。ICMP数据报的数据发送前须要两级封装:首先添加ICMP报头造成ICMP报文,再添加IP报头造成IP数据报。以下图所示:linux

IP报头
ICMP报头
ICMP数据报

     因为IP层协议是一种点对点的协议,而非端对端的协议,它提供无链接的数据报服务,没有端口的概念,所以不多使用bind()和connect() 函数,如有使用也只是用于设置IP地址。发送数据使用sendto()函数,接收数据使用recvfrom()函数。算法

     TCP/IP的经典大做《TCP/IP协议详解.卷一》清晰的告诉我,IP报头格式以下:网络

    IP报头格式

    详细的,小王那懒的人都知道翻翻上面提到的书,我也就不详细介绍了,我这里给出linux中的数据结构实现:数据结构

struct ip { #if __BYTE_ORDER == __LITTLE_ENDIAN unsigned int ip_hl:4; /* header length */ unsigned int ip_v:4; /* version */ #endif #if __BYTE_ORDER == __BIG_ENDIAN unsigned int ip_v:4; /* version */ unsigned int ip_hl:4; /* header length */ #endif u_int8_t ip_tos; /* type of service */ u_short ip_len; /* total length */ u_short ip_id; /* identification */ u_short ip_off; /* fragment offset field */ #define IP_RF 0x8000 /* reserved fragment flag */ #define IP_DF 0x4000 /* dont fragment flag */ #define IP_MF 0x2000 /* more fragments flag */ #define IP_OFFMASK 0x1fff /* mask for fragmenting bits */ u_int8_t ip_ttl; /* time to live */ u_int8_t ip_p; /* protocol */ u_short ip_sum; /* checksum */ struct in_addr ip_src, ip_dst; /* source and dest address */ }; 


别看这多,其实ping程序用到的没几个:app

    (1)IP报头长度IHL(Internet Header Length)以4字节为一个单位来记录IP报头的长度,是上述IP数据结构的ip_hl变量。 less

    (2)生存时间TTL(Time To Live)以秒为单位,指出IP数据报能在网络上停留的最长时间,其值由发送方设定,并在通过路由的每个节点时减一,当该值为0时,数据报将被丢弃,是上述IP数据结构的ip_ttl变量。ICMP报文分为两种:查询报文和差错报文。每一个ICMP报头均包含类型、编码和校验和这三项内容,其他选项则随ICMP的功能不一样而不一样。ICMP报文格式以下:socket

    ICMP

    Ping命令只使用众多ICMP报文中的两种:"请求回送'(ICMP_ECHO)和"请求回应'(ICMP_ECHOREPLY)。在Linux中定义以下:ide

#define ICMP_ECHO 0 #define ICMP_ECHOREPLY 8

    在Linux中ICMP数据结构(<netinet/ip_icmp.h>)定义以下:函数

linux中ICMP数据结构struct icmp { u_int8_t icmp_type; /* type of message, see below */ u_int8_t icmp_code; /* type sub code */ u_int16_t icmp_cksum; /* ones complement checksum of struct */ union { u_char ih_pptr; /* ICMP_PARAMPROB */ struct in_addr ih_gwaddr; /* gateway address */ struct ih_idseq /* echo datagram */ { u_int16_t icd_id; u_int16_t icd_seq; } ih_idseq; u_int32_t ih_void; /* ICMP_UNREACH_NEEDFRAG -- Path MTU Discovery (RFC1191) */ struct ih_pmtu { u_int16_t ipm_void; u_int16_t ipm_nextmtu; } ih_pmtu; struct ih_rtradv { u_int8_t irt_num_addrs; u_int8_t irt_wpa; u_int16_t irt_lifetime; } ih_rtradv; } icmp_hun; #define icmp_pptr icmp_hun.ih_pptr #define icmp_gwaddr icmp_hun.ih_gwaddr #define icmp_id icmp_hun.ih_idseq.icd_id #define icmp_seq icmp_hun.ih_idseq.icd_seq #define icmp_void icmp_hun.ih_void #define icmp_pmvoid icmp_hun.ih_pmtu.ipm_void #define icmp_nextmtu icmp_hun.ih_pmtu.ipm_nextmtu #define icmp_num_addrs icmp_hun.ih_rtradv.irt_num_addrs #define icmp_wpa icmp_hun.ih_rtradv.irt_wpa #define icmp_lifetime icmp_hun.ih_rtradv.irt_lifetime union { struct { u_int32_t its_otime; u_int32_t its_rtime; u_int32_t its_ttime; } id_ts; struct { struct ip idi_ip; /* options and then 64 bits of data */ } id_ip; struct icmp_ra_addr id_radv; u_int32_t id_mask; u_int8_t id_data[1]; } icmp_dun; #define icmp_otime icmp_dun.id_ts.its_otime #define icmp_rtime icmp_dun.id_ts.its_rtime #define icmp_ttime icmp_dun.id_ts.its_ttime #define icmp_ip icmp_dun.id_ip.idi_ip #define icmp_radv icmp_dun.id_radv #define icmp_mask icmp_dun.id_mask #define icmp_data icmp_dun.id_data };

    Ping命令中须要显示的信息,包括icmp_seq和ttl都已有实现的办法,但还缺rtt往返时间。为了实现这一功能,可利用ICMP数据报携带一个时间戳。使用如下函数生成时间戳:ui

#include 
int gettimeofday(struct timeval *tp,void *tzp)
其中timeval结构以下:
  struct timeval{
   long tv_sec;
   long tv_usec;
}

    在发送和接收报文时由gettimeofday分别生成两个timeval结构,二者之差即为往返时间,即 ICMP报文发送与接收的时间差,而timeval结构由ICMP数据报携带,

tzp指针表示时区,通常都不使用,赋NULL值。系统自带的ping命令当它接送完全部ICMP报文后,会对全部发送和全部接收的ICMP报文进行统计,从而计算ICMP报文丢失的比率。为达此目的,定义两个全局变量:接收计数器和发送计数器,用于记录ICMP报文接受和发送数目。丢失数目=发送总数-接收总数,丢失比率=丢失数目/发送总数。现给出模拟Ping程序功能的代码以下:

void statistics(int signo) { printf("\n--------------------PING statistics-------------------\n"); printf("%d packets transmitted, %d received , %d%% lost\n", nsend,nreceived,(nsend-nreceived)/nsend*100); close(sockfd); exit(1); } /*校验和算法*/ unsigned short cal_chksum(unsigned short *addr,int len) { int nleft=len; int sum=0; unsigned short *w=addr; unsigned short answer=0; /*把ICMP报头二进制数据以2字节为单位累加起来*/ while(nleft>1) { sum+=*w++; nleft-=2; } /*若ICMP报头为奇数个字节,会剩下最后一字节。把最后一个字节视为一个2字节数据的高 //字节,这个2字节数据的低字节为0,继续累加*/ if( nleft==1) { *(unsigned char *)(&answer)=*(unsigned char *)w; sum+=answer; } sum=(sum>>16)+(sum&0xffff); sum+=(sum>>16); answer=~sum; return answer; } /*设置ICMP报头*/ int pack(int pack_no) { int i,packsize; struct icmp *icmp; struct timeval *tval; icmp=(struct icmp*)sendpacket; icmp->icmp_type=ICMP_ECHO; icmp->icmp_code=0; icmp->icmp_cksum=0; icmp->icmp_seq=pack_no; icmp->icmp_id=pid; packsize=8+datalen; tval= (struct timeval *)icmp->icmp_data; gettimeofday(tval,NULL); /*记录发送时间*/ icmp->icmp_cksum=cal_chksum( (unsigned short *)icmp,packsize); /*校验算法*/ return packsize; } /*发送三个ICMP报文*/ void send_packet() { int packetsize; while( nsend<MAX_NO_PACKETS) //发送MAX_NO_PACKETS个ICMP报文 { nsend++; packetsize=pack(nsend); /*设置ICMP报头*/ //sendpacket为要发送的内容,由pack()函数设定,dest_addr是目的地址, if( sendto(sockfd,sendpacket,packetsize,0, (struct sockaddr *)&dest_addr,sizeof(dest_addr) )<0 ) { perror("sendto error"); continue; } sleep(1); /*每隔一秒发送一个ICMP报文*/ } } /*接收全部ICMP报文*/ void recv_packet() { int n,fromlen; extern int errno; signal(SIGALRM,statistics); fromlen=sizeof(from); while( nreceived<nsend) { //alarm()用来设置信号SIGALRM在通过参数seconds指定的秒数后传送给目前的进程 alarm(MAX_WAIT_TIME); if( (n=recvfrom(sockfd,recvpacket,sizeof(recvpacket),0, (struct sockaddr *)&from,&fromlen)) <0) { if(errno==EINTR) continue; perror("recvfrom error"); continue; } gettimeofday(&tvrecv,NULL); /*记录接收时间*/ if(unpack(recvpacket,n)==-1)continue; nreceived++; } } /*剥去ICMP报头*/ int unpack(char *buf,int len) { int i,iphdrlen; struct ip *ip; struct icmp *icmp; struct timeval *tvsend; double rtt; ip=(struct ip *)buf; //求ip报头长度,即ip报头的长度标志乘4,头长度指明头中包含的4字节字的个数。可接受 //的最小值是5,最大值是15 iphdrlen=ip->ip_hl<<2; icmp=(struct icmp *)(buf+iphdrlen); /*越过ip报头,指向ICMP报头*/ len-=iphdrlen; /*ICMP报头及ICMP数据报的总长度*/ if( len<8) /*小于ICMP报头长度则不合理*/ { printf("ICMP packets\'s length is less than 8\n"); return -1; } /*确保所接收的是我所发的的ICMP的回应*/ if( (icmp->icmp_type==ICMP_ECHOREPLY) && (icmp->icmp_id==pid) ) { tvsend=(struct timeval *)icmp->icmp_data; tv_sub(&tvrecv,tvsend); /*接收和发送的时间差*/ rtt=tvrecv.tv_sec*1000+tvrecv.tv_usec/1000; /*以毫秒为单位计算rtt*/ /*显示相关信息*/ printf("%d byte from %s: icmp_seq=%u ttl=%d rtt=%.3f ms\n", len,inet_ntoa(from.sin_addr),icmp->icmp_seq,ip->ip_ttl,rtt); } else return -1; } int main(int argc,char *argv[]) { struct hostent *host; struct protoent *protocol; unsigned long inaddr=0l; int waittime=MAX_WAIT_TIME; //#define MAX_WAIT_TIME 5 int size=50*1024; if(argc<2) { printf("usage:%s hostname/IP address\n",argv[0]); exit(1); } //getprotobyname("icmp")返回对应于给定协议名的包含名字和协议号的protoent结构指针。 if( (protocol=getprotobyname("icmp") )==NULL) { perror("getprotobyname"); exit(1); } /*生成使用ICMP的原始套接字,这种套接字只有root才能生成*/ if( (sockfd=socket(AF_INET,SOCK_RAW,protocol->p_proto) )<0) { perror("socket error"); exit(1); } /* 回收root权限,设置当前用户权限*/ setuid(getuid()); /*扩大套接字接收缓冲区到50K这样作主要为了减少接收缓冲区溢出的 的可能性,若无心中ping一个广播地址或多播地址,将会引来大量应答*/ setsockopt(sockfd,SOL_SOCKET,SO_RCVBUF,&size,sizeof(size) ); bzero(&dest_addr,sizeof(dest_addr)); dest_addr.sin_family=AF_INET; /*判断是主机名仍是ip地址*/ if( inaddr=inet_addr(argv[1])==INADDR_NONE) { if((host=gethostbyname(argv[1]) )==NULL) /*是主机名*/ { perror("gethostbyname error"); exit(1); } memcpy( (char *)&dest_addr.sin_addr,host->h_addr,host->h_length); } else /*是ip地址*/ dest_addr.sin_addr.s_addr = inet_addr(argv[1]); /*获取main的进程id,用于设置ICMP的标志符*/ pid=getpid(); printf("PING %s(%s): %d bytes data in ICMP packets.\n",argv[1], inet_ntoa(dest_addr.sin_addr),datalen); send_packet(); /*发送全部ICMP报文*/ recv_packet(); /*接收全部ICMP报文*/ statistics(SIGALRM); /*进行统计*/ return 0; } /*两个timeval结构相减*/ void tv_sub(struct timeval *out,struct timeval *in) { if( (out->tv_usec-=in->tv_usec)<0) { --out->tv_sec; out->tv_usec+=1000000; } out->tv_sec-=in->tv_sec; } 

好了,编译,运行。按照正常的ping程序运行(固然了,这个程序仍是很简单,目前为止还不支持环回地址127.0.0.1)。