最大的区别是网络程序是由两个部分组成的--客户端和服务器端linux
客户端在网络程序中,若是一个程序主动和外面的程序通讯,那么咱们把这个程序称为客户端程序。 好比咱们使用ftp程序从另一个地方获取文件的时候,是咱们的ftp程序主动同外面进行通讯(获取文件), 因此这个地方咱们的ftp程序就是客户端程序。算法
和客户端相对应的程序即为服务端程序。被动的等待外面的程序来和本身通信的程序称为服务端程序。好比上面的文件获取中,另一个地方的程序就是服务端,咱们从服务端获取文件过来。数据库
实际生活中有些程序是互为服务和客户端。在这种状况项目, 一个程序既为客户端也是服务端。编程
因为网络程序是有两个部分组成,因此在调试的时候比较麻烦,为此咱们有必要知道一些经常使用的网络命令数组
netstat
命令netstat是用来显示网络的链接,路由表和接口统计等网络的信息。netstat
有许多的选项。咱们经常使用的选项是-na
用来显示详细的网络状态。至于其它的选项咱们可使用帮助手册得到详细的状况。安全
telnet
telnet
是一个用来登陆远程的程序,可是咱们彻底能够用这个程序来调试咱们的服务端程序的。好比咱们的服务器程序在监听8888端口,咱们能够用telnet localhost 8888
来查看服务端的情况。服务器
ping网络
ping 程序用来判断网络的状态是否正常,最常常的一个用法是ping 192。168。0。1
,表示咱们想查看到192。168。0。1的硬件链接是否正常数据结构
TCP(Transfer Control Protocol)传输控制协议是一种面向链接的协议, 当咱们的网络程序使用这个协议的时候,网络能够保证咱们的客户端和服务端的链接是可靠的,安全的。多线程
UDP(User Datagram Protocol)用户数据报协议是一种非面向链接的协议,这种协议并不能保证咱们的网络程序的链接是可靠的,因此咱们如今编写的程序通常是采用TCP协议的。
Linux系统是经过提供套接字(socket)来进行网络编程的。网络程序经过socket和其它几个函数的调用,会返回一个 通信的文件描述符,咱们能够将这个描述符当作普通的文件的描述符来操做,这就是linux的设备无关性的好处。
咱们能够经过向描述符读写操做实现网络之间的数据交流。
原型及参数
int socket(int domain, int type,int protocol)
domain:说明咱们网络程序所在的主机采用的通信协族(AF_UNIX
和AF_INET
等)。AF_UNIX
只可以用于单一的Unix 系统进程间通讯,而AF_INET
是针对Internet的,于是能够容许在远程主机之间通讯(当咱们 man socket
时发现 domain
可选项是 PF_*
而不是AF_*
,由于glibc
是posix
的实现因此用PF代替了AF,不过咱们均可以使用的)。
type:咱们网络程序所采用的通信协议(SOCK_STREAM
,SOCK_DGRAM
等),SOCK_STREAM
代表咱们用的是TCP 协议,这样会提供按顺序的,可靠,双向,面向链接的比特流。SOCK_DGRAM
代表咱们用的是UDP协议,这样只会提供定长的,不可靠,无链接的通讯。
protocol:因为咱们指定了type,因此这个地方咱们通常只要用0来代替就能够了 socket为网络通信作基本的准备。成功时返回文件描述符,失败时返回-1,看errno
可知道出错的详细状况。
原型及参数
int bind(int sockfd, struct sockaddr *my_addr, int addrlen)
sockfd
:是由socket调用返回的文件描述符。addrlen
:是sockaddr结构的长度。my_addr
:是一个指向sockaddr的指针。 在中有 sockaddr的定义struct sockaddr{ unisgned shortas_family; char sa_data[14]; };
不过因为系统的兼容性,咱们通常不用这个头文件,而使用另一个结构(struct sockaddr_in) 来代替。在中有sockaddr_in
的定义
struct sockaddr_in{ unsigned shortsin_family; unsigned short intsin_port; struct in_addrsin_addr; unsigned charsin_zero[8]; }
bind将本地的端口同socket返回的文件描述符捆绑在一块儿。成功是返回0,失败的状况和socket同样
listen函数将bind的文件描述符变为监听套接字。返回的状况和bind同样。
int listen(int sockfd,int backlog)
sockfd
:是bind后的文件描述符。backlog
:设置请求排队的最大长度。当有多个客户端程序和服务端相连时, 使用这个表示能够介绍的排队长度。函数原型及参数
int accept(int sockfd, struct sockaddr *addr,int *addrlen)
sockfd
:是listen后的文件描述符。
addr,addrlen
是用来给客户端的程序填写的,服务器端只要传递指针就能够了。 bind,listen和accept是服务器端用的函数
accept调用时,服务器端的程序会一直阻塞到有一个 客户程序发出了链接。 accept成功时返回最后的服务器端的文件描述符,这个时候服务器端能够向该描述符写信息了。 失败时返回-1。
函数原型及参数
int connect(int sockfd, struct sockaddr * serv_addr,int addrlen)
sockfd
:socket返回的文件描述符。serv_addr
:储存了服务器端的链接信息。其中sin_add是服务端的地址addrlen
:serv_addr的长度connect函数是客户端用来同服务端链接的。成功时返回0,sockfd是同服务端通信的文件描述符 失败时返回-1。
总的来讲网络程序是由两个部分组成的--客户端和服务器端。它们的创建步骤通常是:
服务器端
socket-->bind-->listen-->accept
客户端
socket-->connect
转换和网络方面的信息函数。
在网络上面有着许多类型的机器,这些机器在表示数据的字节顺序是不一样的, 好比i386芯片是低字节在内存地址的低端,高字节在高端,而alpha芯片却相反。 为了统一块儿来,在Linux下面,有专门的字节转换函数。
unsigned longint htonl(unsigned longint hostlong) unsigned short int htons(unisgned short int hostshort) unsigned longint ntohl(unsigned longint netlong) unsigned short int ntohs(unsigned short int netshort)
在这四个转换函数中,h 表明host, n 表明 network。s 表明short, l 表明long。
第一个函数的意义是将本机器上的long数据转化为网络上的long。 其余几个函数的意义也差很少。
在网络上标志一台机器能够用IP或者是用域名。那么咱们怎么去进行转换呢?
struct hostent *gethostbyname(const char *hostname) struct hostent *gethostbyaddr(const char *addr,int len,int type)
struct hostent的定义
struct hostent{ char *h_name;/* 主机的正式名称*/ char *h_aliases;/* 主机的别名 */ inth_addrtype; /* 主机的地址类型AF_INET*/ inth_length; /* 主机的地址长度对于IP4 是4字节32位*/ char **h_addr_list;/* 主机的IP地址列表 */ }
#define h_addr h_addr_list[0]/* 主机的第一个IP地址*/
gethostbyname能够将机器名(如 linux.yessun.com)转换为一个结构指针。在这个结构里面储存了域名的信息
gethostbyaddr能够将一个32位的IP地址(C0A80001)转换为结构指针。
这两个函数失败时返回NULL 且设置h_errno错误变量,调用h_strerror()能够获得详细的出错信息
在网络上面咱们用的IP都是数字加点(192.168.0.1)构成的, 而在struct in_addr
结构中用的是32位的IP,咱们上面那个32位IP(C0A80001)是的192.168.0.1 为了转换咱们可使用下面两个函数
int inet_aton(const char *cp,struct in_addr *inp) char *inet_ntoa(struct in_addr in)
函数里面 a 表明 ascii, n 表明network。第一个函数表示将a.b.c.d的IP转换为32位的IP,存储在 inp指针里面。第二个是将32位IP转换为a。b。c。d的格式。
在网络程序里面咱们有时候须要知道端口。IP和服务信息。这个时候咱们可使用如下几个函数
int getsockname(int sockfd,struct sockaddr *localaddr,int *addrlen) int getpeername(int sockfd,struct sockaddr *peeraddr, int *addrlen) struct servent *getservbyname(const char *servname,const char *protoname) struct servent *getservbyport(int port,const char *protoname) struct servent { char *s_name;/* 正式服务名 */ char **s_aliases;/* 别名列表 */ int s_port; /* 端口号 */ char *s_proto; /* 使用的协议 */ }
通常咱们不多用这几个函数。对应客户端,当咱们要获得链接的端口号时在connect调用成功后使用可获得系统分配的端口号。对于服务端,咱们用INADDR_ANY填充后,为了获得链接的IP咱们能够在accept调用成功后 使用而获得IP地址。在网络上有许多的默认端口和服务,好比端口21对ftp80对应WWW。为了获得指定的端口号的服务 咱们能够调用第四个函数,相反为了获得端口号能够调用第三个函数。
一旦咱们创建了链接,咱们的下一步就是进行通讯了。在Linux下面把咱们前面创建的通道当作是文件描述符,
这样服务器端和客户端进行通讯时候,只要往文件描述符里面读写东西了。 就象咱们往文件读写同样。
ssize_t write(int fd,const void *buf,size_t nbytes)
write函数将buf中的nbytes字节内容写入文件描述符fd。成功时返回写的字节数。失败时返回-1。 并设置errno变量。
在网络程序中,当咱们向套接字文件描述符写时有两种可能。
ssize_t read(int fd,void *buf,size_t nbyte)
, read函数是负责从fd中读取内容。当读成功时,read返回实际所读的字节数,若是返回的值是0 表示已经读到文件的结束了,小于0表示出现了错误。
有了上面的两个函数,咱们就能够向客户端或者是服务端传递数据了。好比咱们要传递一个结构。可使用以下方式
/*客户端向服务端写 */ struct my_struct my_struct_client; write(fd,(void *)&my_struct_client,sizeof(struct my_struct); /* 服务端的读*/ char buffer[sizeof(struct my_struct)]; struct *my_struct_server; read(fd,(void *)buffer,sizeof(struct my_struct)); my_struct_server=(struct my_struct *)buffer;
在网络上传递数据时咱们通常都是把数据转化为char类型的数据传递。接收的时候也是同样的 注意的是咱们没有必要在网络上传递指针(由于传递指针是没有任何意义的,咱们必须传递指针所指向的内容)
咱们前面已经学习网络程序的一个很大的部分,由这个部分的知识,咱们实际上能够写出大部分的基于TCP协议的网络程序了。如今在 Linux下的大部分程序都是用咱们上面所学的知识来写的。咱们能够去找一些源程序来参考一下。
int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr * from int *fromlen) int sendto(int sockfd,const void *msg,int len,unsigned int flags,struct sockaddr *to int tolen)
sockfd,buf,len的意义和read,write同样,分别表示套接字描述符,发送或接收的缓冲区及大小。
recvfrom负责从sockfd接收数据,若是from不是NULL,那么在from里面存储了信息来源的状况,若是对信息的来源不感兴趣,能够将from和fromlen设置为NULL。sendto负责向to发送信息。此时在to里面存储了收信息方的详细资料。
在前面的几个部分里面,咱们已经学会了怎么样从网络上读写信息了。前面的一些函数(read,write)是网络程序里面最基本的函数。也是最原始的通讯函数。在这一章里面,咱们一块儿来学习网络通讯的高级函数。这一章咱们学习另外几个读写函数。
recv和send函数提供了和read和write差很少的功能。不过它们提供 了第四个参数来控制读写操做。
int recv(int sockfd,void *buf,int len,int flags) int send(int sockfd,void *buf,int len,int flags)
前面的三个参数和read,write同样,第四个参数能够是0或者是如下的组合
MSG_DONTROUTE
:不查找路由表MSG_OOB
:接受或者发送带外数据MSG_PEEK
:查看数据,并不从系统缓冲区移走数据MSG_WAITALL
:等待全部数据MSG_DONTROUTE
:是send函数使用的标志。这个标志告诉IP协议。目的主机在本地网络上面,没有必要查找路由表。这个标志通常用网络诊断和路由程序里面。MSG_OOB
:表示能够接收和发送带外的数据。关于带外数据咱们之后会解释的。MSG_PEEK
:是recv函数的使用标志,表示只是从系统缓冲区中读取内容,而不清除系统缓冲区的内容。这样下次读的时候,仍然是同样的内容。通常在有多个进程读写数据时可使用这个标志。MSG_WAITALL
是recv函数的使用标志,表示等到全部的信息到达时才返回。使用这个标志的时候recv回一直阻塞,直到指定的条件知足,或者是发生了错误。若是flags为0,则和read,write同样的操做。还有其它的几个选项,不过咱们实际上用的不多
这两个函数通常用在非套接字的网络程序当中(UDP),咱们已经在前面学会了。
recvmsg和sendmsg能够实现前面全部的读写函数的功能。
int recvmsg(int sockfd,struct msghdr *msg,int flags) int sendmsg(int sockfd,struct msghdr *msg,int flags) struct msghdr { void *msg_name; int msg_namelen; struct iovec *msg_iov; int msg_iovlen; void *msg_control; int msg_controllen; int msg_flags; } struct iovec { void *iov_base; /* 缓冲区开始的地址*/ size_t iov_len; /* 缓冲区的长度*/ }
msg_name
和 msg_namelen
当套接字是非面向链接时(UDP),它们存储接收和发送方的地址信息。msg_name
其实是一个指向struct sockaddr
的指针,msg_namelen
是结构的长度。当套接字是面向链接时,这两个值应设为NULL
。msg_iov
和 msg_iovlen
指出接受和发送的缓冲区内容。msg_iov
是一个结构指针,msg_iovlen
指出这个结构数组的大小。msg_control
和msg_controllen
这两个变量是用来接收和发送控制数据时的 msg_flags指定接受和发送的操做选项和 recv,send的选项同样关闭套接字有两个函数close和shutdown。用close时和咱们关闭文件同样。
int shutdown(int sockfd,int howto)
TCP链接是双向的(是可读写的),当咱们使用close时,会把读写通道都关闭,有时侯咱们但愿只关闭一个方向,这个时候咱们可使用shutdown
。针对不一样的howto
,系统回采起不一样的关闭方式。
howto=0
这个时候系统会关闭读通道。可是能够继续往接字描述符写。
howto=1
关闭写通道,和上面相反,着时候就只能够读了。
howto=2
关闭读写通道,和close同样 在多进程程序里面,若是有几个子进程共享一个套接字时,若是咱们使用shutdown,那么全部的子进程都不可以操做了,这个时候咱们只可以使用close来关闭子进程的套接字描述符。
若是你考过计算机等级考试,那么你就应该已经知道了网络传输分层这个概念。在网络上,人们为了传输数据时的方便,把网络的传输分为7个层次。分别是:应用层,表示层,会话层,传输层,网络层,数据链路层和物理层。分好了层之后,传输数据时,上一层若是要数据的话,就能够直接向下一层要了,而没必要要管数据传输的细节。下一层也只向它的上一层提供数据, 而不要去管其它东西了。若是你不想考试,你没有必要去记这些东西的。只要知道是分层的,并且各层的做用不一样。
IP协议是在网络层的协议。它主要完成数据包的发送做用。 详细描述略
ICMP是消息控制协议,也处于网络层。在网络上传递IP数据包时,若是发生了错误,那么就会用ICMP协议来报告错误。关于ICMP协议的详细状况能够查看 RFC792
UDP协议是创建在IP协议基础之上的,用在传输层的协议。UDP和IP协议同样是不可靠的数据报服务。
TCP协议也是创建在IP协议之上的,不过TCP协议是可靠的。按照顺序发送的。TCP的数据结构比前面的结构都要复杂。
关于TCP的报文内容请参考这里
有时候咱们要控制套接字的行为(如修改缓冲区的大小),这个时候咱们就要控制套接字的选项了。
getsockopt和setsockopt函数
int getsockopt(int sockfd,int level,int optname,void *optval,socklen_t *optlen) int setsockopt(int sockfd,int level,int optname,const void *optval,socklen_t *optlen)
level
指定控制套接字的层次。能够取三种值:-- SOL_SOCKET:通用套接字选项。
-- IPPROTO_IP:IP选项。
-- IPPROTO_TCP:TCP选项。
optname
指定控制的方式(选项的名称),咱们下面详细解释optval
得到或者是设置套接字选项。根据选项名称的数据类型进行转换SO_BROADCAST 容许发送广播数据int
SO_DEBUG容许调试int
SO_DONTROUTE 不查找路由int
SO_ERROR得到套接字错误int
SO_KEEPALIVE 保持链接int
SO_LINGER 延迟关闭链接 struct linger
SO_OOBINLINE 带外数据放入正常数据流int
SO_RCVBUF 接收缓冲区大小int
SO_SNDBUF 发送缓冲区大小int
SO_RCVLOWAT接收缓冲区下限int
SO_SNDLOWAT发送缓冲区下限int
SO_RCVTIMEO接收超时struct timeval
SO_SNDTIMEO发送超时struct timeval
SO_REUSERADDR容许重用本地地址和端口int
SO_TYPE 得到套接字类型int
SO_BSDCOMPAT 与BSD系统兼容int
IP_HDRINCL在数据包中包含IP首部 int
IP_OPTINOSIP首部选项int
IP_TOS服务类型
IP_TTL生存时间int
TCP_MAXSEGTCP最大数据段的大小int
TCP_NODELAY不使用Nagle算法 int
ioctl能够控制全部的文件描述符的状况,这里介绍一下控制套接字的选项。
int ioctl(int fd,int req, ...)
ioctl的控制选项
SIOCATMARK是否到达带外标记int
FIOASYNC异步输入/输出标志 int
FIONREAD缓冲区可读的字节数int
原始套接字和通常的套接字不一样的是之前许多由系统作的事情,如今要由咱们本身来作了。 不过这里面是否是有不少的乐趣呢。当咱们建立了一个 TCP套接字的时候,咱们只是负责把咱们要发送的内容(buffer)传递给了系统。 系统在收到咱们的数据后,会自动的调用相应的模块给数据加上TCP 头部,而后加上IP头部。 再发送出去。而如今是咱们本身建立各个的头部,系统只是把它们发送出去。 在上面的实例中,因为咱们要修改咱们的源IP地址, 因此咱们使用了setsockopt函数,若是咱们只是修改TCP数据,那么IP数据同样也能够由系统来建立的。
总算完成了网络编程这个教程。算起来我差很少写了一个星期,原来觉得写这个应该是一件不难的事,作起来才知道原来有不少的地方都比我想象的要难。我还把不少的东西都省略掉了不过写完了这篇教程之后,我好象对网络的认识又增长了一步。若是咱们只是编写通常的网络程序仍是比较容易的,可是若是咱们想写出比较好的网络程序咱们还有着遥远的路要走。
网络程序通常的来讲都是多进程加上多线程的。为了处理好他们内部的关系,咱们还要学习进程之间的通讯。在网络程序里面有着许许多多的突发事件,为此咱们还要去学习更高级的 事件处理知识。如今的信息愈来愈多了,为了处理好这些信息,咱们还要去学习数据库。
若是要编写出有用的黑客软件,咱们还要去熟悉各类网络协议。总之咱们要学的东西还不少不少。看一看外国的软件水平,看一看印度的软件水平,宝岛台湾的水平,再看一看咱们本身的 软件水平你们就会知道了什么叫作差距。
咱们如今用的软件有几个是咱们中国人本身编写的。不过你们不要惧怕,不用担忧。只要咱们仍是清醒的,还可以认清咱们和别人的差距, 咱们就还有但愿。 毕竟咱们如今还年轻。只要咱们努力,认真的去学习,咱们必定可以学好的。咱们就能够追上别人直到超过别人!
相信一点: 别人能够作到的咱们同样能够作到,并且能够比别人作的更好! 勇敢的年轻人,为了咱们伟大祖国的软件产业,为了祖国的将来,努力的去奋斗吧!祖国会记住大家的!