python网络编程——socket基础篇

时间 2019-11-11

原文原文链接

python的网络编程比c语言简单许多, 封装许多底层的实现细节, 方便程序员使用的同时, 也使程序员比较难了解一些底层的东西。html

1 TCP/IP

　　要想理解socket，首先得熟悉一下TCP/IP协议族，TCP/IP（Transmission Control Protocol/Internet Protocol）即传输控制协议/网间协议，定义了主机如何连入因特网及数据如何在它们之间传输的标准，从字面意思来看TCP/IP是TCP和IP协议的合称，但实际上TCP/IP协议是指因特网整个TCP/IP协议族。不一样于ISO模型的七个分层，TCP/IP协议参考模型把全部的TCP/IP系列协议归类到四个抽象层中：
　　应用层：TFTP，HTTP，SNMP，FTP，SMTP，DNS，Telnet等等
　　传输层：TCP，UDP
　　网络层：IP，ICMP，OSPF，EIGRP，IGMP
　　数据链路层：SLIP，CSLIP，PPP，MTU
　　每一抽象层创建在低一层提供的服务上，而且为高一层提供服务，看起来大概是这样子的
　　python

　在TCP/IP协议中两个因特网主机经过两个路由器和对应的层链接。各主机上的应用经过一些数据通道相互执行读取操做，以下图所示：程序员

2 socket概念　

Socket(中文译为套接字)是操做系统内核中的一个数据结构，它几乎是全部网络通讯的基础。网络通讯，归根到底仍是进程间的通讯（不一样计算机上的进程间通讯, 又称为网络通讯, IP协议进行的主要是端到端通讯）。在网络中，每个节点（计算机或路由）都有一个网络地址，也就是IP地址。两个进程通讯时，首先要肯定各自所在的网络节点的网络地址。可是，网络地址只能肯定进程所在的计算机，而一台计算机上极可能同时运行着多个进程，因此仅凭网络地址还不能肯定究竟是和网络中的哪个进程进行通讯，所以套接字中还须要包括其余的信息，也就是端口号(PORT)。在一台计算机中，一个端口号一次只能分配给一个进程，也就是说，在一台计算机中，端口号和进程之间是一一对应的关系。编程

socket使用(IP地址，协议，端口号)来标识一个进程。因此，使用端口号和网络地址的组合能够惟一的肯定整个网络中的一个网络进程。服务器

端口号的范围从0~65535，一类是由互联网指派名字和号码公司ICANN负责分配给一些经常使用的应用程序固定使用的“周知的端口”，其值通常为0~1023, 用户自定义端口号通常大于等于1024

每个socket都用一个半相关描述{协议、本地地址、本地端口}来表示；一个完整的套接字则用一个相关描述{协议、本地地址、本地端口、远程地址、远程端口}来表示。socket也有一个相似于打开文件的函数调用，该函数返回一个整型的socket描述符，随后的链接创建、数据传输等操做都是经过socket描述符来实现的。网络

网络上的两个程序经过一个双向的通讯链接实现数据的交换，这个链接的一端称为一个socket。socket一般也称做“套接字”，用于描述IP地址和端口，是一个通讯链的句柄，应用程序一般经过“套接字”向网络发出请求或者应答网络请求。socket起源于Unix，而Unix/Linux基本哲学之一就是“一切皆文件”，对于文件用打开、读写、关闭模式来操做，socket就是该模式在网络上的一个实现，即socket是一种特殊的文件。两个程序经过“网络”交互数据就使用socket，它只负责两件事：创建链接，传递数据；同时socket在收发数据时遵循的原则：有发就有收，收发必相等！
　　文件读写和socket收发数据的区别：
　　- file模块是针对某个指定文件进行打开、读写、关闭
　　- socket模块是针对服务器端和客户端socket进行打开(链接)、读写(收发)、关闭(断开)
　　数据结构

2.1 Socket类型

socket类型在Liunx和Python中是同样的, 只是Python中的类型都定义在socket模块中, 调用方式socket.SOCK_XXXX。socket

一、流式socket(SOCK_STREAM)用于TCP通讯ide

流式套接字提供可靠的、面向链接的通讯流；它使用TCP协议，从而保证了数据传输的正确性和顺序性。函数

二、数据报socket(SOCK_DGRAM)用于UDP通讯

数据报套接字定义了一种无链接的服务；它使用数据报协议UDP，数据经过相互独立的报文进行传输，是无序的，而且不保证是可靠、无差错的传输。

三、原始socket(SOCK_RAW)用于新的网络协议实现的测试等

原始套接字，普通的套接字没法处理ICMP、IGMP等网络报文，而SOCK_RAW能够, 其次，SOCK_RAW也能够处理特殊的IPv4报文；此外，利用原始套接字，用户能够经过IP_HDRINCL套接字选项构造IP头。

3 Socket编程

TCP/UDP Socket是一种基于Client-Server的编程模型，服务端监听客户端的链接请求，一旦创建链接便可以进行数据传输。那么对TCP/UDP Socket编程的介绍也分为客户端和服务端：

3.1 TCP Socket通讯

     以下图所示，TCP通讯的基本步骤以下：
     服务端：socket---bind---listen---while(True){---accept----recv---send---}---close
     客户端：socket----------------------------------connect---send---recv-------close

一、socket函数
使用给定的地址族、套接字类型、协议编号（默认为0）来建立套接字。

1 socket.socket([family[, type[, proto]]])
2 family : AF_INET (默认ipv4), AF_INET6(ipv6) or AF_UNIX(Unix系统进程间通讯).
3 type : SOCK_STREAM (TCP), SOCK_DGRAM(UDP) .
4 protocol : 通常为0或者默认
5  
6 若是socket建立失败会抛出一个socket.error异常</code>

View Code

二、服务器端函数

(1)bind函数
将套接字绑定到地址, python下以元组（host,port）的形式表示地址。

1 #python
2 s.bind(address)
3 s为socket.socket()返回的套接字对象
4 address为元组（host,port）
5 host: ip地址, 为一个字符串
6 post: 自定义主机号, 为整型</code>

View Code

(2)listen函数
使服务器的这个端口和IP处于监听状态，等待网络中某一客户机的链接请求。若是客户端有链接请求，端口就会接受这个链接。

1 #python
2 s.listen(backlog)
3 s为socket.socket()返回的套接字对象
4 backlog : 操做系统能够挂起的最大链接数量。该值至少为1，大部分应用程序设为5就能够了</code>

View Code

(3)accept函数
接受远程计算机的链接请求，创建起与客户机之间的通讯链接。服务器处于监听状态时，若是某时刻得到客户机的链接请求，此时并非当即处理这个请求，而是将这个请求放在等待队列中，当系统空闲时再处理客户机的链接请求。

1 #python
2 s.accept()
3 s为socket.socket()返回的套接字对象
4 返回（conn,address）,其中conn是新的套接字对象，能够用来接收和发送数据。address是链接客户端的地址</code>

View Code

3 客户端函数

connect函数
用来请求链接远程服务器

1 #python
2 s.connect(address)
3 s为socket.socket()返回的套接字对象
4 address : 格式为元组（hostname,port），若是链接出错，返回socket.error错误</code>

View Code

4 通用函数

(1)recv函数

接收远端主机传来的数据

1 #python
2 s.recv(bufsize[,flag])
3 s为socket.socket()返回的套接字对象
4 bufsize : 指定要接收的数据大小
5 flag : 提供有关消息的其余信息，一般能够忽略
6 返回值为数据以字符串形式</code>

View Code

(2)send函数
发送数据给指定的远端主机

1 #python
2 s.send(string[,flag])
3 s为socket.socket()返回的套接字对象
4 string : 要发送的字符串数据
5 flag : 提供有关消息的其余信息，一般能够忽略
6 返回值是要发送的字节数量，该数量可能小于string的字节大小。
7 s.sendall(string[,flag])
8 #完整发送TCP数据。将string中的数据发送到链接的套接字，但在返回以前会尝试发送全部数据。
9 返回值 : 成功返回None，失败则抛出异常。</code>

View Code

(3)close函数

关闭套接字

1 #python
2 s.close()
3 s为socket.socket()返回的套接字对象</code>

View Code

5 带异常处理的客户端服务端TCP链接

在进行网络编程时, 最好使用大量的错误处理, 可以尽可能的发现错误, 也可以使代码显得更加严谨。

服务器端代码

 1 <code>#服务器端
 2 #!/usr/bin/env python
 3 # -*- coding:utf-8 -*-
 4  
 5 import sys
 6 import socket   #socket模块
 7  
 8 BUF_SIZE = 1024  #设置缓冲区大小
 9 server_addr = ('127.0.0.1', 8888)  #IP和端口构成表示地址
10 try :
11   server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  #生成一个新的socket对象
12 except socket.error, msg :
13     print "Creating Socket Failure. Error Code : " + str(msg[0]) + " Message : " + msg[1]
14     sys.exit()
15 print "Socket Created!"
16 server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)  #设置地址复用
17 try :
18     server.bind(server_addr)  #绑定地址
19 except socket.error, msg :
20   print "Binding Failure. Error Code : " + str(msg[0]) + " Message : " + msg[1]
21   sys.exit()
22 print "Socket Bind!"
23 server.listen(5)  #监听, 最大监听数为5
24 print "Socket listening"
25 while True:
26     client, client_addr = server.accept()  #接收TCP链接, 并返回新的套接字和地址, 阻塞函数
27     print 'Connected by', client_addr
28     while True :
29         data = client.recv(BUF_SIZE)  #从客户端接收数据
30         print data
31         client.sendall(data)  #发送数据到客户端
32 server.close()</code>

View Code

客户端代码

 1 <code>#客户端
 2 #!/usr/bin/env python
 3 # -*- coding:utf-8 -*-
 4  
 5 import sys
 6 import socket
 7  
 8 BUF_SIZE = 1024  #设置缓冲区的大小
 9 server_addr = ('127.0.0.1', 8888)  #IP和端口构成表示地址
10 try :
11     client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  #返回新的socket对象
12 except socket.error, msg :
13     print "Creating Socket Failure. Error Code : " + str(msg[0]) + " Message : " + msg[1]
14     sys.exit()
15 client.connect(server_addr)  #要链接的服务器地址
16 while True:
17     data = raw_input("Please input some string > ") 
18     if not data :
19         print "input can't empty, Please input again.."
20         continue
21     client.sendall(data)  #发送数据到服务器
22     data = client.recv(BUF_SIZE)  #从服务器端接收数据
23     print data
24 client.close()</code>

View Code

3.2 Socket UDP通讯

UDP通讯流程图以下：

服务端：socket---bind---recvfrom---sendto---close

客户端：socket----------sendto---recvfrom---close

(1)socket函数，同上

(2)sendto函数
发送UDP数据, 将数据发送到套接字

1 #Python
2 s.sendto(string[,flag],address)
3 s为socket.socket()返回的套接字对象
4 address : 指定远程地址, 形式为（ipaddr，port）的元组
5 flag : 提供有关消息的其余信息，一般能够忽略
6 返回值 : 发送的字节数。</code>

View Code

(3)recvfrom函数
接受UDP套接字的数据, 与recv()相似

1 #Python
2 s.recvfrom(bufsize[.flag])
3 返回值 : （data,address）元组, 其中data是包含接收数据的字符串，address是发送数据的套接字地址
4 bufsize : 指定要接收的数据大小
5 flag : 提供有关消息的其余信息，一般能够忽略</code>

View Code

(4)close函数，同上

(5)简单的客户端服务器UDP链接

服务器端代码

 1 <code>#服务器端
 2 #!/usr/bin/env python
 3 # -*- coding:utf-8 -*-
 4  
 5 import socket
 6  
 7 BUF_SIZE = 1024  #设置缓冲区大小
 8 server_addr = ('127.0.0.1', 8888)  #IP和端口构成表示地址
 9 server = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)  #生成新的套接字对象
10 server.bind(server_addr)  #套接字绑定IP和端口
11 while True :
12     print "waitting for data"
13     data, client_addr = server.recvfrom(BUF_SIZE)  #从客户端接收数据
14     print 'Connected by', client_addr, ' Receive Data : ', data
15     server.sendto(data, client_addr)  #发送数据给客户端
16 server.close()</code>

View Code

客户端代码

 1 <code>#客户端
 2 #!/usr/bin/env python
 3 # -*- coding:utf-8 -*-
 4  
 5 import socket
 6 import struct
 7  
 8 BUF_SIZE = 1024  #设置缓冲区
 9 server_addr = ('127.0.0.1', 8888)  #IP和端口构成表示地址
10 client = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)  #生成新的套接字对象
11  
12 while True :
13     data = raw_input('Please Input data > ')
14     client.sendto(data, server_addr)  #向服务器发送数据
15     data, addr = client.recvfrom(BUF_SIZE)  #从服务器接收数据
16     print "Data : ", data
17 client.close()</code>

View Code

4 Python Socket更多功能

sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)

函数socket.socket建立一个socket对象，返回该对象的socket描述符，该socket描述符将在后面的相关函数中使用。

参数一：地址簇

　　socket.AF_INET IPv4（默认）
　　socket.AF_INET6 IPv6

　　socket.AF_UNIX 只可以用于单一的Unix系统进程间通讯。

参数二：类型

　　socket.SOCK_STREAM　　流式socket , for TCP（默认）
　　socket.SOCK_DGRAM　　数据报式socket , for UDP

　　socket.SOCK_RAW 原始套接字，普通的套接字没法处理ICMP、IGMP等网络报文，而SOCK_RAW能够；其次，SOCK_RAW也能够处理特殊的IPv4报文；此外，利用原始套接字，能够经过IP_HDRINCL套接字选项由用户构造IP头。
　　socket.SOCK_RDM 是一种可靠的UDP形式，即保证交付数据报但不保证顺序。SOCK_RAM用来提供对原始协议的低级访问，在须要执行某些特殊操做时使用，如发送ICMP报文。SOCK_RAM一般仅限于高级用户或管理员运行的程序使用。
　　socket.SOCK_SEQPACKET 可靠的连续数据包服务。

参数三：协议

　　0　默认值，与特定的地址家族相关的协议,若是是0 ，则系统就会根据地址格式和套接类别,自动选择一个合适的协议。

sk.bind(address)

　 s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下，以元组（host,port）的形式表示地址。

sk.listen(backlog)

　　开始监听传入链接。backlog指定在拒绝链接以前，能够挂起的最大链接数量。backlog等于5，表示内核已经接到了链接请求，但服务器尚未调用accept进行处理的链接个数最大为5，这个值不能无限大，由于要在内核中维护链接队列。

sk.setblocking(bool)

　　是否阻塞（默认True），若是设置False，那么accept和recv时一旦无数据，则报错。

sk.accept()

　　接受链接并返回（conn,address）,其中conn是新的套接字对象，能够用来接收和发送数据。address是链接客户端的地址。接收TCP客户的链接（阻塞式）等待链接的到来。

sk.connect(address)

　　链接到address处的套接字。通常，address的格式为元组（hostname,port）,若是链接出错，返回socket.error错误。

sk.connect_ex(address)

　　同上，只不过会有返回值，链接成功时返回 0 ，链接失败时候返回编码，例如：10061

sk.close()

　　关闭套接字

sk.recv(bufsize[,flag])

　　接受套接字的数据。数据以字符串形式返回，bufsize指定最多能够接收的数量。flag提供有关消息的其余信息，一般能够忽略。

sk.recvfrom(bufsize[.flag])

　　与recv()相似，但返回值是（data,address）。其中data是包含接收数据的字符串，address是发送数据的套接字地址。

sk.send(string[,flag])

　　将string中的数据发送到链接的套接字。返回值是要发送的字节数量，该数量可能小于string的字节大小。即：可能未将指定内容所有发送。

sk.sendall(string[,flag])

　　将string中的数据发送到链接的套接字，但在返回以前会尝试发送全部数据。成功返回None，失败则抛出异常。内部经过递归调用send，将全部内容发送出去。

sk.sendto(string[,flag],address)

　　将数据发送到套接字，address是形式为（ipaddr，port）的元组，指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。

sk.settimeout(timeout)

　　设置套接字操做的超时期，timeout是一个浮点数，单位是秒。值为None表示没有超时期。通常，超时期应该在刚建立套接字时设置，由于它们可能用于链接的操做（如client链接最多等待5s）

sk.getpeername()

　　返回链接套接字的远程地址。返回值一般是元组（ipaddr,port）。

sk.getsockname()

　　返回套接字本身的地址。一般是一个元组(ipaddr,port)

sk.fileno()

　　套接字的文件描述符

sk.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)

容许后续使用bind()来绑定指定端口并进行监听，即便这个端口最近被其余程序监听。没有这个设置的话，服务不能运行，直到一两分钟后，这个端口再也不被以前的程序使用。

参考资料：

http://www.open-open.com/lib/view/open1418369887277.html

http://www.cnblogs.com/wupeiqi/articles/5040823.html

http://www.cnblogs.com/hazir/p/python_socket_programming.html