Python网络编程之socket应用

1 引言

         本篇主要对Python下网络编程中用到的socket模块进行初步总结。首先从网络基础理论出发,介绍了TCP协议和UDP协议;而后总结了socket中的经常使用函数;最后经过实际代码展现基本函数的应用。html

2 网络基础

  要想理解socket,首先得熟悉一下TCP/IP协议族。TCP/IP(Transmission Control Protocol/Internet Protocol)即传输控制协议/网间协议,定义了主机如何连入因特网及数据如何在它们之间传输的标准,从字面意思来看TCP/IP是TCP和IP协议的合称,但实际上TCP/IP协议是指因特网整个TCP/IP协议族。下面对TCP/IP协议族中与socket紧密相关的的TCP协议和UDP协议进行介绍。编程

  TCP是流协议,而UDP是数据报协议。换句话说,TCP在客户机和服务器之间创建持续的开放链接,在该链接的生命期内,字节能够经过该链接写出(而且保证顺序正确)。然而,经过 TCP 写出的字节没有内置的结构,因此须要高层协议在被传输的字节流内部分隔数据记录和字段。数组

  UDP是数据报协议,不须要在客户机和服务器之间创建链接,它只是在地址之间传输报文。UDP的一个很好特性在于它的包是自分隔的(self-delimiting),也就是一个数据报都准确地指出它的开始和结束位置。然而,UDP的一个可能的缺点在于,它不保证包将会按顺序到达,甚至根本就不保证。不过,UDP有一个很大的有点就是效率高。服务器

  TCP与UDP直接的对比就好似手机通讯和邮寄信件通讯。TCP犹如手机通讯机制,当呼叫者经过手机拨打接受者手机,只有接受者按下接听键,两方才算创建起了链接,且只要没人挂断,链接就一直是存活的,也只有在链接存活状况下二者才能通话。UDP就若有邮局系统,只有有人来寄信,邮局就回帮他寄,可是不会去管收件人是否存在、也无论收件人何时能收到信,若是寄件人陆续寄出多封信,收件人收的的信前后顺序是混乱的,若是有的信没有送达,那这封信就此消失在历史的尘埃中。网络

  一般,人们用socket来创建计算机网络中多个主机(或进程)TCP/IP间的链接。数据结构

3 socket介绍

         Socket(中文译为套接字)是操做系统内核中的一个数据结构,它几乎是全部网络通讯的基础。网络通讯,归根到底仍是进程间的通讯(不一样计算机上的进程间通讯, 又称为网络通讯, IP协议进行的主要是端到端通讯)。在网络中,每个节点(计算机或路由)都有一个网络地址,也就是IP地址。两个进程通讯时,首先要肯定各自所在的网络节点的网络地址。可是,网络地址只能肯定进程所在的计算机,而一台计算机上极可能同时运行着多个进程,因此仅凭网络地址还不能肯定究竟是和网络中的哪个进程进行通讯,所以套接字中还须要包括其余的信息,也就是端口号(PORT)。在一台计算机中,一个端口号一次只能分配给一个进程,也就是说,在一台计算机中,端口号和进程之间是一 一对应的关系。socket

     socket使用(IP地址,协议,端口号)来标识一个进程。因此,使用端口号和网络地址的组合能够惟一的肯定整个网络中的一个网络进程。端口号的范围从0~65535,一类是由互联网指派名字和号码公司ICANN负责分配给一些经常使用的应用程序固定使用的“周知的端口”,其值通常为0~1023, 用户自定义端口号通常大于等于1024。函数

网络上的两个程序经过一个双向的通讯链接实现数据的交换,这个链接的一端称为一个socket。每个socket都用一个半相关描述{协议、本地地址、本地端口}来表示;一个完整的套接字则用一个相关描述{协议、本地地址、本地端口、远程地址、远程端口}来表示。socket也有一个相似于打开文件的函数调用,该函数返回一个整型的socket描述符,随后的链接创建、数据传输等操做都是经过socket描述符来实现的。以TCP协议中socket创建链接的“三次握手”为例,其过程以下:post

 

  如图所示,当客户端经过socket调用connect时,触发了链接请求,向服务器发送了SYN J包,这时connect进入阻塞状态;服务器监听到链接请求,即收到SYN J包,调用socket的accept函数接收请求向客户端发送SYN K ,ACK J+1,这时accept进入阻塞状态;客户端收到服务器的SYN K ,ACK J+1以后,这时connect返回,并对SYN K进行确认;服务器收到ACK K+1时,accept返回,至此三次握手完毕,链接创建。spa

      两个socket经过“网络”交互数据进行数据交互时只负责两件事:创建链接,传递数据;同时socket在收发数据时遵循的原则:有发就有收,收发必相等!

4 socket基本使用

1)socket函数

  功能:使用给定的地址族、套接字类型、协议编号(默认为0)来建立套接字。

  格式:socket.socket([family[, type[, proto]]])

  参数:

    family : AF_INET (默认ipv4),AF_INET6(ipv6) , AF_UNIX(Unix系统进程间通讯).

    type : SOCK_STREAM (TCP), SOCK_DGRAM(UDP) .

    protocol : 通常为0或者默认

  备注:若是socket建立失败会抛出一个socket.error异常

2)服务器端函数

   a)bind函数

  格式:s.bind(address)

  功能:将地址address绑定到套接字, 地址以元组(host,port)的形式表示。

  参数:

    address为元组(host,port)

    host: ip地址, 为一个字符串

    post: 自定义主机号, 为整型

b)listen函数

  格式:s.listen(backlog)

  功能:使服务器的这个端口和IP处于监听状态,等待网络中某一客户机的链接请求。若是客户端有链接请求,端口就会接受这个链接。

  参数:backlog : 操做系统能够挂起的最大链接数量。该值至少为1,大部分应用程序设为5就能够了

c)accept函数

  格式:s.accept()

  功能:接受远程计算机的链接请求,创建起与客户机之间的通讯链接。服务器处于监听状态时,若是某时刻得到客户机的链接请求,此时并非当即处理这个请求,而是将这个请求放在等待队列中,当系统空闲时再处理客户机的链接请求。

  返回值:返回一个数组(conn,address),其中conn是新的套接字对象,能够用来接收和发送数据。address是链接客户端的地址

3)客户端函数

  a)connect函数

  格式:s.connect(address)

  功能:用来请求链接远程服务器

  参数:address为远程服务器地址, 格式为元组(hostname,port),若是链接出错,返回socket.error错误

  b)connect_ex函数

  格式:s.connect_ex(address)

  备注:connect()函数的扩展版本,出错时返回出错码,而不是抛出异常

4)通用函数

  a)recv函数

  格式:s.recv(bufsize[,flag])

  功能:接收远端主机传来的数据

  参数:

    bufsize : 指定要接收的数据大小

    flag : 提供有关消息的其余信息,一般能够忽略

  返回值:返回值为数据以字符串形式</code>

  b)send函数

  格式:s.send(string[,flag])

  功能:发送数据给指定的远端主机

  参数:

    string : 要发送的字符串数据

    flag : 提供有关消息的其余信息,一般能够忽略

  返回值:返回值是要发送的字节数量,该数量可能小于string的字节大小。

c)sendall函数

  格式:s.sendall(string[,flag])

  功能:内部调用了send函数,完整发送TCP数据。将string中的数据发送到链接的套接字,但在返回以前会尝试发送全部数据。

  参数:同send函数

  返回值 : 成功返回None,失败则抛出异常。

d)close函数

  格式:s.close()

  功能:关闭套接字

e)recvfrom函数

  格式:s.recvfrom(bufsize[.flag])

  功能:与recv()相似,区别是返回值不一样

  返回值:返回一个数组(data,address),其中data是包含接收数据的字符串,address是发送数据的套接字地址。

f)sendto函数

  格式:s.sendto(string[,flag],address)

  功能:将数据发送到套接字

  参数:

    string : 要发送的字符串数据

    flag : 提供有关消息的其余信息,一般能够忽略

    address是形式为(ipaddr,port)的元组,指定远程地址

  返回值:返回值是要发送的字节数量

  备注:该函数主要用于UDP协议。

g)settimeout函数

  格式:s.settimeout(timeout)

  功能:设置套接字操做的超时期

  参数:timeout是一个浮点数,单位是秒。值为None表示没有超时期。通常,超时期应该在刚建立套接字时设置,由于它们可能用于链接的操做(如 client 链接最多等待5s )

h)getpeername函数

  格式:s.getpeername()

  功能:获取链接套接字的远程地址

  返回值:返回值一般是元组(ipaddr,port)。

i)getsockname函数

  格式:s.getsockname()

  功能:获取套接字本身的地址

  返回值:一般是一个元组(ipaddr,port)

  socket中经常使用的函数就上面这些了。先用上面这些函数尝试TCP协议下的socket通讯。

  服务器端代码以下:

import socket sk = socket.socket() sk.bind(('127.0.0.1' ,8088)) sk.listen(5) print('正在等待客户端链接……') conn , addr = sk.accept() print('客户端已链接到服务器……') mes_from_client = conn.recv(1024).decode('utf-8') print(mes_from_client) mes_to_server = '你好,客户端,已收到你的信息!'.encode('utf-8')#发送的数据必须是byte类型
 conn.send(mes_to_server) conn.close() sk.close()

  客户端代码:

import socket sk = socket.socket() sk.connect(('127.0.0.1',8088)) mes_to_server = '你好,服务器!'.encode('utf-8')#发送的数据必须是byte类型
 sk.send(mes_to_server) mes_from_server = sk.recv(1024).decode('utf-8') print(mes_from_server) sk.close()

  注意:上述两代码块必须放在两不一样的py文件中,且必须先运行服务器代码,而后在开启客户端。开启服务器后,首先输出“正在等待客户端链接……”,而后进程会阻塞在accept函数中,下面的代码不会被执行,知道有客户端链接过来。开启客户端后,服务器端会先收到客户端发来的信息,而后客户端也会受到服务器发来的信息。

  上面的例子中,服务器和客户端都是收发了一条信息后socket关闭,若是要保持链接进行长时间通讯呢?那么,咱们能够把收发函数放入一个“while True”循环中:

  服务器端代码:

import socket BUF_SIZE = 1024  #设置缓冲区大小
 server_addr = ('127.0.0.1', 8089)  #IP和端口构成表示地址
 server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  #生成一个新的socket对象
 server.bind(server_addr) #绑定地址

print("socket与地址绑定完成……") server.listen(5)  #监听, 最大监听数为5

print("socket监听开始……") client, client_addr = server.accept()  #接收TCP链接, 并返回新的套接字和地址, 阻塞函数

print("报告:有客户端请求链接,正在链接……") print('客户端地址为:{}'.format( client_addr)) while True : mes_from_client = client.recv(BUF_SIZE)  #从客户端接收数据
 mes = mes_from_client.decode('utf-8') print('客户端说:{}'.format(mes)) mes = input('回复客户端的信息>') mes_to_client = mes.encode('utf-8') client.sendall(mes_to_client) #发送数据到客户端
 server.close()

  客户端代码:

import socket BUF_SIZE = 1024  #设置缓冲区的大小
 server_addr = ('127.0.0.1', 8089)  #IP和端口构成的服务器地址
 client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  #返回新的socket对象 client.connect(server_addr) #链接服务器

while True: mes = input("发送给服务器的信息> ") mes_to_server = mes.encode('utf-8') client.sendall(mes_to_server) #发送数据到服务器
 mes_from_server = client.recv(BUF_SIZE)  #从服务器端接收数据
 mes = mes_from_server.decode('utf-8') print(mes) client.close()

  运行上述代码后,客户端和服务器能够长时间维持通讯。不过,使用socket时必定要注意,有发才有收,收发必相等,不然,就回出现异常。若是须要求换其余客户端与当前服务器进行通讯,必须先断开当前客户端的链接。

  再来尝试UDP协议下socket通讯:

  服务器端代码:

import socket sk = socket.socket(type=socket.SOCK_DGRAM) sk.bind(('127.0.0.1' , 8090)) print('等待客户端发来消息……') msg , addr = sk.recvfrom(1024) # 此处会阻塞

print(msg.decode('utf-8')) mes_to_server = '你好,客户端,已收到你的信息!'.encode('utf-8')#发送的数据必须是byte类型
 sk.sendto(mes_to_server,addr) sk.close()

  客户端代码:

import socket sk = socket.socket(type=socket.SOCK_DGRAM) ip_port = ('127.0.0.1' , 8090) mes_to_server = '你好,服务器!'.encode('utf-8')#发送的数据必须是byte类型
 sk.sendto(mes_to_server , ip_port) ret , addr = sk.recvfrom(1024) print(ret.decode('utf-8')) sk.close()

  若是须要不停收发消息,代码更改以下:

  服务器端代码:

import socket sk = socket.socket(type=socket.SOCK_DGRAM) sk.bind(('127.0.0.1' , 8090)) print('等待客户端发来消息……') while True: msg , addr = sk.recvfrom(1024) # 此处会阻塞

    print('收到{}发来的信息,内容是:{}'.format(addr , msg.decode('utf-8'))) mes_to_server = input('>>>').encode('utf-8')#发送的数据必须是byte类型
 sk.sendto(mes_to_server,addr) sk.close()

  客户端代码:

import socket sk = socket.socket(type=socket.SOCK_DGRAM) ip_port = ('127.0.0.1' , 8090) while True: mes_to_server = input('>>>').encode('utf-8')#发送的数据必须是byte类型
 sk.sendto(mes_to_server , ip_port) ret , addr = sk.recvfrom(1024) print(ret.decode('utf-8')) sk.close()

  使用socket进行UDP协议下通讯时,能够多个客户端与服务器通讯,也就是说,上面客户端代码你能够另开一个进程与服务器通讯,且不须要关闭当前客户端,这是TCP协议与UDP协议下socket通讯的一个不一样之处。

5 总结

  本篇初步总结了Python网络编程中socket模块的使用,事实上只是大体总结了基本函数的用法。其中诸多内容借鉴了一下两篇博客,感谢两位博主。

  参考资料:

  https://www.cnblogs.com/maociping/p/5112019.html

  https://www.cnblogs.com/zhangyux/p/6109284.html

相关文章
相关标签/搜索