阻塞IO(blocking IO)python
在Linux中,默认状况下全部的socket都是blocking,一个典型的读操做流程大概是这样:程序员
当用户进程调用了recvfrom这个系统调用,kernel就开始了IO的第一个阶段:准备数据。对于network io来讲,不少时候数据在一开始尚未到达(好比,尚未收到一个完整的udp包),这个时候kernel就要等待足够的数据到来web
而在用户进程这边,整个进程会被阻塞,当kernel一直等到数据准备好了,它就会将数据从kernel中拷贝到用户内存 而后kernel返回结果,用户进程才解除block的状态,从新运行起来
因此,blocking IO的特色就是在IO执行的两个阶段(等待数据和拷贝数据两个阶段)都被block了数据库
几乎全部的程序员第一次接触到的网络编程都是从listen(),send(),recv()等接口开 始的,使用这些接口能够很方便的构建服务器/客户机的模型。然而大部分的socket接口都是 阻塞型的。以下图 ps: 所谓阻塞型接口是指系统调用(通常是IO接口)不返回调用结果并让当前线程一直阻塞 只有当该系统调用得到结果或者超时出错时才返回。
实际上,除非特别指定,几乎全部的IO接口(包括socket接口)都是阻塞型的。这给网络编程带来了一个很大的问题。如在调用recv(1024)的同时,线程将被阻塞,在此期间,线程将没法执行任何运算或响应任何的网络请求。编程
一个简单的解决方案:缓存
在服务端使用多线程(或多进程)。多线程(或多进程)的目的是让每一个链接都拥有独立的线程(或进程),这样任何一个链接的阻塞都不会影响其余的链接。
该方案的问题是:tomcat
开启多进程或多线程的方式,在遇到同时响应成百上千的链接请求,则不管多线程仍是多进程都会严重占据系统资源,下降系统对外界响应效率,并且线程与进程自己也更容易进入假死状态
改进方案:服务器
不少程序员可能会考虑使用“线程池”或“链接池”。“线程池”旨在减小建立和销毁线程的频率,其维持必定合理数量的线程,并让空闲的线程从新承担新的执行任务。“链接池”维持链接的缓存池,尽可能重用已有的链接,减小建立和关闭链接的频率。这两种技术均可以很好的下降系统开销,都被普遍应用不少 大型系统,如websphere、tomcat和各类数据库等
改进后方案其实也存在着问题:网络
“线程池”和“链接池”技术也只是在必定程度上缓解了频繁调用IO接口带来的资源占用。并且“池”始终尤为上限,当请求大大超过上限时,“池”构成的系统对外界的响应并不比没有池 的时候效果好多少。 因此使用“池”必须考虑其面临的响应规模,并根据规模调整“池”的大小
对应上例中的所面临的可能同时出现的上千甚至上万次的客户端请求,“线程池”或“链接池”或许能够缓解部分压力,可是不能解决全部问题。总之,多线程模型能够方便高效的解决小规模的服务请求,但面对大规模的服务请求,多线程模型也会遇到瓶颈,能够用非阻塞接口来尝试解决这个问题。多线程
练习:
服务端:
from socket import * from threading import Thread def communicate(conn): while True: try: data = conn.recv(1024) if not data: break conn.send(data.upper()) except ConnectionResetError: break conn.close() server = socket(AF_INET, SOCK_STREAM) server.bind(('127.0.0.1', 8080)) server.listen(5) while True: print('starting...') conn,addr = server.accept() print(addr) t = Thread(target=communicate, args=(conn,)) t.start() server.close()
客户端:
from socket import * client = socket(AF_INET, SOCK_STREAM) client.connect(('127.0.0.1', 8080)) while True: msg = input("请输入数据:").strip() if not msg: continue client.send(msg.encode('utf-8')) data = client.recv(1024) print(data.decode('utf-8')) client.close()