IO模型和协程

时间 2019-12-12

标签模型繁體版

原文原文链接

1、 IO模型linux

五种IO模型：程序员

blocking IO :阻塞IOweb

nonblocking IO 非阻塞IO数据库

IO multiplexing IO多路复用编程

signal driven IO 信号驱动IOwindows

asynchronous IO 异步IO缓存

对于一个network IO，它会涉及到两个系统对象，一个是调用这个IO的process(or thread),另外一个就是系统内核。当一个read/recv读数据的操做发生时，该操做会经历两个阶段：tomcat

1，等待数据准备网络

2，将数据从内核拷贝到进程中多线程

补充：

1，输入操做：read，readv，recv，recvfrom，recvmsg共5个函数，若是会阻塞状态，则会经历wait data和copy data两个阶段，若是设置为非阻塞则在wait不到data时抛出异常

2，输出操做：write，writev，send，sendto，sendmsg共5个函数，在发送缓冲区满了会阻塞在原地，若是设置为非阻塞，则会抛出异常

3，接收外来连接：accept，与输入操做相似

4，发起外出连接：connect，与操做相似

2、阻塞IO

回顾同步/异步/阻塞/非阻塞：

同步：提交一个任务以后要等待这个任务执行完毕

异步：只管提交任务，不等待这个任务执行完毕就能够去作其余的事情

阻塞：recv，recvfrom，accept，线程阶段运行状态>>>阻塞状态>>>就绪

非阻塞：没有阻塞状态

在一个线程的IO模型中，咱们recv的地方阻塞，咱们就开启多线程，可是无论你开启多少个线程，这个recv的时间是否是没有被规避掉，不论是多线程仍是多进程都没有规避掉IO这个时间

实际上，除非特别指定，几乎全部的IO接口（包括socket接口）都是阻塞的。这给网络编程带来了一个很大的问题，如在调用recv（1024）的同时，线程将被阻塞，在此期间，线程将没法执行任何运算或响应任何的网络请求

一个简单的解决方案：

在服务端使用多线程（或多进程）。多线程（或多进程）的目的是让每一个链接都拥有独立的线程（或进程），这样任何一个链接的阻塞都不会影响其余的链接。

该方案的问题是：

开启多线程或都线程的方式，在遇到要同时响应成百上千的链接请求，则不管多线程仍是多进程都会占用严重的系统资源，下降系统对外界相应效率，并且线程与进程自己也更容易进入假死状态

改进方案：

不少程序员可能会考虑使用“线程池”或“进程池”。“线程池”旨在减小建立和销毁线程的频率，其维持必定合理数量的线程，并让空闲的线程从新承担新的执行任务。“链接池”维持链接的缓存池，尽可能重用已有的链接、减小建立和关闭链接的频率。这两种技术均可以很好的下降系统开销，都被普遍应用很大型系统，如websphere、tomcat和各类数据库等

改进后方案其实也存在着问题：

“线程池”和“链接池”技术也只是在必定程度上缓解了频繁调用IO接口带来的资源占用。并且，所谓“池”始终有其上限，当请求大大超过上限时，“池”构成的系统对外界的响应并不比没有池的时候效果好多少。因此使用“池”必须其面临的响应规模，并根据规模调整“池”的大小

3、非阻塞IO

缺点：

1，循环调用recv（）将大幅推高cpu占用率，这也是咱们在代码中留一句time.sleep(2)的缘由，不然在低配主机下极容易出现卡机状况

2，任务完成的响应延迟增大了，由于每过一段时间才去轮询一次read一次，而任务可能在两次轮询之间的任意时间完成。这会致使总体数据吞吐量的下降。

import time
import socket

server = socket.socket()

ip_port = ('127.0.0.1',8001)
server.bind(ip_port)

server.listen()
server.setblocking(False)
conn_list = []

while 1:
    while 1:
        try:
            conn,addr = server.accept()
            conn_list.append(conn)
            break
        except BlockingIOError:
            time.sleep(0.1)
            print('此时尚未人连接我')

    for sock in conn_list:
        print(sock)
        while 1:
            try:
                from_client_msg = sock.recv(1024)
                print(from_client_msg.decode('utf-8'))
                sock.send(b'hello')
                break
            except BlockingIOError:
                print('尚未任何的消息啊')

非阻塞iO模型服务端

import socket
client = socket.socket()

client.connect(('127.0.0.1',8001))
while 1:
    to_server_msg = input('我想对你说>>>>')
    client.send(to_server_msg.encode('utf-8'))
    from_server_msg = client.recv(1024)
    print(from_server_msg.decode('utf-8'))

非阻塞IO模型客户端

4、多路复用IO

结论：select的优点在于能够处理多个链接，不适用于单个链接

IO多路复用的机制：

Select：windows 、linux

Poll机制：linux和select监听机制同样，可是对监听列表里面的数量没有限制，select默认限制是1024个，可是他们两个都是操做系统轮询每个被监听的文件描述符（若是数量很大，其实效率不太好），卡是否有可读操做

Epoll:linux它的监听机制和上面两个不一样，他给每个监听的对象绑定了一个回调函数，你这个对象有消息，那么触发回调函数给用户，用户就进行系统调用来拷贝数据，并非轮询监听全部的被监听对象，这样的效率高不少。

import select
import socket

server = socket.socket()
server.bind(('127.0.0.1',8001))
rlist = [server,]
server.listen()
while 1:
    print('11111')
    rl,wl,el = select.select(rlist,[],[])#建立rl对象，监听
    print(222222)
    print('server对象>>>',server)
    print(rl)   #rl对象其实跟server对象（内容）一致
    for sock in rl: #当rl有值的时候，循环列表
        if sock == server: #值与server相同
            conn,addr = sock.accept() #创建链接
            rlist.append(conn) #把管道信息加入列表
        else:
            from_client_msg = sock.recv(1024)#conn
            print(from_client_msg.decode('utf-8')) #打印接收

IO多路复用服务端

import socket

client = socket.socket()
client.connect(('127.0.0.1',8001))

to_server_msg = input('发给服务端的消息:')
client.send(to_server_msg.encode('utf-8'))
# from_server_msg = client.recv(1024)
# print(from_server_msg.decode('utf-8'))

io多路复用客户端

5、异步IO

from gevent import monkey;monkey.patch_all()
import time
import gevent

def func1(n):
    print('xxxxxx',n)
    # gevent.sleep(2)
    time.sleep(2)
    print('cccccc',n)

def func2(m):
    print('111111',m)
    # gevent.sleep(2)
    time.sleep(2)
    print('222222',m)

start_time = time.time()
g1 = gevent.spawn(func1,'alex')
g2 = gevent.spawn(func2,'德玛西亚')
# g1.join() #
# g2.join()
gevent.joinall([g1,g2])
end_time = time.time()
print(end_time - start_time)

print('代码结束')

1. 协程和 io模型
2. 协程和IO模型
3. 线程，协程，IO模型
4. Http协议和IO模型
5. Python Day38协程，IO模型
6. 线程进程池,协程,IO模型
7. 进程/线程池、协程、IO模型
8. IO概念和IO模型
9. day36 协程介绍/yield实现协程/补充/gevent模块/网络IO模型介绍/阻塞IO模型/非阻塞IO模型
10. IO类型与IO模型
更多相关文章...
• ASP.NET MVC - 模型 - ASP.NET 教程
• Rust 文件与 IO - RUST 教程
• 委托模式
• Kotlin学习（二）基本类型