1、概念 1、进程 进程是具备必定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。每一个进程都有本身的独立内存空间,不一样进程经过进程间通讯来通讯。因为进程比较重量,占据独立的内存,因此上下文进程间的切换开销(栈、寄存器、虚拟内存、文件句柄等)比较大,但相对比较稳定安全。 2、线程 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程本身基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),可是它可与同属一个进程的其余的线程共享进程所拥有的所有资源。线程间通讯主要经过共享内存,上下文切换很快,资源开销较少,但相比进程不够稳定容易丢失数据。 3、协程 协程是一种用户态的轻量级线程,协程的调度彻底由用户控制。协程拥有本身的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其余地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操做栈则基本没有内核切换的开销,能够不加锁的访问全局变量,因此上下文的切换很是快。 2、区别: 1、进程多与线程比较 线程是指进程内的一个执行单元,也是进程内的可调度实体。线程与进程的区别: 1) 地址空间:线程是进程内的一个执行单元,进程内至少有一个线程,它们共享进程的地址空间,而进程有本身独立的地址空间 2) 资源拥有:进程是资源分配和拥有的单位,同一个进程内的线程共享进程的资源 3) 线程是处理器调度的基本单位,但进程不是 4) 两者都可并发执行 5) 每一个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口,可是线程不可以独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制 2、协程多与线程进行比较 1) 一个线程能够多个协程,一个进程也能够单独拥有多个协程,这样python中则能使用多核CPU。 2) 线程进程都是同步机制,而协程则是异步 3) 协程能保留上一次调用时的状态,每次过程重入时,就至关于进入上一次调用的状态 3、进程和线程、协程在python中的使用 1、多进程通常使用multiprocessing库,来利用多核CPU,主要是用在CPU密集型的程序上,固然生产者消费者这种也可使用。多进程的优点就是一个子进程崩溃并不会影响其余子进程和主进程的运行,但缺点就是不能一次性启动太多进程,会严重影响系统的资源调度,特别是CPU使用率和负载。使用多进程能够查看文章《python 多进程使用总结》。注:python2的进程池在类中的使用会有问题,须要把类函数定义成全局函数。具体可参考 http://bbs.chinaunix.net/thread-4111379-1-1.html 2、多线程通常是使用threading库,完成一些IO密集型并发操做。多线程的优点是切换快,资源消耗低,但一个线程挂掉则会影响到全部线程,因此不够稳定。现实中使用线程池的场景会比较多,具体可参考《python线程池实现》。 3、协程通常是使用gevent库,固然这个库用起来比较麻烦,因此使用的并非不少。相反,协程在tornado的运用就多得多了,使用协程让tornado作到单线程异步,听说还能解决C10K的问题。因此协程使用的地方最多的是在web应用上。 总结一下就是IO密集型通常使用多线程或者多进程,CPU密集型通常使用多进程,强调非阻塞异步并发的通常都是使用协程,固然有时候也是须要多进程线程池结合的,或者是其余组合方式。