python week08 并发编程之多进程--理论部分

一 什么是进程

  进程:正在进行的一个过程或者说一个任务。
       而负责执行任务则是cpu。python

  

  举例(单核+多道,实现多个进程的并发执行):
    Jame在一个时间段内有不少任务要作:python学习任务,公司项目上线的任务,王者荣耀升最强王者任务...  

              但Jame同一时刻只能作一个任务(cpu同一时间只能干一个活),如何才能玩出多个任务并发执行的效果?

             Jame代码上线后,去写一会Python,再去打一会王者荣耀....这就保证了每一个任务都在进行中....linux


二 进程与程序的区别

  程序仅仅只是一堆代码而已,而进程指的是程序的运行过程nginx

  

  举例:

      想象一位有一手好厨艺的计算机科学家jame正在为他的女儿元昊烘制生日蛋糕。
   他有作生日蛋糕的食谱,厨房里有所需的原料:面粉、鸡蛋、韭菜,蒜泥等。

    在这个比喻中:

        作蛋糕的食谱就是程序(即用适当形式描述的算法)

        计算机科学家就是处理器(cpu)

        而作蛋糕的各类原料就是输入数据。

  进程就是厨师阅读食谱、取来各类原料以及烘制蛋糕等一系列动做的总和。

   如今假设计算机科学家jame的儿子alex哭着跑了进来,说:个人头头被大黄蜂蛰了个大包,痛死我了。
  web

  科学家jame想了想,处理儿子alex蛰伤的任务比给女儿元昊作蛋糕的任务更重要,因而计算机科学家就记录下他照着食谱作到哪儿了(保存进程的当前状态),而后拿出一本急救手册,按照其中的指示处理  蛰伤。
    算法

  这里,咱们看处处理机从一个进程(作蛋糕)切换到另外一个高优先级的进程(实施医疗救治),每一个进程拥有各自的程序(食谱和急救手册)。当蜜蜂蛰伤处理完以后,这位计算机科学家又回来作蛋糕,从他离开  时的那一步继续作下去。shell

  须要强调的是:同一个程序执行两次,那也是两个进程,好比打开暴风影音,虽然都是同一个软件,可是一个能够播放python3教学视频,一个能够Linux架构师课程视频。编程

  

 

 


三 并发与并行

  不管是并行仍是并发,在用户看来都是 “同时” 运行的,不论是进程仍是线程,都只是一个任务而已,真是干活的是cpu,cpu来作这些任务,而一个cpu同一时刻只能执行一个任务!windows

 

  1.并发:是伪并行,即看起来是同时运行。单个cpu+多道技术就能够实现并发,(并行也属于并发)多线程

    

假如把你本身看成cpu,你今天有3个任务分别是洗衣服,买菜烧饭,带孩子。

因此你就被这三个任务共享了,可是你只有一我的,并不能同一时间作3种事情,想要实现并发的效果?
首先你应该准备准备好洗衣机,须要洗的衣服,洗衣液,将衣服放在洗衣机中后,你带孩子上街,带到街上后你开始买菜,买菜回来后,让孩子去玩玩具后你开始烧饭。
单cpu,多进程,并发举例1:
假如把你本身看成cpu,你分别交了三个女友分别是林志玲,张慧敏,邱淑贞。
            
首先你跟林志玲去看了电影,看了一会说肚子疼,而后跟张慧敏去听演唱会,听了一会说我去下洗手间,结果在洗手间跟邱淑贞来了个颠鸾倒凤....
单cpu ,多进程,并发举例2:

 

  2.并行:同时运行,只有具有多个cpu才能实现并行

           单核下,能够利用多道技术,多个核,每一个核也均可以利用多道技术(多道技术是针对单核而言的),

           有四个核,六个任务,这样同一时间有四个任务被执行,假设分别被分配给了cpu1,cpu2,cpu3,cpu4,

          一旦任务1遇到I/O就被迫中断执行,此时任务5就拿到cpu1的时间片去执行,这就是单核下的多道技术

           而一旦任务1的I/O结束了,操做系统会从新调用它(需知进程的调度、分配给哪一个cpu运行,由操做系统说了算),可能被分配给四个cpu中的任意一个去执行。架构

  

 

 

  全部现代计算机常常会在同一时间作不少件事,一个用户的PC(不管是单cpu仍是多cpu),均可以同时运行多个任务(一个任务能够理解为一个进程)。

    启动一个进程来杀毒(360软件)

      启动一个进程来看电影(暴风影音)

    启动一个进程来聊天(腾讯QQ)

  全部的这些进程都需被管理,因而一个支持多进程的多道程序系统是相当重要的

  多道技术概念回顾:内存中同时存入多道(多个)程序,cpu从一个进程快速切换到另一个,使每一个进程各自运行几十或几百毫秒,这样,虽然在某一个瞬间,一个cpu只能执行一个任务,但在1秒内,cpu却能够运行多个进程,这就给人产生了并行的错觉,即伪并发,以此来区分多处理器操做系统的真正硬件并行(多个cpu共享同一个物理内存)。


四 同步\异步and阻塞\非阻塞(重点)

   1.同步:
      #所谓同步,就是在发出一个功能调用时,在没有获得结果以前,该调用就不会返回。按照这个定义,其实绝大多数函数都是同步调用。
      可是通常而言,咱们在说同步、异步的时候,特指那些须要其余部件协做或者须要必定时间完成的任务。

      #举例:
        #1. multiprocessing.Pool下的apply #发起同步调用后,就在原地等着任务结束,根本不考虑任务是在计算仍是在io阻塞,总之就是一股脑地等任务结束
         #2. concurrent.futures.ProcessPoolExecutor().submit(func,).result()
      #3. concurrent.futures.ThreadPoolExecutor().submit(func,).result()



  2.异步:

      #异步的概念和同步相对。当一个异步功能调用发出后,调用者不能马上获得结果。
      当该异步功能完成后,经过状态、通知或回调来通知调用者。
      若是异步功能用状态来通知,那么调用者就须要每隔必定时间检查一次,效率就很低。
      (有些初学多线程编程的人,总喜欢用一个循环去检查某个变量的值,这实际上是一 种很严重的错误)。
      若是是使用通知的方式,效率则很高,由于异步功能几乎不须要作额外的操做。至于回调函数,其实和通知没太多区别。

      #举例:
        #1. multiprocessing.Pool().apply_async() #发起异步调用后,并不会等待任务结束才返回,相反,会当即获取一个临时结果(并非最终的结果,多是封装好的一个对象)。
        #2. concurrent.futures.ProcessPoolExecutor(3).submit(func,)
        #3. concurrent.futures.ThreadPoolExecutor(3).submit(func,)



  3.阻塞
      #阻塞调用是指调用结果返回以前,当前线程会被挂起(如遇到io操做)。函数只有在获得结果以后才会将阻塞的线程激活。
      有人也许会把阻塞调用和同步调用等同起来,实际上他是不一样的。对于同步调用来讲,不少时候当前线程仍是激活的,只是从逻辑上当前函数没有返回而已。

      #举例:
        #1.同步调用:apply一个累计1亿次的任务,该调用会一直等待,直到任务返回结果为止,但并未阻塞住
        (即使是被抢走cpu的执行权限,那也是处于就绪态);
        #2. 阻塞调用:当socket工做在阻塞模式的时候,若是没有数据的状况下调用recv函数,则当前线程就会被挂起,直到有数据为止。



  4.非阻塞
    #非阻塞和阻塞的概念相对应,指在不能马上获得结果以前也会马上返回,同时该函数不会阻塞当前线程


    
   *小结:

    #1.  同步与异步针对的是函数/任务的调用方式:同步就是当一个进程发起一个函数(任务)调用的时候,一直等到函数(任务)完成,而进程继续处于激活状态。
    而异步状况下是当一个进程发起一个函数(任务)调用的时候,不会等函数返回,而是继续往下执行当,函数返回的时候经过状态、通知、事件等方式通知进程任务完成。

    #2. 阻塞与非阻塞针对的是进程或线程:阻塞是当请求不能知足的时候就将进程挂起,而非阻塞则不会阻塞当前进程。


五 进程的建立(了解)

  1.为什么须要建立进程?

     但凡是硬件,都须要有操做系统去管理,只要有操做系统,就有进程的概念,就须要有建立进程的方式,一些操做系统只为一个应用程序设计,好比微波炉中的控制器,一旦启动微波炉,全部的进程    都已经存在。

 

  2.建立进程的4种形式?
    而对于通用系统(跑不少应用程序),须要有系统运行过程当中建立或撤销进程的能力,主要分为4中形式建立新的进程:

       1).系统初始化
          查看进程linux中用ps命令,windows中用任务管理器,前台进程负责与用户交互,后台运行的进程与用户无关,运行在后台而且只在须要时才唤醒的进程,称为守护进程,如电子邮件、web页面、新闻、打印。

    2). 一个进程在运行过程当中开启了子进程(如nginx开启多进程,os.fork,subprocess.Popen等)

    3). 用户的交互式请求,而建立一个新进程(如用户双击暴风影音)

    4). 一个批处理做业的初始化(只在大型机的批处理系统中应用)

  

    不管哪种,新进程的建立都是由一个已经存在的进程执行了一个用于建立进程的系统调用而建立的

    1.在UNIX中该系统调用是:fork,fork会建立一个与父进程如出一辙的副本,两者有相同的存储映像、一样的环境字符串和一样的打开文件

    (在shell解释器进程中,执行一个命令就会建立一个子进程)

    2. 在windows中该系统调用是:CreateProcess,CreateProcess既处理进程的建立,也负责把正确的程序装入新进程

 

  3.关于建立的子进程,UNIX和windows的区别?

  1.相同的是:进程建立后,父进程和子进程有各自不一样的地址空间(多道技术要求物理层面实现进程之间内存的隔离),任何一个进程的在其地址空间中的修改都不会影响到另一个进程。

  2.不一样的是:在UNIX中,子进程的初始地址空间是父进程的一个副本,提示:子进程和父进程是能够有只读的共享内存区的。可是对于windows系统来讲,从一开始父进程与子进程的地址空间就是不一样   的。


六 进程的终止(了解)

  1. 正常退出(自愿,如用户点击交互式页面的叉号,或程序执行完毕调用发起系统调用正常退出,在linux中用exit,在windows中用ExitProcess)

  2. 出错退出(自愿,python a.py中a.py不存在)

  3. 严重错误(非自愿,执行非法指令,如引用不存在的内存,1/0等,能够捕捉异常,try...except...)

  4. 被其余进程杀死(非自愿,如kill -9)

  5.断电关机等(非自愿)

 


七 进程的层次结构

  不管UNIX仍是windows,进程只有一个父进程,不一样的是:

  1. 在UNIX中全部的进程,都是以init进程为根,组成树形结构。父子进程共同组成一个进程组,这样,当从键盘发出一个信号时,该信号被送给当前与键盘相关的进程组中的全部成员。

  2. 在windows中,没有进程层次的概念,全部的进程都是地位相同的,惟一相似于进程层次的暗示,是在建立进程时,父进程获得一个特别的令牌(称为句柄),该句柄能够用来控制子进程,可是父进程有权把该句柄传给其余子进程,这样就没有层次了

 


八 进程的状态

  tail -f access.log |grep '404'

  执行程序tail,开启一个子进程,执行程序grep,开启另一个子进程,两个进程之间基于管道'|'通信,将tail的结果做为grep的输入。

  进程grep在等待输入(即I/O)时的状态称为阻塞,此时grep命令都没法运行。

  其实在两种状况下会致使一个进程在逻辑上不能运行:

    1. 进程挂起是自身缘由,遇到I/O阻塞,便要让出CPU让其余进程去执行,这样保证CPU一直在工做。

    2. 与进程无关,是操做系统层面,可能会由于一个进程占用时间过多,或者优先级等缘由,而调用其余的进程去使用CPU。

  于是一个进程由三种状态:

  

 

 


九 进程并发的实现(了解)

  进程并发的实如今于,硬件中断一个正在运行的进程,把此时进程运行的全部状态保存下来,为此,操做系统维护一张表格,即进程表(process table),每一个进程占用一个进程表项(这些表项也称为进程控制块)

  

  该表存放了进程状态的重要信息:程序计数器、堆栈指针、内存分配情况、全部打开文件的状态、账号和调度信息,以及其余在进程由运行态转为就绪态或阻塞态时,必须保存的信息,从而保证该进程在再次启动时,就像从未被中断过同样。

相关文章
相关标签/搜索