图文介绍进程和线程的区别

进程和线程的概念linux

先了解一下操做系统的一些相关概念,大部分操做系统(如Windows、Linux)的任务调度是采用时间片轮转的抢占式调度方式,也就是说一个任务执行一小段时间后强制暂停去执行下一个任务,每一个任务轮流执行。任务执行的一小段时间叫作时间片,任务正在执行时的状态叫运行状态,任务执行一段时间后强制暂停去执行下一个任务,被暂停的任务就处于就绪状态等待下一个属于它的时间片的到来。这样每一个任务都能获得执行,因为CPU的执行效率很是高,时间片很是短,在各个任务之间快速地切换,给人的感受就是多个任务在“同时进行”,这也就是咱们所说的并发(并发简单来讲多个任务同时执行)。 在这里插入图片描述 进程多线程

计算机的核心是CPU,它承担了全部的计算任务;而操做系统是计算机的管理者,它负责任务的调度、资源的分配和管理,统领整个计算机硬件;应用程序侧是具备某种功能的程序,程序是运行于操做系统之上的。并发

进程是一个具备必定独立功能的程序在一个数据集上的一次动态执行的过程,是操做系统进行资源分配和调度的一个独立单位,是应用程序运行的载体。进程是一种抽象的概念,历来没有统一的标准定义。进程通常由程序、数据集合和进程控制块三部分组成。程序用于描述进程要完成的功能,是控制进程执行的指令集;数据集合是程序在执行时所须要的数据和工做区;程序控制块(Program Control Block,简称PCB),包含进程的描述信息和控制信息,是进程存在的惟一标志。性能

进程具备的特征:操作系统

动态性:进程是程序的一次执行过程,是临时的,有生命期的,是动态产生,动态消亡的;线程

并发性:任何进程均可以同其余进程一块儿并发执行;设计

独立性:进程是系统进行资源分配和调度的一个独立单位;3d

结构性:进程由程序、数据和进程控制块三部分组成。指针

进程的生命周期blog

在早期只有进程的操做系统中,进程有五种状态,建立、就绪、运行、阻塞(等待)、退出。 在这里插入图片描述 建立:进程正在建立,还不能运行。操做系统在建立进程时要进行的工做包括分配和创建进程控制块表项、创建资源表格并分配资源、加载程序并创建地址空间;

就绪:时间片已用完,此线程被强制暂停,等待下一个属于他的时间片到来;

运行:此线程正在执行,正在占用时间片;

阻塞:也叫等待状态,等待某一事件(如IO或另外一个线程)执行完;

退出:进程已结束,因此也称结束状态,释放操做系统分配的资源。

线程

在早期的操做系统中并无线程的概念,进程是能拥有资源和独立运行的最小单位,也是程序执行的最小单位。任务调度采用的是时间片轮转的抢占式调度方式,而进程是任务调度的最小单位,每一个进程有各自独立的一块内存,使得各个进程之间内存地址相互隔离。

后来,随着计算机的发展,对CPU的要求愈来愈高,进程之间的切换开销较大,已经没法知足愈来愈复杂的程序的要求了。因而就发明了线程,线程是程序执行中一个单一的顺序控制流程,是程序执行流的最小单元,是处理器调度和分派的基本单位。一个进程能够有一个或多个线程,各个线程之间共享程序的内存空间。

一个标准的线程由线程ID、当前指令指针(PC)、寄存器和堆栈组成。而进程由内存空间(代码、数据、进程空间、打开的文件)和一个或多个线程组成。

线程的生命周期

当线程的数量小于处理器的数量时,线程的并发是真正的并发,不一样的线程运行在不一样的处理器上。但当线程的数量大于处理器的数量时,线程的并发会受到一些阻碍,此时并非真正的并发,由于此时至少有一个处理器会运行多个线程。在单个处理器运行多个线程时,并发是一种模拟出来的状态。操做系统采用时间片轮转的方式轮流执行每个线程。如今,几乎全部的现代操做系统采用的都是时间片轮转的抢占式调度方式,如咱们熟悉的Unix、linux、Windows及Mac OS X等流行的操做系统。 在这里插入图片描述 建立:一个新的线程被建立,等待该线程被调用执行;

就绪:时间片已用完,此线程被强制暂停,等待下一个属于他的时间片到来;

运行:此线程正在执行,正在占用时间片;

阻塞:也叫等待状态,等待某一事件(如IO或另外一个线程)执行完;

退出:一个线程完成任务或者其余终止条件发生,该线程终止进入退出状态,退出状态释放该线程所分配的资源。

线程优先级

操做系统(如Windows、Linux、Mac OS X)的任务调度除了具备前面提到的时间片轮转的特色外,还有优先级调度(Priority Schedule)的特色。优先级调度决定了线程按照什么顺序轮流执行,在具备优先级调度的系统中,线程拥有各自的线程优先级(Thread Priority)。具备高优先级的线程会更早地执行,而低优先级的线程一般要等没有更高优先级的可执行线程时才会被执行。

线程的优先级能够由用户手动设置,此外系统也会根据不一样情形调整优先级。一般状况下,频繁地进入等待状态(进入等待状态会放弃以前仍可占用的时间份额)的线程(如IO线程),比频繁进行大量计算以致于每次都把全部时间片所有用尽的线程更受操做系统的欢迎。由于频繁进入等待的线程只会占用不多的时间,这样操做系统能够处理更多的任务。咱们把频繁等待的线程称之为IO密集型线程(IO Bound Thread),而把不多等待的线程称之为CPU密集型线程(CPU Bound Thread)。IO密集型线程老是比CPU密集型线程更容易获得优先级的提高。

线程饿死

在优先级调度下,容易出现一种线程饿死的现象。一个线程饿死是说它的优先级较低,在它执行以前老是有比它优先级更高的线程等待执行,所以这个低优先级的线程始终得不到执行。当CPU密集型的线程优先级较高时,其它低优先级的线程就极可能出现饿死的状况;当IO密集型线程优先级较高时,其它线程相对不容易形成饿死的,由于IO线程有大量的等待时间。为了不线程饿死,调度系统一般会逐步提高那些等待了好久而得不到执行的线程的优先级。这样,一个线程只要它等待了足够长的时间,其优先级总会被提高到可让它执行的程度,也就是说这种状况下线程始终会获得执行,只是时间的问题。

在优先级调度环境下,线程优先级的改变有三种方式:

1.用户指定优先级;

2.根据进入等待状态的频繁程度提高或下降优先级(由操做系统完成);

3.长时间得不到执行而被提高优先级。

多线程与多核

上面提到的时间片轮转的调度方式说一个任务执行一小段时间后强制暂停去执行下一个任务,每一个任务轮流执行。不少操做系统的书都说“同一时间点只有一个任务在执行”。其实“同一时间点只有一个任务在执行”这句话是不许确的,至少它是不全面的。咱们分析一下多核的状况。

这是个人电脑的CPU状况图: 在这里插入图片描述 在这里插入图片描述 多核(心)处理器是指在一个处理器上集成多个运算核心从而提升计算能力,也就是有多个真正并行计算的处理核心,每个处理核心对应一个内核线程。内核线程(Kernel Thread, KLT)就是直接由操做系统内核支持的线程,这种线程由内核来完成线程切换,内核经过操做调度器对线程进行调度,并负责将线程的任务映射到各个处理器上。通常一个处理核心对应一个内核线程,好比单核处理器对应一个内核线程,双核处理器对应两个内核线程,四核处理器对应四个内核线程。

如今的电脑通常是双核四线程、四核八线程,是采用超线程技术将一个物理处理核心模拟成两个逻辑处理核心,对应两个内核线程,因此在操做系统中看到的CPU数量是实际物理CPU数量的两倍。可是个人如上图是四核四线程,彷佛没有用这个超线程技术。

超线程技术就是利用特殊的硬件指令,把一个物理芯片模拟成两个逻辑处理核心,让单个处理器都能使用线程级并行计算,进而兼容多线程操做系统和软件,减小了CPU的闲置时间,提升的CPU的运行效率。这种超线程技术(如双核四线程)由处理器硬件的决定,同时也须要操做系统的支持才能在计算机中表现出来。

程序通常不会直接去使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程(Light Weight Process,LWP),轻量级进程就是咱们一般意义上所讲的线程(咱们在这称它为用户线程),因为每一个轻量级进程都由一个内核线程支持,所以只有先支持内核线程,才能有轻量级进程。用户线程与内核线程的对应关系有三种模型:一对一模型、多对一模型、多对多模型,在这以4个内核线程、3个用户线程为例对三种模型进行说明。

一对一模型

对于一对一模型来讲,一个用户线程就惟一地对应一个内核线程(反过来不必定成立,一个内核线程不必定有对应的用户线程)。这样,若是CPU没有采用超线程技术(如四核四线程的计算机,就如上图展现的我使用的计算机),一个用户线程就惟一地映射到一个物理CPU的线程,线程之间的并发是真正的并发。一对一模型使用户线程具备与内核线程同样的优势,一个线程因某种缘由阻塞时其余线程的执行不受影响;此处,一对一模型也可让多线程程序在多处理器的系统上有更好的表现。但一对一模型也有两个缺点:

1.许多操做系统限制了内核线程的数量,所以一对一模型会使用户线程的数量受到限制;

2.许多操做系统内核线程调度时,上下文切换的开销较大,致使用户线程的执行效率降低。 在这里插入图片描述 多对一模型

多对一模型将多个用户线程映射到一个内核线程上,线程之间的切换由用户态的代码来进行,所以相对一对一模型,多对一模型的线程切换速度要快许多;此外,多对一模型对用户线程的数量几乎无限制。但多对一模型也有两个缺点:

1.若是其中一个用户线程阻塞,那么其它全部线程都将没法执行,由于此时内核线程也随之阻塞了;

2.在多处理器系统上,处理器数量的增长对多对一模型的线程性能不会有明显的增长,由于全部的用户线程都映射到一个处理器上了。 在这里插入图片描述 多对多模型

多对多模型结合了一对一模型和多对一模型的优势,将多个用户线程映射到多个内核线程上。多对多模型的优势有:

1.一个用户线程的阻塞不会致使全部线程的阻塞,由于此时还有别的内核线程被调度来执行;

2.多对多模型对用户线程的数量没有限制;

3.在多处理器的操做系统中,多对多模型的线程也能获得必定的性能提高,但提高的幅度不如一对一模型的高。 在这里插入图片描述 进程与线程的区别

  • 线程是程序执行的最小单位,而进程是操做系统分配资源的最小单位;
  • 一个进程由一个或多个线程组成,线程是一个进程中代码的不一样执行路线;
  • 进程之间相互独立,但同一进程下的各个线程之间共享程序的内存空间(包括代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号),某进程内的线程在其它进程不可见;
  • 调度和切换:线程上下文切换比进程上下文切换要快得多。 在这里插入图片描述 在这里插入图片描述 总之,线程和进程都是一种抽象的概念,线程是一种比进程更小的抽象,线程和进程均可用于实现并发。

在早期的操做系统中并无线程的概念,进程是能拥有资源和独立运行的最小单位,也是程序执行的最小单位。它至关于一个进程里只有一个线程,进程自己就是线程。因此线程有时被称为轻量级进程(Lightweight Process,LWP)。

后来,随着计算机的发展,对多个任务之间上下文切换的效率要求愈来愈高,就抽象出一个更小的概念——线程,通常一个进程会有多个(也但是一个)线程。 在这里插入图片描述 漫话进程和线程

1.计算机的核心是CPU,它承担了全部的计算任务。它就像一座工厂,时刻在运行。 在这里插入图片描述 2.假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其余车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。 在这里插入图片描述 3.进程就比如工厂的车间,它表明CPU所能处理的单个任务。任一时刻,CPU老是运行一个进程,其余进程处于非运行状态。 在这里插入图片描述 4.一个车间里,能够有不少工人。他们协同完成一个任务。 在这里插入图片描述 5.线程就比如车间里的工人。一个进程能够包括多个线程。 在这里插入图片描述 6.车间的空间是工人们共享的,好比许多房间是每一个工人均可以进出的。这象征一个进程的内存空间是共享的,每一个线程均可以使用这些共享内存。 在这里插入图片描述 7.但是,每间房间的大小不一样,有些房间最多只能容纳一我的,好比厕所。里面有人的时候,其余人就不能进去了。这表明一个线程使用某些共享内存时,其余线程必须等它结束,才能使用这一块内存。 在这里插入图片描述 8.一个防止他人进入的简单方法,就是门口加一把锁。先到的人锁上门,后到的人看到上锁,就在门口排队,等锁打开再进去。这就叫”互斥锁”(Mutual exclusion,缩写 Mutex),防止多个线程同时读写某一块内存区域。 在这里插入图片描述 9.还有些房间,能够同时容纳n我的,好比厨房。也就是说,若是人数大于n,多出来的人只能在外面等着。这比如某些内存区域,只能供给固定数目的线程使用。 在这里插入图片描述 10.这时的解决方法,就是在门口挂n把钥匙。进去的人就取一把钥匙,出来时再把钥匙挂回原处。后到的人发现钥匙架空了,就知道必须在门口排队等着了。这种作法叫作”信号量”(Semaphore),用来保证多个线程不会互相冲突。

不难看出,mutex是semaphore的一种特殊状况(n=1时)。也就是说,彻底能够用后者替代前者。可是,由于mutex较为简单,且效率高,因此在必须保证资源独占的状况下,仍是采用这种设计。 在这里插入图片描述 操做系统的设计,所以能够归结为三点:

(1)以多进程形式,容许多个任务同时运行;

(2)以多线程形式,容许单个任务分红不一样的部分运行;

(3)提供协调机制,一方面防止进程之间和线程之间产生冲突,另外一方面容许进程之间和线程之间共享资源。 图片 做者:Luckylau 地址:http://r6d.cn/6mKF

相关文章
相关标签/搜索