操做系统思考 第二章 进程

第二章 进程

做者:Allen B. Downeyhtml

原文:Chapter 2 Processesgit

译者:飞龙程序员

协议:CC BY-NC-SA 4.0github

2.1 抽象和虚拟化

在咱们谈论进程以前,我打算先定义几个东西:shell

  • 抽象(Abstraction):抽象是复琐事物的简单表示。例如,若是你开车的话,应该知道车轮向左转的时候车也会向左行驶,反之亦然。固然,方向盘由一系列机械和传动系统所链接,用于使轮子转向,而且轮子和路面的相互做用方式也很复杂。可是做为一个司机,你一般不须要考虑这些细节。你能够仅仅创建方向盘的心智模型,这种心智模型就是一个抽象。编程

    软件工程的很大一部分就是设计相似这样的抽象,容许用户和其它程序员使用强大而复杂的系统,而没必要知道其实现的细节。
  • 虚拟化(Virtualization):一类很是重要的抽象就是虚拟化,它是建立可取的幻像的过程。例如,许多公共图书馆都参与了馆际合做,容许它们互相借阅图书。当我须要一本书时,有时它在个人本地图书馆的架子上,但更多状况下它会被运到其它的馆藏中。不管是哪种,我都会收到它可借阅的提醒。我并不须要知道它来自哪里,我也不须要知道个人图书馆拥有哪一本书。通常来讲,这个系统建立了一个幻象,好像个人图书馆拥有全世界的每一本书。浏览器

    在物理上,个人图书馆的馆藏可能很小,可是虚拟上我能得到的馆藏包含了馆际合做的每一本书。
    
    另一个例子,大多数电脑都只链接到一个网络中,而这个网络又连接到其它网络,等等。咱们所谈论的“互联网”,是一系列网络和协议的合集,它将数据包从一个网络传送到另外一个网络。从用户和程序员的角度来看,整个系统的行为就像是互联网的每台计算机都互相链接。物理链接的数量十分少,可是虚拟链接的数量十分庞大。

“虚拟”这个词一般用于虚拟机的语境中,它是一种软件,能够建立运行特定系统的专用计算机的幻象。实际上,虚拟机可能和其它虚拟机一块儿运行在不一样的操做系统上。安全

在虚拟化的语境中,咱们一般把真实发生的事情叫作“物理的”,而把虚拟上发生的事情叫作“逻辑的”或者“抽象的”。bash

2.2 隔离

工程最重要的原则之一就是隔离(Isolation):当你设计一个带有多个组件的系统时,将它彼此隔离是个很好的方法,这样某个组件中的改变就不会对其它组件形成不良影响。网络

操做系统最重要的目标之一,就是将每一个进程和其它进程隔离,使程序员没必要考虑每一个可能的交互状况。提供这种隔离的软件对象叫作进程(Process)。

进程是表示运行中程序的软件对象。我按照面向对象编程把它称之为“软件对象”。工程一个对象包含数据,而且提供用于操做数据的方法。进程正是包含如下数据的对象:

  • 程序文本,一般是机器语言的指令序列。

  • 程序相关的数据,包括静态数据(编译时分配)和动态数据,后者包括运行时的栈和堆。

  • 任何等待中的IO状态。例如,若是进程正在等待从磁盘中读取的数据,或者从网络到达的数据包,这些操做的状态也是进程的一部分。

  • 程序的硬件状态,这包括储存在寄存器中的数据,状态信息,以及程序计数器,它表示当前执行了哪一个指令。

一般一个进程运行一个程序,可是对于进程来讲,加载并运行新的程序也是可能的。

也能够在多于一个进程中运行相同的程序,这很是常见。这种状况下,各个进程共享程序文本,可是拥有不一样的数据和硬件状态。

大多数操做系统提供了隔离进程的基本功能:

  • 多任务:大多数操做系统有能力在几乎任什么时候候中断一个进程,保存它的硬件状态,而且在之后恢复它。一般,程序员不须要考虑这些中断。程序的行为就像在一个专用的处理器上持续运行,除了两条指令之间的时间是不可预测的。

  • 虚拟内存:大多数操做系统会建立幻象,每一个进程看似拥有独立内存片而且孤立于其余进程。一样,程序员一般也不须要考虑虚拟内存如何工做,他们能够当作每一个程序都拥有专用的内存片来处理。

  • 设备抽象:运行于同一台计算机的进程共享磁盘、网络接口、显卡和其它硬件。若是进程直接和这些硬件交互而不加协调,就必定会产生混乱。例如,一个进程预期的网络数据可能会被另外一个进程读取。或者多个进程可能尝试在磁盘的相同位置储存数据。操做系统负责经过提供合适的抽象来维持秩序。

做为程序员,你不须要知道太多关于这些功能如何实现的事情。可是若是你很好奇,你能够在这个屏蔽层的后面发现一大堆有趣的事情。并且,若是你知道其中所发生的事情,你会成为更好的程序员。

2.3 Unix 进程

当我写这本书的时候,我最关注的进程就是个人文本编辑器,Emacs。偶尔我也会切换到终端窗口,它是一个运行Unix shell并提供命令行接口的窗口。

当我移动鼠标时,窗口的管理器会被唤醒,看到鼠标在终端窗口上方,而且唤醒终端。终端又唤醒shell。若是我在shell中键入make,它就会建立一个新的进程来运行Make。Make会建立另外一个进程来运行LaTeX,以后另外一个进程会显示结果。

若是我须要查询一些东西,我会切换到另外一个桌面,这会再次唤醒窗口管理器。若是我点击Web浏览器的图标,窗口管理器会建立进行来运行Web浏览器。许多浏览器,相似Chrome,会为每一个窗口和每一个选项卡建立新的进程。

而且这些只是我所了解的进程,同时还有许多其它进程“在后台”运行。它们中许多都在执行操做系统相关的工做。

Unix命令ps能打印出运行中进程的信息。若是你在终端里运行它,可能会看到这些:

PID TTY          TIME CMD
 2687 pts/1    00:00:00 bash
 2801 pts/1    00:01:24 emacs
24762 pts/1    00:00:00 ps

第一列是惟一的进程ID。第二列是建立进程的终端,“TTY”表明“电传打字机”(Teletypewriter),它是原始的机械终端。

第三行是用于该进程的处理器时间总计,依次为时、分、秒。最后一行是所运行进程的名称。这个例子中,bash是shell的名称,用于解释我键入到终端中的命令。Emacs是个人文本编辑器,而ps是生成这份输出的程序。

一般,ps只会列出有关当前终端的进程。若是你使用-e选项,你会获得全部进程(也包括属于其余用户的进程,我认为这是个安全缺陷)。

在个人系统上有233个进程,下面是它们的一部分:

PID TTY          TIME CMD
    1 ?        00:00:17 init
    2 ?        00:00:00 kthreadd
    3 ?        00:00:02 ksoftirqd/0
    4 ?        00:00:00 kworker/0:0
    8 ?        00:00:00 migration/0
    9 ?        00:00:00 rcu_bh
   10 ?        00:00:16 rcu_sched
   47 ?        00:00:00 cpuset
   48 ?        00:00:00 khelper
   49 ?        00:00:00 kdevtmpfs
   50 ?        00:00:00 netns
   51 ?        00:00:00 bdi-default
   52 ?        00:00:00 kintegrityd
   53 ?        00:00:00 kblockd
   54 ?        00:00:00 ata_sff
   55 ?        00:00:00 khubd
   56 ?        00:00:00 md
   57 ?        00:00:00 devfreq_wq

init是操做系统启动时首先建立的进程。它又会建立许多其它进程,以后会闲置,直到它建立的进程运行完毕。

kthreadd是操做系统用于建立新的“线程”的进程。以后咱们将会谈论更多关于线程的东西,可是你暂时你能够认为线程是一种进程。

相关文章
相关标签/搜索