深刻理解计算机系统 第一章 计算机系统漫游

第一章 计算机系统漫游

1.1 信息就是位+上下文

系统中的全部信息,包括磁盘文件,内存中的程序,内存中存放的用户数据以及网络上传送的数据,都是由一串比特表示的。区分不一样数据对象的惟一方法是咱们读到这些数据对象的上下文。linux

1.2 程序被其余程序翻译成不一样格式

一个程序的生命周期是从一个高级C语言程序开始的,为了能在系统上运行该程序,每条语句都必须被其余程序转换成一系列低级机器语言,而后这些指令按照可执行目标程序的格式打包好,并以二进制文件的形式存储起来。获得可执行目标文件。shell

这个翻译过程可归为四个阶段,预处理,编译,汇编,连接,四个阶段构成了编译系统。编程

1.png

预处理阶段缓存

预处理器根据预编译指令,对C程序进行文本替换。获得.i文件。安全

编译阶段网络

编译器将.i翻译成.s,获得一个汇编语言程序。C语言和Fortran编译器产生的输出文件都是同样的汇编语言。架构

汇编阶段并发

将.s文件翻译成机器语言指令,并打包成可重定位目标程序,把存在目标文件.o中。.o是二进制文件。函数

连接性能

C语言头文件中中的函数存在了预编译好的目标文件,所以该阶段将调用的函数合并到咱们的.o文件中,获得可执行目标文件。该文件能够被加载到内存中由系统执行。

1.3 了解编译系统如何工做的益处

  1. 优化程序性能

    咱们须要了解一些机器代码以及编译器如何将C转换为机器代码的方式。不一样循环语句的比较,switch和ifelse的比较等。

  2. 理解连接时出现的错误

  3. 避免安全漏洞,如缓冲区溢出等

1.4 处理器读并解释储存在内存中的指令

当程序被编译完成后,咱们可经过shell指令

linux> ./hello

来运行程序

1.4.1 系统的硬件组成

为了理解运行hello程序时发生了什么,咱们须要了解系统的硬件组织。

这是一张近期Intel产品族的模型

2.png

总线

贯穿于整个系统的电子管道,携带信息字节并负责在各个部件间传递。总线传输的数是个重要的系统参数。

IO设备

IO设备是系统与外部的联系通道,每一个IO设备经过控制器或适配器与IO总线相连。控制器和适配器的差异在于他们的封装方式。控制器是IO设备自己或系统的主印刷电路板,适配器是插在主板插槽上的卡。

主存

主存用来存放程序和数据,由DRAM构成。按字节编址。

处理器

处理器按照指令模型来操做,该模型由指令集架构决定。指定按照严格的顺序执行,并更新PC寄存器。

1.4.2 运行hello程序

shell将hello文件加载到内存中,经过dma技术,文件能够直接从磁盘到内存,不通过cpu。

3.png

hello程序将字符串中的字节从主存复制到寄存器,再从寄存器复制到显示设备,输出到磁盘。

4.png

1.5 高速缓存相当重要

如上的简单示例说明了一个重要问题,计算机会常常进行IO操做。这些开销减慢了程序运行的速度。所以系统设计者的一个重要目标就是使IO操做尽快完成。

处理器与主存之间存在着巨大的速度差距,而且还在一直扩大。针对这种差别,系统设计者采用了更小更快的高速缓冲存储器做为暂时存储。L1高速缓存一般可达数万字节,访问速度几乎和访问寄存器同样快。经过该方案,能让内存操做基本都在缓存中完成,基于程序局部性原理。

5.png

1.6 储存器的层次结构

计算机的各储存部件间造成了层次结构,底层速度快,造价高,容量小,高层相反。经过该层次结构,就能够用高层的价格和容量,达到底层的速度。

6.png

1.7 操做系统管理硬件

当咱们执行程序时,程序并无直接访问计算机硬件,而是经过操做系统提供的服务来访问。咱们能够把操做系统看做是应用程序和硬件之间插入的一层软件。

操做系统有两个基本功能:

防止硬件被应用程序滥用,向应用程序提供简单一致的机制来控制硬件设备。操做系统经过几个抽象服务来实现,如进程,虚拟内存,文件等。

7.png

1.8 系统之间利用网络通讯

现代系统常常经过网络和其它系统链接到一块儿,网络可视做一个IO设备,数据流能够经过网络直接发给另外一台机器,不通过本地磁盘,也可经过网络直接读取数据到主存中。

1.9 重要主题

1.9.1 Amdahl定律

对系统的某一部分加速时,其对系统总体性能影响取决于该部分的重要性和加速程度。

8.png

由此可知,想要显著加速整个系统,必须提高全系统中至关大部分的速度

1.9.2 并发和并行

  1. 线程级并发

    构建在进程抽象之上,咱们可以设计出同时有多个程序执行的系统,这就致使了并发。自20世纪60年代出现时间共享以来,计算机系统就开始有了对并发执行的支持,但只是简单的使任务按时间切换。这种配置称为单处理器系统。

    后来随着多核处理器,超线程的出现,咱们普遍使用了多处理器系统,将多个CPU(核)集成到集成电路芯片上,每一个核都有本身的L1和L2缓存,而共用L3缓存.

9.png

而超线程技术则容许一个核并行执行多个控制流。在使用超线程的核中,程序计数器核寄存器有多个备份,共用其余资源。

  1. 指令级并行

    在CPU中,使用流水线技术来极大加快指令的执行。若是指令速度快于一周期一条,则可成为超标量处理器。

  2. 单指令,多数据并行

    许多处理器拥有特殊的硬件,容许一条指令产生多个并行的数据操做。如SIMD指令能够并行加法,一般须要在编程时显式声明。

相关文章
相关标签/搜索