从硬件角度来看, CPU就是一个超大规模集成电路,经过电路实现了加法,乘法乃至各类各样的处理逻辑。sass
从软加工程师的角度来说,CPU就是一个执行各类计算机指令(Instruction Code)的逻辑机器。这里的计算机指令,就比如一门CPU可以听懂的语言,咱们把它叫作机器语言(Machine Language)函数
不一样的CPU可以听懂的语言不太同样。好比咱们我的电脑用的Intel的CPU,苹果手机用的是ARM的CPU。相似这样两种CPU各自支持的语言,就是两组不一样的计算机指令集(Instruction set)spa
一个计算机程序,不可能只有一条指令,而是由成千上万条指令组成的。可是CPU里不能一直放着全部指令,因此计算机程序平时是存储在存储器中的。这种指令存储在存储器里面的计算机,咱们就叫作存储程序型计算机操作系统
// test.c int main() { int a = 1; int b = 2; a = a + b; }
要让这段程序在一个Linux操做系统上跑起来,咱们须要把整个程序翻译成一个汇编语言(ASM,Assembly Language)的程序,这个过程咱们通常叫编译(Compile)成好汇编代码。翻译
针对汇编代码,咱们能够再用汇编器(Assembler)翻译成机器码(Machine Code)。这些机器码由“0”和“1”组成的机器语言表示。这一条条机器码,就是一条条的计算机指令。这样一串串的16进制数字,就是咱们CPU可以真正认识的计算机指令设计
在一个Linux操做系统上,咱们能够简单地使用gcc和objdump这样两条命令,把对应的汇编代码和机器码都打印出来。code
[learning_log@localhost 桌面]$ gcc -g -c text.c [learning_log@localhost 桌面]$ objdump -d -M intel -S text.o text.o: 文件格式 elf64-x86-64 Disassembly of section .text: 0000000000000000 <main>: int main() { 0: 55 push rbp 1: 48 89 e5 mov rbp,rsp int a = 1; 4: c7 45 fc 01 00 00 00 mov DWORD PTR [rbp-0x4],0x1 int b = 2; b: c7 45 f8 02 00 00 00 mov DWORD PTR [rbp-0x8],0x2 a = a + b; 12: 8b 45 f8 mov eax,DWORD PTR [rbp-0x8] 15: 01 45 fc add DWORD PTR [rbp-0x4],eax } 18: 5d pop rbp 19: c3 ret
能够看到左侧一堆数字,这些就是一条条机器码;右边有一系列的push、mov、add、pop等,这些就是对应的汇编代码。一行C语言代码,有时候对应一条机器码和汇编代码,有时候则是对应两条机器码和汇编代码。汇编代码和机器码之间是一一对应的。blog
从高级语言到汇编代码,再到机器码,就是一个平常开发程序,最终变成了CPU能够执行的计算机指令的过程。接口
常见的指令能够分为五大类。内存
第一类是算术类指令。咱们的加减乘除,在CPU层面,都会变成一条条算术类指令。
第二类是数据传输类指令。给变量赋值,在内存里读写数据,用的都是数据传输类指令。
第三类是逻辑类指令。逻辑上的与或非,都是这一类指令。
第四类是条件分支类指令。平常咱们写的“if/else”,其实都是条件分支类指令。
最后一类是无条件跳转指令。写一些大一点的程序,咱们经常须要写一些函数或者方法。再调用函数的时候,其实就是发起了一个无条件跳转指令。
咱们说过,不一样的CPU有不一样的指令集,也就对应着不一样的汇编语言和不一样的机器码。为了方便你快速理解这个机器码的计算方式,咱们选用最简单的MIPS指令集,来看机器码是如何生成的。
MIPS的指令是一个32位的整数,高6位叫操做码(Opcode),也就是表明这条指令具体是一条什么样的指令,剩下的26位有三种格式,分别是R、I、J。
R指令是通常用来作算术和逻辑操做,里面有读取和写入数据的寄存器的地址。若是是逻辑位移操做,后面还有位移操做的位移量,而最后的功能码,则是在前面的操做码不够的时候,扩展操做码表示对应的具体指令的。
I指令,则一般是用来数据传输,条件分支,以及在运算的时候使用的并不是变量仍是常数的时候。这个时候,没有了位移量和操做码,也没有了第三个寄存器,而是把这三部分直接合并成一个地址值或者常数。
J指令就是一个跳转指令,高6位以外的26位都是一个跳转后的地址。
add $t0,$s2,$s1
对应的MIPS指令里的opcode是0,rs表明第一个寄存器s1的地址是17,rt表明第二个寄存器s2的地址是18,rd表明目标的临时寄存器t0的地址,是8。由于不是位移操做,因此位移量是0.把这些数字拼在一块儿,就变成了一个MIPS的加法指令。
为了读起来方便,咱们通常把对应的二进制数,用16进制表示,也就是0X02324020。这个数字也就是这条指令对应的机器码。
若是想要对平常使用的Intel CPU的指令集有所了解,能够参看《计算机组成与设计:软/硬件借口》第5版的2.17小节。