汇编001-初识汇编

1、汇编语言的发展

1.1 机器语言

由0和1组成的机器指令程序员

加：0100 0000
减：0100 1000
乘：1111 0111 1110 0000
除：1111 0111 1111 0000

1.2 汇编语言(assembly language)

使用助记符代替机器语言如:缓存

加：INC EAX 经过编译器 0100 0000
减：DEC EAX 经过编译器 0100 1000
乘：MUL EAX 经过编译器 1111 0111 1110 0000
除：DIV EAX 经过编译器 1111 0111 1111 0000

1.3 高级语言（High-level programming language)

C\C++\Java\OC\Swift,更加接近人类的天然语言好比C语言:sass

加：A+B 经过编译器 0100 0000
减：A-B 经过编译器 0100 1000
乘：A*B 经过编译器 1111 0111 1110 0000
除：A/B 经过编译器 1111 0111 1111 0000

咱们的代码在终端设备上是这样的过程:安全

汇编语言与机器语言一一对应，每一条机器指令都有与之对应的汇编指令 汇编语言能够经过编译获得机器语言，机器语言能够经过反汇编获得汇编语言 高级语言能够经过编译获得汇编语言 \ 机器语言，但汇编语言\机器语言几乎不可能还原成高级语言markdown

2、汇编语言的特色

能够直接访问、控制各类硬件设备，好比存储器、CPU等，能最大限度地发挥硬件的功能
可以不受编译器的限制，对生成的二进制代码进行彻底的控制
目标代码简短，占用内存少，执行速度快
汇编指令是机器指令的助记符,同机器指令一一对应。每一种CPU都有本身的机器指令集\汇编指令集，因此汇编语言不具有可移植性
知识点过多，开发者须要对CPU等硬件结构有所了解，不易于编写、调试、维护
不区分大小写，好比mov和MOV是同样的

3、汇编的用途

编写驱动程序、操做系统（好比Linux内核的某些关键部分）
对性能要求极高的程序或者代码片断，可与高级语言混合使用（内联汇编）
软件安全
- 病毒分析与防治
- 逆向\加壳\脱壳\破解\外挂\免杀\加密解密\漏洞\黑客
理解整个计算机系统的最佳起点和最有效途径
为编写高效代码打下基础
弄清代码的本质
- 函数的本质到底是什么?
- ++a + ++a + ++a 底层如何执行的?
- 编译器到底帮咱们干了什么?
- DEBUG模式和RELEASE模式有什么关键的地方被咱们忽略
- ......

最后来句装13的话架构

越底层越单纯!真正的程序员都须要了解的一门很是重要的语言,汇编!函数

4、汇编语言的种类

目前讨论比较多的汇编语言有
- 8086汇编（8086处理器是16bit的CPU）
- Win32汇编
- Win64汇编
- ARM汇编（嵌入式、Mac、iOS）
- ......
咱们iPhone里面用到的是ARM汇编,可是不一样的设备也有差别.因CPU的架构不一样.

架构	设备
armv6	iPhone, iPhone2, iPhone3G, 第一代、第二代 iPod Touch
armv7	iPhone3GS, iPhone4, iPhone4S,iPad, iPad2, iPad3(The New iPad), iPad mini, iPod Touch 3G, iPod Touch4
armv7s	iPhone5, iPhone5C, iPad4(iPad with Retina Display)
arm64	iPhone5S 之后 iPhoneX , iPad Air, iPad mini2之后

5、几个必要的常识

要想学好汇编,首先须要了解CPU等硬件结构
APP/程序的执行过程

硬件相关最为重要是CPU/内存
在汇编中,大部分指令都是和CPU与内存相关的

6、总线

每个CPU芯片都有许多管脚，这些管脚和总线相连，CPU经过总线跟外部器件进行交互
总线：一根根导线的集合
总线的分类
- 地址总线
- 数据总线
- 控制总线

举个例子post

地址总线
- 它的宽度决定了CPU的_寻址能力_
- 8086的地址总线宽度是_20_，因此寻址能力是_1M_（ 220 ）

数据总线
- 它的宽度决定了CPU的单次数据传送量，也就是数据_传送速度_
- 8086的数据总线宽度是_16_，因此单次最大传递_2个字节_的数据
控制总线
- 它的宽度决定了CPU对其余器件的_控制能力_、能有多少种控制

作个小练习性能

一个CPU 的寻址能力为8KB,那么它的地址总线的宽度为____
8080,8088,80286,80386 的地址总线宽度分别为16根,20根,24根,32根.那么他们的寻址能力分别为多少____KB, ____MB,____MB,____GB?
8080,8088,8086,80286,80386 的数据总线宽度分别为8根,8根,16根,16根,32根.那么它们一次能够传输的数据为:____B,____B,____B,____B,____B,
从内存中读取1024字节的数据,8086至少要读____次,80386至少要读取____次.

答案学习

内存

内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20，能够定位220个不一样的内存单元（内存地址范围0x00000~0xFFFFF），因此8086的内存空间大小为1MB
0x00000~0x9FFFF：主存储器。可读可写
0xA0000~0xBFFFF：向显存中写入数据，这些数据会被显卡输出到显示器。可读可写
0xC0000~0xFFFFF：存储各类硬件\系统信息。只读

7、进制

学习进制的障碍

不少人学很差进制，缘由是总以十进制为依托去考虑其余进制，须要运算的时候也老是先转换成十进制，这种学习方法是错误的. 咱们为何必定要转换十进制呢？仅仅是由于咱们对十进制最熟悉，因此才转换. 每一种进制都是完美的,想学好进制首先要忘掉十进制，也要忘掉进制间的转换！

进制的定义

八进制由8个符号组成:0 1 2 3 4 5 6 7 逢八进一
十进制由10个符号组成:0 1 2 3 4 5 6 7 8 9逢十进一
N进制就是由N个符号组成:逢N进一

作个练习

1 + 1 在____状况下等于 3 ?

若是咱们自定义十进制由10个符号组成: 0 1 3 2 8 A B E S 7 逢十进一，这样定义十进制: 1 + 1 = 3!就对了!

这样的目的何在?

传统咱们定义的十进制和自定义的十进制不同.那么这10个符号若是咱们不告诉别人这个符号表,别人是没办法拿到咱们的具体数据的!用于加密!

十进制由十个符号组成,逢十进一,符号是能够自定义的!!

进制的运算

八进制运算
- 2 + 3 = __ , 2 * 3 = __ ,4 + 5 = __ ,4 * 5 = __.
- 277 + 333 = __ , 276 * 54 = __ , 237 - 54 = __ , 234 / 4 = __ .

八进制加法表

0  1  2  3  4  5  6  7 
10 11 12 13 14 15 16 17
20 21 22 23 24 25 26 27
...
 
1+1 = 2                     
1+2 = 3   2+2 = 4               
1+3 = 4   2+3 = 5   3+3 = 6
1+4 = 5   2+4 = 6   3+4 = 7   4+4 = 10  
1+5 = 6   2+5 = 7   3+5 = 10  4+5 = 11  5+5 = 12
1+6 = 7   2+6 = 10  3+6 = 11  4+6 = 12  5+6 = 13  6+6 = 14
1+7 = 10  2+7 = 11  3+7 = 12  4+7 = 13  5+7 = 14  6+7 = 15  7+7 = 16
复制代码

八进制乘法表

0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 20 21 22 23 24 25 26 27...
1*1 = 1                     
1*2 = 2   2*2 = 4               
1*3 = 3   2*3 = 6   3*3 = 11    
1*4 = 4   2*4 = 10  3*4 = 14  4*4 = 20
1*5 = 5   2*5 = 12  3*5 = 17  4*5 = 24  5*5 = 31
1*6 = 6   2*6 = 14  3*6 = 22  4*6 = 30  5*6 = 36  6*6 = 44
1*7 = 7   2*7 = 16  3*7 = 25  4*7 = 34  5*7 = 43  6*7 = 52  7*7 = 61
复制代码

实战四则运算

277 + 333 =
236 - 54 =
276 * 54 =
234 / 4 =

二进制的简写形式

二进制: 1 0 1 1 1 0 1 1 1 1 0 0
三个二进制一组: 101 110 111 100
       八进制:   5   6   7   4
四个二进制一组: 1011 1011 1100
      十六进制:    b    b    c
复制代码

二进制：从0 写到 1111 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 这种二进制使用起来太麻烦，改为更简单一点的符号： 0 1 2 3 4 5 6 7 8 9 A B C D E F 这就是十六进制了

8、数据的宽度

数学上的数字，是没有大小限制的，能够无限的大。但在计算机中，因为受硬件的制约，数据都是有长度限制的（咱们称为数据宽度），超过最多宽度的数据会被丢弃。

#import <UIKit/UIKit.h>
#import "AppDelegate.h"

int test(){
    int cTemp = 0x1FFFFFFFF;
    return cTemp;
}

int main(int argc, char * argv[]) {
    printf("%x\n",test());
    @autoreleasepool {
        return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
    }
}

复制代码

9、计算机中常见的数据宽度

位(Bit): 1个位就是1个二进制位.0或者1
字节(Byte): 1个字节由8个Bit组成(8位).内存中的最小单元Byte.
字(Word): 1个字由2个字节组成(16位),这2个字节分别称为高字节和低字节.
双字(Doubleword): 1个双字由两个字组成(32位)

那么计算机存储数据它会分为有符号数和无符号数.那么关于这个看图就理解了!

无符号数,直接换算! 
有符号数: 
正数:  0    1    2    3    4    5    6    7 
负数:  F    E    D    B    C    A    9    8

      -1   -2   -3   -4   -5   -6   -7   -8
复制代码

自定义进制符号 练习

如今有10进制数 10个符号分别是：2，9，1，7，6，5，4， 8，3 , A 逢10进1 那么： 123 + 234 = ____

十进制:    0  1  2  3  4  5  6  7  8  9
自定义:    2  9  1  7  6  5  4  8  3  A
         92 99 91 97 96 95 94 98 93 9A
         12 19 11 17 16 15 14 18 13 1A
         72 79 71 77 76 75 74 78 73 7A
         62 69 61 67 66 65 64 68 63 6A
         52 59 51 57 56 55 54 58 53 5A
         42 49 41 47 46 45 44 48 43 4A
         82 89 81 87 86 85 84 88 83 8A
         32 39 31 37 36 35 34 38 33 3A
        922
复制代码

那么刚才经过10进制运算能够转化10进制而后查表!可是若是是其余进制.咱们就不能转换,要直接学会查表

如今有9进制数 9个符号分别是：2，9，1，7，6，5，4， 8，3 逢9进1 那么： 123 + 234 = ____

十进制:    0  1  2  3  4  5  6  7  8  
自定义:    2  9  1  7  6  5  4  8  3  
         92 99 91 97 96 95 94 98 93 
         12 19 11 17 16 15 14 18 13 
         72 79 71 77 76 75 74 78 73 
         62 69 61 67 66 65 64 68 63 
         52 59 51 57 56 55 54 58 53 
         42 49 41 47 46 45 44 48 43 
         82 89 81 87 86 85 84 88 83 
         32 39 31 37 36 35 34 38 33 
         922
复制代码

10、CPU&寄存器

内部部件之间由总线链接

CPU除了有控制器、运算器还有寄存器。其中寄存器的做用就是进行数据的临时存储。

CPU的运算速度是很是快的，为了性能CPU在内部开辟一小块临时存储区域，并在进行运算时先将数据从内存复制到这一小块临时存储区域中，运算时就在这一小快临时存储区域内进行。咱们称这一小块临时存储区域为寄存器。

对于arm64系的CPU来讲，若是寄存器以x开头则代表的是一个64位的寄存器，若是以w开头则代表是一个32位的寄存器，在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并非独立存在的。

对程序员来讲，CPU中最主要部件是寄存器，能够经过改变寄存器的内容来实现对CPU的控制
不一样的CPU，寄存器的个数、结构是不相同的

浮点和向量寄存器

由于浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数

浮点寄存器 64位: D0 - D31 32位: S0 - S31

如今的CPU支持向量运算.(向量运算在图形处理相关的领域用得很是的多)为了支持向量计算系统了也提供了众多的向量寄存器.

向量寄存器 128位:V0-V31

通用寄存器

通用寄存器也称数据地址寄存器一般用来作数据计算的临时存储、作累加、计数、地址保存等功能。定义这些寄存器的做用主要是用于在CPU指令中保存操做数，在CPU中当作一些常规变量来使用。
ARM64拥有有32个64位的通用寄存器 x0 到 x30，以及XZR(零寄存器),这些通用寄存器有时也有特定用途。
- 那么w0 到 w28 这些是32位的. 由于64位CPU能够兼容32位.因此能够只使用64位寄存器的低32位.
- 好比 w0 就是 x0的低32位!

注意: 了解过8086汇编的同窗知道，有一种特殊的寄存器段寄存器:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并无

一般，CPU会先将内存中的数据存储到通用寄存器中，而后再对通用寄存器中的数据进行运算
假设内存中有块红色内存空间的值是3，如今想把它的值加1，并将结果存储到蓝色内存空间

CPU首先会将红色内存空间的值放到X0寄存器中：mov X0,红色内存空间
而后让X0寄存器与1相加：add X0,1
最后将值赋值给内存空间：mov 蓝色内存空间,X0

pc寄存器(program counter)

为指令指针寄存器，它指示了CPU当前要读取指令的地址
在内存或者磁盘上，指令和数据没有任何区别，都是二进制信息
CPU在工做的时候把有的信息看作指令，有的信息看作数据，为一样的信息赋予了不一样的意义
- 好比 1110 0000 0000 0011 0000 1000 1010 1010
- 能够当作数据 0xE003008AA
- 也能够当作指令 mov x0, x8
CPU根据什么将内存中的信息看作指令？
- CPU将pc指向的内存单元的内容看作指令
- 若是内存中的某段内容曾被CPU执行过，那么它所在的内存单元必然被pc指向过

高速缓存

iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB，2级缓存的容量8M.

CPU每执行一条指令前都须要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快不少,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时，先将要执行的指令代码以及数据复制到高速缓存中去(由操做系统完成).CPU直接从高速缓存依次读取指令来执行.

bl指令

CPU从何处执行指令是由pc中的内容决定的，咱们能够经过改变pc的内容来控制CPU执行目标指令
ARM64提供了一个mov指令（传送指令），能够用来修改大部分寄存器的值，好比
- mov x0,#十、mov x1,#20
可是，mov指令不能用于设置pc的值，ARM64没有提供这样的功能
ARM64提供了另外的指令来修改PC的值，这些指令统称为转移指令，最简单的是bl指令

bl指令 -- 练习

如今有两段代码!假设程序先执行A,请写出指令执行顺序.最终寄存器x0的值是多少?

_A:
    mov x0,#0xa0
    mov x1,#0x00
    add x1, x0, #0x14
    mov x0,x1
    bl _B
    mov x0,#0x0
    ret

_B:
    add x0, x0, #0x10
    ret
复制代码

新建Xcode工程命名为汇编01，新建Empty文件命名为asm.s

在asm.s中写代码

.text
.global _A,_B


_A:
    mov x0, #0xa0
    mov x1, #0x00
    add x1, x0, #0x14
    mov x0,x1
    bl _B
    mov x0, #0x0
    ret

_B:
    add x0, x0, #0x10
    ret

复制代码

咱们能够看到这个文件是会正常参加编译的

在另外一个文件中尝试调用_A函数

假如没有asm.s文件的话A()函数有声明没有实现是不能编译经过的，咱们选择真机尝试编译

选择真机进行编译，注意要用真机！！！！！

咱们发现是能够编译成功的，这就说明asm.s文件中的_A函数有效果了

勾选Debug -> always show disassembly

在A()函数处打断点并运行工程

注意工做台选择All Variables,Registers,Globals and Statics

这时咱们能够查看寄存器信息

按住control单步执行汇编指令并观察寄存器x0和x1的值的变化

例如执行完指令mov x0,#0xa0以后x0寄存器的值变为0xa0

可是执行到最后两句指令时咱们发现进入了死循环，这是为何呢？？？请听下回分解