经过汇编揭开String中数据结构神秘面纱

String(字符串),是编程语言中表示文本的数据类型。接触编程的你必定天天都会见到。那看似眇小的string(字符串),里面到底还隐藏着多少的秘密?你们平时每天使用的东西,你真的了解它吗?可能平时不少人并不会深刻研究它,若是你的能力还不错,不妨看看下面几个问题。要是对他们还存在困惑,那恭喜你,你找到了你要提高的方向。
⼀、思考
在 Swift 开发使⽤字符串的过程当中,你是否有思考过如下问题?
1 个字符串变量占⽤多少内存?
字符串 str一、str2 的底层存储有什么不一样?经过汇编揭开String中数据结构神秘面纱
若是对 str一、str2 进⾏拼接操做,str一、str2 的底层存储⼜会发⽣什么变化?
经过汇编揭开String中数据结构神秘面纱
若是你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制仍是⽐较了解的。
⼆、1 个字符串变量占⽤多少内存?git

⽅法 1:MemoryLayout
⾸先,能够借助 Swift ⾃带的 MemoryLayout 来测试⼀下经过汇编揭开String中数据结构神秘面纱
⽅法 2:汇编
另外,咱们也能够借助⼀个强有⼒的底层分析助⼿—汇编语⾔,来窥探⼀下 String 的底层存储实际上分析其余语法、系统库的底层,均可以借助汇编语⾔github

⽐如多态的原理、泛型的原理、Array 的底层、枚举的底层等等
另外,不只仅是 Swift,C、C++、OC 的底层分析,依然能够借助汇编语⾔
毕竟你写的每⼀⾏有效代码,最终都是要转成机器指令(0 和 1)
⽽机器指令是跟汇编指令⼀⼀对应的,每⼀条机器指令都能翻译成与之对应的汇编指令
能读懂汇编指令,就至关于能读懂机器指令,知道 CPU 具体在⼲嘛(操做了什么寄存器,操做了哪块内存)
本教程的代码是直接跑在 Mac 的命令⾏(CommandLineTools)项⽬上
所以展现的汇编代码是基于 X64 的 AT&T 格式汇编,并⾮ iOS 真机设备的 ARM 汇编其实不一样种类的汇编之间有极⼤的类似性,只是有些指令的叫法不⼀样
跟微软的 Visual Studio ⼀样,Xcode 也内置了⾮常⽅便的反汇编功能,能够轻松查看每⼀句代码对应的汇编指令,打开反汇编界⾯的步骤以下
在某⼀⾏须要调试的代码打上断点(反汇编界⾯会在断点调试状态下显示出来)算法

菜单: Debug >编程

译为汇编,数据结构

译为反汇编
经过汇编揭开String中数据结构神秘面纱编程语言

运⾏程序,看到反汇编界⾯
经过汇编揭开String中数据结构神秘面纱ide

若是你的反汇编经验⼗⾜,根据第 1六、17 ⾏的汇编就能够推敲出来,String 是占⽤ 16 个字节由于它⽤了 rax、rdx 寄存器存放字符串 str 的内容,⽽ rax、rdx 都是 8 字节的
汇编的内容太多了,由于时间和篇幅关系,⽂章⾥并不会对每⼀句汇编指令进⾏详细地讲解,更多的是 想说明汇编的重要性。
3、字符串的底层存储学习

窥探内存
此前我写了个能够窥探 Swift 变量内存的⼩⼯具:https://github.com/CoderMJLee/Mems 如今⽤它来窥探下字符串的 16 字节⾥⾯,究竟存储着什么数据
默认状况下按照 8 个字节⼀组来显示内存数据测试

传递参数翻译

是按照 1 个字节⼀组来显示内存数据

经过汇编揭开String中数据结构神秘面纱

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
它直接将全部字符的 ASCII 值存储在 str1 的 16 字节中
最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符
拼接
经过汇编揭开String中数据结构神秘面纱

能够发现,当对 str1 进⾏拼接 "ABCDE" 的时候
它最终是将 "0123456789ABCDE"⼗五个字符的 ASCII 值都存储在了 str1 的 16 字节中最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
能够看得出来,⽬前 16 个字节已经存满了,那若是再拼接 1 个字符呢?经过汇编揭开String中数据结构神秘面纱
能够看到,str1 ⾥⾯存储的数据发⽣了⾮常⼤的变化,每⼀个字符的 ASCII 值不⻅了, 那⾥⾯的 16 字节具体是什么含义呢?
全部字符('0'~'9'、'A' 到 'F')的 ASCII 值⼜存到哪去了呢?
其余状况
若是⼀开始初始化的时候(未拼接以前),字符串的内容就是超过 15 个字符呢?经过汇编揭开String中数据结构神秘面纱
相信你能猜到是这个结果
这 16 个字节⾥⾯并无出现任何⼀个字符的 ASCII 值

⽽且这 16 个字节跟

仍是有所区别

虽然它们的字符串内容都是"0123456789ABCDEF" 若是对 str2 进⾏拼接操做
经过汇编揭开String中数据结构神秘面纱

不难发现:这时 str2 的 16 字节⼜发⽣了变化,跟
如何解决上述疑问?

是有点类似的

上述的种种疑问,光看打印出来的内存数据是⽆法解决的,可是均可以利⽤【!!!汇编!!!】来解 决,分析汇编指令,⽴⻢就得出结论,由于⽂章的篇幅有限,平时⼯做也⽐较忙,我把上述问题的详细 剖析过程录制成了⻓达 2 个多⼩时的视频,有兴趣的朋友能够⽤ 1.5~2 倍速度观看
链 接 :https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA 提取码:kzrk
视频对于没有汇编基础的朋友来讲,可能会有点难度,最好挑⼀个头脑清醒的时间去观看
看完视频后,但愿⼤家可以确切地感觉到汇编语⾔的重要性,不要永远只停留在编写⾼级语⾔代 码、沉迷于语法糖的层⾯

4、最后
其实,经过汇编探索String底层,并不仅是为了研究字符串,咱们更但愿你经过汇编提高本身的编程能力。不仅是汇编,数据结构与算法也是助你程序生涯更进一步的必备宝典。不只如此,掌握这些能力,你还能玩转软件破解、外挂,这是我此前⽤【汇编\C++】编写的⼀个外挂:https://github.com/CoderMJLee/SeemygoPVZCheat 经过汇编揭开String中数据结构神秘面纱 er可能有人会说,我如今不须要接触这些,也可以完成工做。没错,若是你只是安于现状,大可没必要多费精力折磨本身。可是,若是你想提高本身能力,突破自我,汇编彻底能够助你在编程领域更上一层楼,绝对是你在突破自我道路上的一把利器。不过,现在的软件技术发展迅猛,不提高本身,就会落后。技术落后和技术不精的开发者,是必定会被市场所淘汰。高端的编程人员才是企业真正争夺的香饽饽,惟有不断的探索学习更多技术,才能在这⽚领域中站稳脚跟。总之,你本身决定你会成为哪一类人,你的高度也由你本身决定。听到这里,若是你对汇编、数据结构与算法等编程技巧愈发感兴趣,欢迎你加⼊咱们的你们庭,×××:×××。在这⾥你能够获得和IT界名师一对一交流的机会。让咱们共同进步,起航扬帆。

相关文章
相关标签/搜索