字符串(String)是由数字、字母、下划线组成的一串字符,通常记为 s=“a1a2···an”(n>=0)。字符串主要用于编程,概念说明、函数解释,它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。git
1、思考程序员
在 Swift 开发使用字符串的过程当中,你是否有思考过如下问题?github
- 1 个字符串变量占用多少内存?算法
- 字符串 str一、str2 的底层存储有什么不一样?编程
- 若是对 str一、str2 进行拼接操做,str一、str2 的底层存储又会发生什么变化?sass
若是你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制仍是比较了解的。微信
2、1 个字符串变量占用多少内存?数据结构
方法 1:MemoryLayout编程语言
首先,能够借助 Swift 自带的 MemoryLayout 来测试一下函数
方法 2:汇编
另外,咱们也能够借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储
- 实际上分析其余语法、系统库的底层,均可以借助汇编语言
- 好比多态的原理、泛型的原理、Array 的底层、枚举的底层等等
另外,不只仅是 Swift,C、C++、OC 的底层分析,依然能够借助汇编语言
- 毕竟你写的每一行有效代码,最终都是要转成机器指令(0 和 1)
- 而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令
- 能读懂汇编指令,就至关于能读懂机器指令,知道 CPU 具体在干吗(操做了什么寄存器,操做了哪块内存)
- 本教程的代码是直接跑在 Mac 的命令行(CommandLineTools)项目上
- 所以展现的汇编代码是基于 X64 的 AT&T 格式汇编,并不是 iOS 真机设备的 ARM 汇编
- 其实不一样种类的汇编之间有极大的类似性,只是有些指令的叫法不同
跟微软的 Visual Studio 同样,Xcode 也内置了很是方便的反汇编功能,能够轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤以下
- 在某一行须要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)
- 菜单:`Debug` > `Debug Workflow` > `Always Show Disassembly`
- `Assembly` 译为汇编, `Disassembly` 译为反汇编
- 运行程序,看到反汇编界面
若是你的反汇编经验十足,根据第 1六、17 行的汇编就能够推敲出来,String 是占用 16 个字节
- 由于它用了 rax、rdx 寄存器存放字符串 str 的内容,而 rax、rdx 都是 8 字节的
汇编的内容太多了,由于时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。
3、字符串的底层存储
窥探内存
此前我写了个能够窥探 Swift 变量内存的小工具:https://github.com/CoderMJLee/Mems
- 如今用它来窥探下字符串的 16 字节里面,究竟存储着什么数据
- `Mems.memStr(ofVal:)` 默认状况下按照 8 个字节一组来显示内存数据
- 传递参数 `alignment: .one` 是按照 1 个字节一组来显示内存数据
字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
- 它直接将全部字符的 ASCII 值存储在 str1 的 16 字节中
- 最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符
拼接
能够发现,当对 str1 进行拼接 "ABCDE" 的时候
- 它最终是将 "0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中
- 最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
- 能够看得出来,目前 16 个字节已经存满了,那若是再拼接 1 个字符呢?
能够看到,str1 里面存储的数据发生了很是大的变化,每个字符的 ASCII 值不见了,
- 那里面的 16 字节具体是什么含义呢?
- 全部字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?
其余状况
若是一开始初始化的时候(未拼接以前),字符串的内容就是超过 15 个字符呢?
相信你能猜到是这个结果
- 这 16 个字节里面并无出现任何一个字符的 ASCII 值
- 并且这 16 个字节跟 `第27行的str1` 仍是有所区别
- 虽然它们的字符串内容都是"0123456789ABCDEF"
若是对 str2 进行拼接操做
不难发现:这时 str2 的 16 字节又发生了变化,跟 `第27行的str1` 是有点类似的
如何解决上述疑问?
上述的种种疑问,光看打印出来的内存数据是没法解决的,可是均可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,由于文章的篇幅有限,平时工做也比较忙,我把上述问题的详细剖析过程录制成了长达 2 个多小时的视频,有兴趣的朋友能够用 1.5~2 倍速度观看
- 连接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA
- 提取码:kzrk
- 视频对于没有汇编基础的朋友来讲,可能会有点难度,最好挑一个头脑清醒的时间去观看
- 看完视频后,但愿你们可以确切地感觉到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面。
4、最后
人们常常认为汇编语言的应用范围很小,而忽视它的重要性。其实汇编语言对每个但愿学习计算机科学与技术的人来讲都是很是重要的,是不能不学习的语言。
汇编能给你带来的价值远远不止这篇文章所说的窥探字符串的底层,对你的程序生涯影响绝对是终生受益的(数据结构与算法功底也是如此)。学会汇编后,你在用高级语言编程时会更了解机器到底作了什么,能够经过修改高级语言的代码来提升算法所不能提升的效率。
不只如此,你还能玩转软件破解、游戏外挂等,这是我此前用【汇编\C++】编写的一个游戏外挂:https://github.com/CoderMJLee/SeemygoPVZCheater
IT技术的发展突飞猛进,新技术层出不穷,具备良好的学习能力,能及时获取新知识、随时补充和丰富本身,已成为程序员职业发展的核心竞争力。
做为一名程序员,更须要不断丰富本身的知识库。咱们所知道的东西,就像一个白色的圆圈,圈外则是黑暗的未知的世界。当圆圈越大,所接触到的黑暗部分就越多。咱们只有不停地学习,才能打破更多的黑暗,找到更多光明。
若是您想提高本身,学习更多如 iOS、数据结构与算法等编程技巧,这里有免费的相关学习资料,欢迎加微信:19950277730获取更多技术提高秘籍。这里不只有志同道合的小伙伴,更有无数免费编程技巧、学习视频和资料,加上微信来一块儿探讨学习技术吧!!