内存分页不就够了？为何还要分段？

微信搜「yes的练级攻略」干货满满，否则来掐我，回复【123】一份20W字的算法刷题笔记等你来领。我的文章汇总：https://github.com/yessimida/yes 欢迎 star !java

你好，我是 yes。git

关于内存访问你可能听过度段，分页，还有段页式。github

可是为何要分段？又为何要分页？算法

有了分页为何还要分段？chrome

这就须要看一看历史的发展，知晓历史以后就知道这一切其实都是天然而然的。安全

这些概念也不是硬塞出来的。微信

正文

1971 年 11 月 15 日，Intel 推出世界第一块我的微型处理器 4004（4位处理器）。性能

随后又推出了 8080（8 位处理器）。.net

那时候访问内存就只有直白天然的想法，用具体物理地址。3d

全部的内存访问就是经过绝对物理地址去访问的，那时候尚未段的概念。

段的概念是起源于 8086，这个 16 位处理器。

限于当时的技术背景和经济，寄存器只有 16 位，而地址总线是 20 位。

那 16 的位的寄存器如何能访问 20 位的地址？

2 的16 次方若是直着来如何能访问到 2 的 20 次方所表达的数？

直着来是不可能的，所以就须要操做一下。

也就是引入段的概念，让 CPU 经过「段基地址+段内偏移」来访问内存。

有人可能就问你这都只有 16 位，两个 16 位加起来最多只能表示 17 位呀。

你说的没错。

因此再具体一点的计算规则实际上是：段基地址左移 4 位（就是乘16）再加上段内偏移，这样获得的就是 20 位的地址。

好比如今的要访问的内存地址是0x05808，那么段基地址能够是 0x0580，偏移量就是 0x0008。

这样内存的寻址空间就扩大到 20 位了。

至于为何称之为段，其实就是由于寄存器只有 16 位一段只能访问 64 KB，因此须要移动基地址，一段一段的去访问全部的内存空间。

对了，专门为分段而生的寄存器为段寄存器，当时里面直接存放段基地址。

不过渐渐地人们就考虑到安全问题，由于在这个时候程序之间的地址没有隔离，个人程序能够访问你的程序地址，这就很不安全。

因而在 1982 年 80286 推出时，就有了保护模式。

其实就是 CPU 在访问地址的时候作了约束，会判断地址是否在容许的范围内，会判断当前的程序对目的地址是否有访问权限。

搞了个 GDT （全局描述符表）存放全部段描述符。

段寄存器里面也不是直接放段基地址了，而是放了一个叫选择子的东西。

大体能够认为就是段描述符的索引，也就是经过这个索引去找到段描述符，因此叫选择子。

这个选择子里面还有一点属性。

这个 T1 就是标明要去哪一个表找，而 RPL 就是特权级了，一共分为四层，0 为最高特权级，3 为最低特权级。

当地址访问时，若是 RPL 的权限低于目标特权级（DPL）时，就会拒绝访问，因而就起到了保护的做用。

因此称之为保护模式，以前的那种没有判断权限的称之为实模式。

当时 80286 的地址总线已是 24 位，可是用于寻址的通用寄存器仍是 16 位，虽然段基地址的位数已经足够访问到 24 位（由于已经放到 GDT 中，且有 24位）。

可是因每次一段只有 64 KB，这样访问就很不方便，须要不断的更换段基地址，因而 80286 很快就被淘汰，换上了 80386。

这是 Intel 第一代 32 位处理器。

除了段寄存器仍是 16 位以外，地址总线和寄存器都是 32 位，这就意味着之前为了寻址搞的段机制其实没用了。

由于单单段内偏移就能够访问到 4GB 空间，可是为了向前兼容段机制仍是保留了下来，段寄存器仍是 16 位是由于够用了，因此不必扩充。

不过上有政策，下有对策。

虽然说段机制保留了，可是咱能够“忽悠”着用，把段基值都设置为 0 ，就用段内偏移地址来访问内存空间就行了。

这其实就意味着每一个段的起始地址都是同样的，那就等于不分段了，这就叫平坦模式。

Linux 就是这样实现的。

那为何要分页？

由于分段粒度太粗了，致使内存碎片大，不利于管理。

当时加载到内存等于一个段都得搞到内存中，而段的范围过大，举个例子。

假设此时你有 200M 内存，此时有 3 个应用在运行，分别是 LOL、chrome、微信。

此时内存中明明有 30MB 的空闲，可是网易云加载不进来，这内存碎片就有点大了。

而后就得把 chrome 先换到磁盘中，而后再让 chrome 加载进来到微信的后面，这样空闲的 30MB 就连续了，因而网易云就能加载到内存中了。

可是这样等于要把 50MB 的内存来个反复横跳，磁盘的访问太慢了，因此效率就很低。

整体而言能够认为分段内存的管理粒度太粗了，因此随着 80386 就出来了个分页管理，一个更加精细化的内存管理方式。

简单地说就是把内存等分红一页一页，每页 4KB 大小，按页为单位来管理内存。

你看按一页一页来管理这样就不用把一段程序都加载进内存，只须要将用到的页加载进内存。

这样内存的利用率就更高了，能同时运行的程序就更多了。

而且因为一页就 4KB，因此内存交换的性能问题得以缓解，毕竟只要换必定的页，而不须要整个段都换到磁盘中。

对应的还有个虚拟内存的概念。

分页机制构造了一个虚拟内存空间，让每一个进程误觉得本身掌控全部的内存。

再具体一点就是每一个进程都有一个页表，页表中有物理页号和属性，这样寻址的时候经过页表就能利用虚拟地址找到对应的物理地址。

属性用来作权限的一些管理。

就理解为进程想要内存中的任意一个地址都行，没问题，反正背地里偷偷的会换成能够用的物理内存地址。

若是物理内存满了也没事，把不经常使用的内存页先换到磁盘中，即 swap，腾出空间来就行了，到时候要用再换到内存中。

上面提到的虚拟地址也叫线性地址，简单地说就是经过绕不开的段机制获得线性地址，而后再经过分页机制转化获得物理地址。

最后

至此咱们已经知晓了为何有分段，又有分页，还有段页式。

一开始限于技术和成本因此寄存器的位数不够，所以为了扩大寻址范围搞了个分段访问内存。

而随后技术起来了，位数都扩充了，寄存器其实已经能够访问所有内存空间了，因此分段已经没用了。

可是为了向前兼容仍是保留着分段访问的形式，而且随着软件的发展，同时运行各类进程的需求愈加强烈。

为了更好的管理内存，提升内存的利用率和内存交互性能引入了分页管理。

因此就变成了先分段，而后再分页的段页式。

固然也能够和 Linux 那样让每一段的基地址都设为 0 ，这样就等于“绕开”了段机制。

至此今天的内容就差很少了，这篇文章没有深刻具体的分段和分页的细节，以后再做一篇文章来阐述细节。

欢迎关注个人公众号【yes的练级攻略】，更多硬核文章等你来读。

更多文章可看个人文章汇总：https://github.com/yessimida/yes 欢迎 star !

我是 yes，从一点点到亿点点，欢迎在看、转发、留言，咱们下篇见。

本文分享自微信公众号 - yes的练级攻略（yes_java）。
若有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一块儿分享。