漫谈计算机组成原理（五）高速缓冲存储器

时间 2019-11-17

标签漫谈计算机组成原理高速缓冲存储器繁體版

原文原文链接

本文讲什么？

老样子，在正式开始介绍“高速缓冲存储器”以前，咱们先来了解一下其相关的信息。缓存

我相信，上面这张图你必定已经很是熟悉了，没错，这就是在本章绪论说的“存储器的层次结构”。上一讲咱们介绍了存储层次结构中的L4，即主存。继续向上看，你会看到L三、L二、L1都是高速缓冲存储器。那么究竟什么是高速缓冲存储器呢？那就要从“速度”这个关键词提及。随着计算机硬件行业的不断进步，以因特尔为首的芯片企业造出了一代又一代的高速CPU，能够说CPU处理数据的速度是愈来愈快。可是从图中咱们可以看到，L0-L6的设备的速度是逐渐降低的，并且速度相差愈来愈大。虽说近年来的存储技术也有进步，可是照着CPU就差远了。这就形成了CPU和主存之间速度差距愈来愈大。高速缓冲存储器的存在就是为了尽量的消除这种差距。在这个存储层次结构中，虽然高速缓冲存储器分为三个档次，可是他们的做用都是相同的，都是起到一种桥梁的做用，不一样的只是速度和造价。此外，L1的速度几乎和寄存器的速度相同。接下来，咱们来看看高速缓冲存储器在CPU中的具体位置。微信

这种结构进一步的验证了存储器的层次结构——高速缓冲存储器位于寄存器之下的特色。好了，说了这么多，那让咱们来看看高速缓冲存储器的工做原理吧！设计

高速缓冲存储器(Cache)的工做原理

实际上，Cache的工做原理很是简单，就是利用了映射的方式来获取主存信息。咱们知道，主存的地址范围是2^n（即2^n个字），而每一个字都有一个n位的地址。（不明白的能够翻翻这个系列的前几篇文章）。所谓映射，就是两个元素之间的对应关系。而咱们很清楚，主存的容量确定是远远大于高速缓冲存储器的。因此，这种映射必然是一对多的关系，某部分高速缓冲存储器中的内容对应着主存中的的吧部份内容。为了实现上面所说的映射，咱们须要对主存和缓存进行块的划分，使这些“字块”实现一对多的映射关系。简略图以下：能够看见，咱们将主存和缓存划分红了一个又一个的字块，从而实现映射关系。3d

CPU想要处理信息，首先就是看缓存（高速缓冲存储器）中是否存在信息，若是存在，那么好，就从缓存中读入一个字（一个字块可能包括多个字）；若是缓存中没有数据，那么就会根据这种映射关系，将主存中的数据一个字块一个字块地映射到相应的位置，而后再由CPU进行读取便可。这里有一个名词，叫作缓存命中和缓存不命中。上面说的两种状况中的第一种就是缓存命中，然后一种就是缓存不命中。命中率是衡量缓存的效率的。命中率越高，效率越好。命中率=缓存命中/（缓存命中+缓存不命中）。cdn

上面说的例子，能够理解为映射中的第一种方式——直接相连映射。下面咱们就来详细的了解一下映射方式。blog

主存——高速缓冲存储器之间的映射方式

直接映射

下图给出了直接映射的示意图： it

直接相连映射能够说是一种最简单的方法，为何这样说呢，由于他的逻辑最为清晰、也是最好理解的一种映射方式。你可能会说，这么复杂的一个图你跟我说这是最简单的方法，你怕不是个傻子吧！不要急，听我慢慢说。首先，先看Cache，Cache被分红了2^c 块，而主存则被分红了n*2^c, n就是n组，从图中的链接线能够很直观的看出，主存中的字块0~2^c-1 块对应着Cache中的0~2^c-1 块。而主存中的2^c 块则是对应着Cache中的第0块，依次类推。即主存中的每一组字块对应着Cache中的相应字块。 好了，对应关系说完了，咱们来解释一下图中的其余内容。首先说标记，标记表明的意义就是当前Cache字块中的数据是否有效。能够这样想，咱们以前讲了缓存命中和缓存不命中，当CPU向缓存推送地址，说“我想拿到Cache中字块0上的数据”，那么好，Cache首先要看看字块0上的标记位是否为1，若是是1，就把这个数据给CPU，这就叫缓存命中；若是标记位为0，则说明此时Cache上的数据无效，则不推送，这就叫作缓存不命中。你可能会这样想：Cache上的数据不都是从主存上拿到的吗，为何还会有无效的时候呢？这样的例子很多，好比说Cache刚通电的那一瞬间，这时候Cache上面是没有数据的，标记位的0就起了很大做用。若是发现是0的话，接着主存会向Cache推送数据的，这一点没必要担忧。看到这，我相信你确定也知道比较器是个什么玩意了。io

全相联映射

若是说直接相连映射是最简单的方法的话，那么全相连映射就是一种最粗暴的映射方式。仍是先看图： class

我相信你此时必定知道我为啥说这是一种至关粗暴的映射方式了，没错，看到那交错纵横的线，一开始我是拒绝的，这货太暴力了。标记位天然是不用说，主要是这货的主存不分组，主存中的任何一个字块均可以映射到Cache中的任何一个字块，因此看起来十分的凌乱。可是仍是有好处的，你看直接映射，好比说主存仍是分红n组，也就是说Cache中的每个字块都有n个主存中的字块对应，且主存中的字块只能对应Cache中的一个字块。因此说，若是Cache中的数据没有失效的时候，主存中的其余的n-1个字块都是须要等待的。可是全相联映射不一样——主存中的字块能够对应任何一个Cache中的字块，也就是说，若是主存想要向Cache推送数据，只须要挑一个失效的地方，将原有数据覆盖便可。这种方式比较混乱，电路可能会很复杂，同时又会形成较高的成本。效率

组相联映射

计算机组成原理颇有意思，你会发现，在计算机结构的设计方案中，通常都是这样的：有一种比较简单的方案，可是效率并不怎么好，而后有一种效率很好的方案可是可能过于复杂，接着就会出现第三种方案，通常这种方案都是以上两者的折中。在有效的消除了两者的缺点的同时，又极大的利用了两者的优势，不得不感叹这些科学家的聪明才智。

首先说对应方式，组相联的映射方式和直接相连的映射方式相同，都是主存中的每一组字块中的每个字块对应着Cache中的一个相应字块，可是有不一样之处在于，Cache中的字块分红了两组，这种方式也叫作二路组相联。其次说下这种链接方式的优势：能够看到，在二路组相联中，除非是Cache中每块的两组字块都被占用了，不然不存在冲突的问题，这大大提升了效率，同时又没有全相联那种暴力的方式。

总结

本文详细的讨论了Cache的工做原理及三种映射方式，但愿对你们有所帮助。若是你喜欢个人文章，请帮忙点赞；若是你对本文内容存在疑问，请留言告诉我。您的点赞和留言是对原创做者的最大支持，感谢您的阅读。此外，本人一直在寻找志同道合的小伙伴，一样如此的能够邮件联系我：roobtyan@outlook.com. 本人微信公众号：