链表（上）—— LRU 缓存淘汰算法的实现

时间 2019-11-07

标签链表 lru 缓存淘汰算法实现繁體版

原文原文链接

经典的链表应用场景就是 LRU 缓存淘汰算法。算法

1. 链表结构

数组须要一块连续的内存空间来存储，对内存的要求比较高。而链表不须要，它经过“指针”将一组零散的内存块串联起来使用。数组

三种常见的链表结构：单链表、双向链表和循环链表。缓存

**单链表：**头结点记录链表的基地址，能够用来遍历整条链表。尾结点的指针指向空地址 NULL，表示最后的结点。每一个结点存储数据 data 和后继指针 next，以下：性能

针对链表的插入和删除操做，只须要考虑相邻结点的指针改变，因此对应的时间复杂度是 O(1)。可是，随机访问须要从头结点开始遍历，因此时间复杂度是 O(n)。优化

循环链表是一种特殊的单链表，它的尾结点指针指向链表的头结点，优势是从链尾到链头比较方便。当要处理的数据具备环型结构特色时，就特别适合采用循环链表，好比约瑟夫问题。设计

双向链表支持两个方向，每一个结点有个后继指针 next 指向后面的结点和一个前驱指针 prev 指向前面的结点。它支持双向遍历，带来了操做的灵活性。双向链表能够支持 O(1) 时间复杂度的状况下找到前驱结点，这使得它在某些状况下的插入、删除等操做比单链表简单高效。对于一个有序链表，双向链表的按值查询的效率也要比单链表高一些。指针

在实际的软件开发中，双向链表尽管比较费内存，但比单链表的应用更加普遍。Java 语言中的 LinkedHashMap 就用到了双向链表，这是用空间换时间的设计思想。orm

2. 链表、数组性能比较

时间复杂度	数组	链表
插入、删除	O(n)	O(1)
随机访问	O(1)	O(n)

数组简单易用，在实现上使用的是连续的内存空间，能够借助 CPU 的缓存机制，预读数组中的数据，因此访问效率更高。而链表在内存中并非连续存储，因此对 CPU 缓存不友好，没办法有效预读。（此处是局部性原理）cdn

数组的缺点是大小固定，要占用整块连续内存空间。若是数组过大，容易致使 OOM。扩容时须要拷贝数组，很是耗时。链表自己没有大小的限制，自然地支持动态扩容。blog

若是代码对内存的使用很是苛刻，那数组就是更适合的选择。链表须要额外存储指针结点，频繁的增删操做容易形成内存碎片，若是用 Java 语言，就可能致使频繁 GC。

如何用链表实现 LRU 缓存呢？

维护一个有序单链表，靠近尾部的结点是最先访问的。当有数据被访问时，从头开始遍历链表。

若是数据被缓存过，遍历获得对应的结点，把它从原来位置删除，插入到链表头部。
若是没有缓存过，那么分两种状况：
- 若是缓存没满，那么直接把新数据插入链表尾部；
- 若是缓存已满，那么把尾结点删除，新数据插入链表头部。

基于链表的实现思路，缓存访问的时间复杂度为 O(n)。考虑一下优化，好比引入散列表老记录每一个数据的位置，使访问时间复杂度降到 O(1)。

思考题：

如何判断一个字符串是不是回文字符串？若是字符串是经过单链表来存储的，那该如何来判断是一个回文串呢？