链表(上)—— LRU 缓存淘汰算法的实现

经典的链表应用场景就是 LRU 缓存淘汰算法。算法

1. 链表结构

数组须要一块连续的内存空间来存储,对内存的要求比较高。而链表不须要,它经过“指针”将一组零散的内存块串联起来使用。数组

三种常见的链表结构:单链表双向链表循环链表缓存

**单链表:**头结点记录链表的基地址,能够用来遍历整条链表。尾结点的指针指向空地址 NULL,表示最后的结点。每一个结点存储数据 data 和后继指针 next,以下:性能

针对链表的插入和删除操做,只须要考虑相邻结点的指针改变,因此对应的时间复杂度是 O(1)。可是,随机访问须要从头结点开始遍历,因此时间复杂度是 O(n)。优化

循环链表是一种特殊的单链表,它的尾结点指针指向链表的头结点,优势是从链尾到链头比较方便。当要处理的数据具备环型结构特色时,就特别适合采用循环链表,好比约瑟夫问题。设计

双向链表支持两个方向,每一个结点有个后继指针 next 指向后面的结点和一个前驱指针 prev 指向前面的结点。它支持双向遍历,带来了操做的灵活性。双向链表能够支持 O(1) 时间复杂度的状况下找到前驱结点,这使得它在某些状况下的插入、删除等操做比单链表简单高效。对于一个有序链表,双向链表的按值查询的效率也要比单链表高一些。指针

在实际的软件开发中,双向链表尽管比较费内存,但比单链表的应用更加普遍。Java 语言中的 LinkedHashMap 就用到了双向链表,这是用空间换时间的设计思想。orm

2. 链表、数组性能比较

时间复杂度 数组 链表
插入、删除 O(n) O(1)
随机访问 O(1) O(n)

数组简单易用,在实现上使用的是连续的内存空间,能够借助 CPU 的缓存机制,预读数组中的数据,因此访问效率更高。而链表在内存中并非连续存储,因此对 CPU 缓存不友好,没办法有效预读。(此处是局部性原理)cdn

数组的缺点是大小固定,要占用整块连续内存空间。若是数组过大,容易致使 OOM。扩容时须要拷贝数组,很是耗时。链表自己没有大小的限制,自然地支持动态扩容。blog

若是代码对内存的使用很是苛刻,那数组就是更适合的选择。链表须要额外存储指针结点,频繁的增删操做容易形成内存碎片,若是用 Java 语言,就可能致使频繁 GC。

如何用链表实现 LRU 缓存呢?

维护一个有序单链表,靠近尾部的结点是最先访问的。当有数据被访问时,从头开始遍历链表。

  1. 若是数据被缓存过,遍历获得对应的结点,把它从原来位置删除,插入到链表头部。
  2. 若是没有缓存过,那么分两种状况:
    • 若是缓存没满,那么直接把新数据插入链表尾部;
    • 若是缓存已满,那么把尾结点删除,新数据插入链表头部。

基于链表的实现思路,缓存访问的时间复杂度为 O(n)。考虑一下优化,好比引入散列表老记录每一个数据的位置,使访问时间复杂度降到 O(1)。

思考题:

如何判断一个字符串是不是回文字符串?若是字符串是经过单链表来存储的,那该如何来判断是一个回文串呢?