Java 中最大的数据结构：LinkedHashMap 了解一下？

时间 2019-11-24

标签 java 最大数据结构 linkedhashmap 了解一下栏目 Java 繁體版

原文原文链接

前言

Map 家族数量众多，其中 HashMap 和 ConcurrentHashMap 用的最多，而 LinkedHashMap 彷佛则是不怎么用的，可是他却有着顺序。两种，一种是添加顺序，一种是访问顺序。java

详情

LinkedHashMap 继承了 HashMap。那么若是是你，你怎么实现这两个顺序呢？node

若是实现添加顺序的话，咱们能够在该类中，增长一个链表，每一个节点对应 hash 表中的桶。这样，循环遍历的时候，就能够按照链表遍历了。只是会增大内存消耗。算法

若是实现访问顺序的话，一样也可使用链表，但每次读取数据时，都须要更新一下链表，将最近一次读取的放到链尾。这样也就可以实现。此时也能够跟进这个特性实现 LRU（Least Recently Used）缓存。缓存

如何使用？

下面是个小 demo安全

LinkedHashMap<Integer, Integer> map = new LinkedHashMap<>(16, 0.75f, true);
for (int i = 0; i < 10; i++) {
  map.put(i, i);
}

for (Map.Entry entry : map.entrySet()) {
  System.out.println(entry.getKey() + ":" + entry.getValue());
}
map.get(3);
System.out.println();
for (Map.Entry entry : map.entrySet()) {
  System.out.println(entry.getKey() + ":" + entry.getValue());
}
复制代码

打印结果：并发

0:0
1:1
2:2
3:3
4:4
5:5
6:6
7:7
8:8
9:9

0:0
1:1
2:2
4:4
5:5
6:6
7:7
8:8
9:9
3:3
复制代码

首先构造方法是有意思的，比 HashMap 多了一个 accessOrder boolean 参数。表示，按照访问顺序来排序。最新访问的放在链表尾部。性能

若是是默认的，则是按照添加顺序，即 accessOrder 默认是 false。spa

源码实现

若是看 LinkedHashMap 内部源码，会发现，内部确实维护了一个链表：code

/** * 双向链表的头，最久访问的 */
    transient LinkedHashMap.Entry<K,V> head;

    /** * 双向链表的尾，最新访问的 */
    transient LinkedHashMap.Entry<K,V> tail;
复制代码

而这个 LinkedHashMap.Entry 内部也维护了双向链表必须的元素，before，after：orm

/** * HashMap.Node subclass for normal LinkedHashMap entries. */
    static class Entry<K,V> extends HashMap.Node<K,V> {
        Entry<K,V> before, after;
        Entry(int hash, K key, V value, Node<K,V> next) {
            super(hash, key, value, next);
        }
    }
复制代码

在添加元素的时候，会追加到尾部。

Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
        LinkedHashMap.Entry<K,V> p =
            new LinkedHashMap.Entry<K,V>(hash, key, value, e);
        linkNodeLast(p);
        return p;
    }

    // link at the end of list
    private void linkNodeLast(LinkedHashMap.Entry<K,V> p) {
        LinkedHashMap.Entry<K,V> last = tail;
        tail = p;
        if (last == null)
            head = p;
        else {
            p.before = last;
            last.after = p;
        }
    }
复制代码

在 get 的时候，会根据 accessOrder 属性，修改链表顺序：

public V get(Object key) {
        Node<K,V> e;
        if ((e = getNode(hash(key), key)) == null)
            return null;
        if (accessOrder)
            afterNodeAccess(e);
        return e.value;
    }

    void afterNodeAccess(Node<K,V> e) { // move node to last
        LinkedHashMap.Entry<K,V> last;
        if (accessOrder && (last = tail) != e) {
            LinkedHashMap.Entry<K,V> p =
                (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
            p.after = null;
            if (b == null)
                head = a;
            else
                b.after = a;
            if (a != null)
                a.before = b;
            else
                last = b;
            if (last == null)
                head = p;
            else {
                p.before = last;
                last.after = p;
            }
            tail = p;
            ++modCount;
        }
    }
复制代码

同时注意：这里修改了 modCount，即便是读操做，并发也是不安全的。

如何实现 LRU 缓存？

LRU 缓存：LRU（Least Recently Used，最近最少使用）算法根据数据的历史访问记录来进行淘汰数据，其核心思想是“若是数据最近被访问过，那么未来被访问的概率也更高”。

LinkedHashMap 并无帮我咱们实现具体，须要咱们本身实现。具体实现方法是 removeEldestEntry 方法。

一块儿来看看原理。

首先，HashMap 在 putVal 方法最后，会调用 afterNodeInsertion 方法，其实就是留给 LinkedHashMap 的。而 LinkedHashMap 的具体实现则是根据一些条件，判断是否须要删除 head 节点。

源码以下：

void afterNodeInsertion(boolean evict) { // possibly remove eldest
        LinkedHashMap.Entry<K,V> first;
        if (evict && (first = head) != null && removeEldestEntry(first)) {
            K key = first.key;
            removeNode(hash(key), key, null, false, true);
        }
    }
复制代码

evict 参数表示是否须要删除某个元素，而这个 if 判断须要知足的条件如上：head 不能是 null，调用 removeEldestEntry 方法，返回 true 的话，就删除这个 head。而这个方法默认是返回 false 的，等待着你来重写。

因此，removeEldestEntry 方法的实现一般是这样：

public boolean removeEldestEntry(Map.Entry<K, V> eldest){    
   return size() > capacity;  
} 
复制代码

若是长度大于容量了，那么就须要清除不常常访问的缓存了。afterNodeInsertion 会调用 removeNode 方法，删除掉 head 节点 —— 若是 accessOrder 是 true 的话，这个节点就是最不常常访问的节点。

拾遗

LinkedHashMap 重写了一些 HashMap 的方法，例如 containsValue 方法，这个方法你们猜一猜，怎么重写比较合理？

HashMap 使用了双重循环，先循环外层的 hash 表，再循环内层的 entry 链表。性能可想而知。

但 LinkedHashMap 内部有个元素链表，直接遍历链表就行。相对而言而高不少。

public boolean containsValue(Object value) {
        for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after) {
            V v = e.value;
            if (v == value || (value != null && value.equals(v)))
                return true;
        }
        return false;
    }
复制代码

这也算一种空间换时间的策略吧。

get 方法固然也是要重写的。由于须要根据 accessOrder 更新链表。

总结

雪薇的总结的一下：

LinkedHashMap 内部包含一个双向链表维护顺序，支持两种顺序——添加顺序，访问顺序。

默认就是按照添加顺序来的，若是要改为访问顺序的话，构造方法中的 accessOrder 须要设置成 true。这样，每次调用 get 方法，就会将刚刚访问的元素更新到链表尾部。

关于 LRU，在accessOrder 为 true 的模式下，你能够重写 removeEldestEntry 方法，返回 size() > capacity，这样，就能够删除最不常访问的元素。