HashMap 有一个不足之处就是在迭代元素时与插入顺序不一致。而大多数人都喜欢按顺序作某些事情,因此,LinkedHashMap 就是针对这一点对 HashMap 进行扩展,主要新增了「两种迭代方式」:java
LinkedHashMap 的重点就是这两点,搞清楚了,也就掌握了。因为它继承自 HashMap,因此在分析源码以前必定要先看看 HashMap 的源码,可查看此文《深刻分析 JDK8 中 HashMap 的原理、实现和优化》。数组
在 JDK 8 中,由于 LinkedHashMap 子类的存在,HashMap 引入的红黑树,在普通模式和树模式之间的转换变得复杂,那么它是如何设计和简化的呢?接下来看看 JDK 8 中的 LinkedHashMap 源码的设计和实现。缓存
HashMap 为何在迭代时就杂乱无章了?看下它在迭代时获取下一个元素的方式,你就明白了:安全
final Node<K,V> nextNode() { Node<K,V>[] t; Node<K,V> e = next; // 下一个元素要访问节点 if (modCount != expectedModCount) throw new ConcurrentModificationException(); if (e == null) throw new NoSuchElementException(); // 首先迭代自身所在链表 if ((next = (current = e).next) == null && (t = table) != null) { // 若是链表访问结束,遍历哈希桶数组中下一个非空元素 do {} while (index < t.length && (next = t[index++]) == null); } return e; }
能够看到,HashMap 是按照哈希桶数组中非空的槽依次遍历的,再加上哈希冲突(链表)的状况,与插入顺序相比,更加乱了。数据结构
那 LinkedHashMap 怎么解决的?它维护了一个贯穿全部元素的双向链表,遍历时,迭代器直接对双向链表进行迭代,从而保证了与插入顺序一致,关键成员属性和节点信息定义以下:优化
// 双向链表头节点,也是最久没有访问的元素 transient LinkedHashMap.Entry<K,V> head; // 双向链表尾节点,也是最近刚刚访问的元素 transient LinkedHashMap.Entry<K,V> tail; // 迭代方式,true-按访问顺序迭代,false-按插入顺序迭代,默认 false final boolean accessOrder; // 添加了构建双向链表的前驱和后继指针 static class Entry<K,V> extends HashMap.Node<K,V> { Entry<K,V> before, after; Entry(int hash, K key, V value, Node<K,V> next) { super(hash, key, value, next); } }
HashMap 在元素插入、删除和访问时定义并调用了一些 Hook 方法,这些方法使得 LinkedHashMap 内部保持有序的机制相对独立,下降了普通模式和树模式转换的复杂度。线程
此外,红黑树节点继承的是 LinkedHashMap 的 Entry,当然可能多了两个指针,但在实现时有助于避免操做指针出现混淆错误。设计
LinkedHashMap 在元素插入时,覆盖的回调方法主要有 newNode, replacementNode, replacementTreeNode, newTreeNode,主要就是保持双向链表,核心是下面两个方法:指针
// 插入到双向链表的尾部 private void linkNodeLast(LinkedHashMap.Entry<K,V> p) { LinkedHashMap.Entry<K,V> last = tail; // 临时记住尾节点 tail = p; // 将尾指针指向新节点 if (last == null) head = p; // 第一个插入的节点 else { // 关联先后节点 p.before = last; last.after = p; } } // 链接两个节点之间的先后指针 private void transferLinks(LinkedHashMap.Entry<K,V> src, LinkedHashMap.Entry<K,V> dst) { LinkedHashMap.Entry<K,V> b = dst.before = src.before; LinkedHashMap.Entry<K,V> a = dst.after = src.after; if (b == null) head = dst; else b.after = dst; if (a == null) tail = dst; else a.before = dst; }
迭代器的实现就比较简单了,直接对这个双向链表迭代便可,此时的迭代顺序就插入顺序。code
为了让元素按访问顺序排列,HashMap 定义了如下 Hook 方法,供 LinkedHashMap 实现:
void afterNodeAccess(Node<K,V> p) { } void afterNodeInsertion(boolean evict) { } void afterNodeRemoval(Node<K,V> p) { }
各个方法实现的原理以下:
重点看下插入以后的实现:
void afterNodeInsertion(boolean evict) { // possibly remove eldest LinkedHashMap.Entry<K,V> first; if (evict && (first = head) != null && removeEldestEntry(first)) { K key = first.key; removeNode(hash(key), key, null, false, true); } }
是否会删除头节点,是由 removeEldestEntry 方法决定的,默认返回 false。在覆盖这个方法时,不能简单的返回 true,由于这样可能会致使一个空的 LinkedHashMap,一般的作法是在插入指定数量的元素后再删除,具体见下面 LRU 缓存的实现。
借助 LinkedHashMap 能够很方便的实现一个 LRU 缓存数据结构,只需设置 accessOrder 为 true,并覆盖 removeEldestEntry 方法便可,代码以下:
final int MAX_CACHE_SIZE = 100; LinkedHashMap<Object, Object> lru = new LinkedHashMap<Object, Object>(MAX_CACHE_SIZE, 0.75f, true) { private static final long serialVersionUID = 1L; protected boolean removeEldestEntry(Map.Entry<Object, Object> eldest) { return size() > MAX_CACHE_SIZE; } };
LinkedHashMap 代码比较简单,难的都被 HashMap 实现了:),它们的异同点分别以下:
看这个类的源码,最主要的仍是看 HashMap 定义 Hook 方法,使得 LinkedHashMap 保持有序的机制相对独立的设计,这是模板模式的应用。