Map 家族数量众多,其中 HashMap 和 ConcurrentHashMap 用的最多,而 LinkedHashMap 彷佛则是不怎么用的,可是他却有着顺序。两种,一种是添加顺序,一种是访问顺序。java
LinkedHashMap 继承了 HashMap。那么若是是你,你怎么实现这两个顺序呢?node
若是实现添加顺序的话,咱们能够在该类中,增长一个链表,每一个节点对应 hash 表中的桶。这样,循环遍历的时候,就能够按照链表遍历了。只是会增大内存消耗。算法
若是实现访问顺序的话,一样也可使用链表,但每次读取数据时,都须要更新一下链表,将最近一次读取的放到链尾。这样也就可以实现。此时也能够跟进这个特性实现 LRU(Least Recently Used) 缓存。缓存
下面是个小 demo安全
LinkedHashMap<Integer, Integer> map = new LinkedHashMap<>(16, 0.75f, true);
for (int i = 0; i < 10; i++) {
map.put(i, i);
}
for (Map.Entry entry : map.entrySet()) {
System.out.println(entry.getKey() + ":" + entry.getValue());
}
map.get(3);
System.out.println();
for (Map.Entry entry : map.entrySet()) {
System.out.println(entry.getKey() + ":" + entry.getValue());
}
复制代码
打印结果:并发
0:0
1:1
2:2
3:3
4:4
5:5
6:6
7:7
8:8
9:9
0:0
1:1
2:2
4:4
5:5
6:6
7:7
8:8
9:9
3:3
复制代码
首先构造方法是有意思的,比 HashMap 多了一个 accessOrder boolean 参数。表示,按照访问顺序来排序。最新访问的放在链表尾部。性能
若是是默认的,则是按照添加顺序,即 accessOrder 默认是 false。spa
若是看 LinkedHashMap 内部源码,会发现,内部确实维护了一个链表:code
/** * 双向链表的头,最久访问的 */
transient LinkedHashMap.Entry<K,V> head;
/** * 双向链表的尾,最新访问的 */
transient LinkedHashMap.Entry<K,V> tail;
复制代码
而这个 LinkedHashMap.Entry 内部也维护了双向链表必须的元素,before,after:orm
/** * HashMap.Node subclass for normal LinkedHashMap entries. */
static class Entry<K,V> extends HashMap.Node<K,V> {
Entry<K,V> before, after;
Entry(int hash, K key, V value, Node<K,V> next) {
super(hash, key, value, next);
}
}
复制代码
在添加元素的时候,会追加到尾部。
Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
LinkedHashMap.Entry<K,V> p =
new LinkedHashMap.Entry<K,V>(hash, key, value, e);
linkNodeLast(p);
return p;
}
// link at the end of list
private void linkNodeLast(LinkedHashMap.Entry<K,V> p) {
LinkedHashMap.Entry<K,V> last = tail;
tail = p;
if (last == null)
head = p;
else {
p.before = last;
last.after = p;
}
}
复制代码
在 get 的时候,会根据 accessOrder 属性,修改链表顺序:
public V get(Object key) {
Node<K,V> e;
if ((e = getNode(hash(key), key)) == null)
return null;
if (accessOrder)
afterNodeAccess(e);
return e.value;
}
void afterNodeAccess(Node<K,V> e) { // move node to last
LinkedHashMap.Entry<K,V> last;
if (accessOrder && (last = tail) != e) {
LinkedHashMap.Entry<K,V> p =
(LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
p.after = null;
if (b == null)
head = a;
else
b.after = a;
if (a != null)
a.before = b;
else
last = b;
if (last == null)
head = p;
else {
p.before = last;
last.after = p;
}
tail = p;
++modCount;
}
}
复制代码
同时注意:这里修改了 modCount,即便是读操做,并发也是不安全的。
LRU 缓存:LRU(Least Recently Used,最近最少使用)算法根据数据的历史访问记录来进行淘汰数据,其核心思想是“若是数据最近被访问过,那么未来被访问的概率也更高”。
LinkedHashMap 并无帮我咱们实现具体,须要咱们本身实现 。具体实现方法是 removeEldestEntry 方法。
一块儿来看看原理。
首先,HashMap 在 putVal 方法最后,会调用 afterNodeInsertion 方法,其实就是留给 LinkedHashMap 的。而 LinkedHashMap 的具体实现则是根据一些条件,判断是否须要删除 head 节点。
源码以下:
void afterNodeInsertion(boolean evict) { // possibly remove eldest
LinkedHashMap.Entry<K,V> first;
if (evict && (first = head) != null && removeEldestEntry(first)) {
K key = first.key;
removeNode(hash(key), key, null, false, true);
}
}
复制代码
evict 参数表示是否须要删除某个元素
,而这个 if 判断须要知足的条件如上:head 不能是 null,调用 removeEldestEntry 方法,返回 true 的话,就删除这个 head。而这个方法默认是返回 false 的,等待着你来重写。
因此,removeEldestEntry 方法的实现一般是这样:
public boolean removeEldestEntry(Map.Entry<K, V> eldest){
return size() > capacity;
}
复制代码
若是长度大于容量了,那么就须要清除不常常访问的缓存了。afterNodeInsertion 会调用 removeNode 方法,删除掉 head 节点 —— 若是 accessOrder 是 true 的话,这个节点就是最不常常访问的节点。
LinkedHashMap 重写了一些 HashMap 的方法,例如 containsValue 方法,这个方法你们猜一猜,怎么重写比较合理?
HashMap 使用了双重循环,先循环外层的 hash 表,再循环内层的 entry 链表。性能可想而知。
但 LinkedHashMap 内部有个元素链表,直接遍历链表就行。相对而言而高不少。
public boolean containsValue(Object value) {
for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after) {
V v = e.value;
if (v == value || (value != null && value.equals(v)))
return true;
}
return false;
}
复制代码
这也算一种空间换时间的策略吧。
get 方法固然也是要重写的。由于须要根据 accessOrder 更新链表。
雪薇的总结的一下:
LinkedHashMap 内部包含一个双向链表维护顺序,支持两种顺序——添加顺序,访问顺序。
默认就是按照添加顺序来的,若是要改为访问顺序的话,构造方法中的 accessOrder 须要设置成 true。这样,每次调用 get 方法,就会将刚刚访问的元素更新到链表尾部。
关于 LRU,在accessOrder 为 true 的模式下,你能够重写 removeEldestEntry 方法,返回 size() > capacity
,这样,就能够删除最不常访问的元素。