HashMap扩容死循环问题

时间 2019-11-17

标签 hashmap 扩容循环问题繁體版

原文原文链接

原文：http://www.javashuo.com/article/p-vuavzojo-en.htmljava

下面咱们来模拟一下多线程场景下扩容会出现的问题：安全

假设在扩容过程当中旧hash桶中有一个单链表，单链表中只有一个节点A，也就是e引用的对象。新hash桶中有一个单链表，单链表中的节点是B->C，也就是newTable[i]引用的对象。多线程

单线程扩容
若是只有一个线程在执行扩容：
- 执行到第 3 行next = e.next的时候next == null
- 从第 5 行到第 9 行会将A节点按照头插法插入到newTable[i]所引用的单链表中，此时newTable[i]所引用的单链表中的节点是A->B->C
- 第 11 行e = next会将next赋值给e，因此e == null
- 这时候循环就结束了，整个扩容过程当中毫无问题dom

多线程扩容
若是是多个线程同时在扩容，咱们以T1线程的扩容过程为主视角，T2和T3线程只是会在T1线程扩容过程当中捣乱的：
- T1线程执行到第 7 行e.next = newTable[i]的时候会使得 e.next == B
- 此时T2线程过来捣乱了，执行到第 3 行next = e.next，那么会使得next == B，此时T2线程的使命结束了，下面不去考虑T2线程了
- T1线程执行到第 9 行newTable[i] = e的时候，使用头插法将A插入到newTable[i]所引用的单链表中，此时newTable[i]所引用的单链表中的节点是A->B->C
- T1线程继续执行到 11 行e = next，将使得e == B，因为e != null，因此循环将继续
- T1线程开启新的一轮循环，执行到第 3 行next = e.next的时候由于B.next == C，因此next == C
- 因为e == B，newTable[i] == A，当T1线程执行到第 7 行e.next = newTable[i]的时候，将致使A.next == B， B.next == Aide

当执行到这一步的时候，你们会发现好像看见了一个环，离真相愈来愈近了，下面咱们两种状况来继续执行下去：this

没有T3线程介入，致使get请求死循环
T1线程继续向下执行到第 11 行e = next，将使得e == C，将继续进行下一轮循环
T1在这一轮新的循环中没有其余线程介入，这一轮执行完毕以后将跳出循环，而此时newTable[i]所引用的单链表会造成一个闭环 spa

这时候若是用户发送一个get(A)的请求，将致使get请求发生死循环
有T3线程介入，致使T1线程扩容过程发生死循环
当T1线程执行到第 7 行e.next = newTable[i]的时候会使得 e.next == A
此时T3线程过来捣乱了，执行到第 3 行next = e.next，那么会使得next == A，此时T3线程的使命结束了，下面不去考虑T2线程了
此时A.next == B， B.next == A， next == A，T1线程继续往下执行next指针会在A和B之间无线循环，致使T1扩容过程当中发生死循环
.net

扩容死循环代码示例

import java.util.HashMap;
import java.util.Map;
import java.util.UUID;

public class HashMapTest {

    public static void main(String[] args) throws Exception {
        HashMap<String,String> map = new HashMap<String, String>();
        TestDeadLock t1 = new TestDeadLock(map);
        t1.start();
        TestDeadLock t2 = new TestDeadLock(map);
        t2.start();
        TestDeadLock t3 = new TestDeadLock(map);
        t3.start();
    }
}

class TestDeadLock extends Thread {

    private HashMap<String,String> map;

    public TestDeadLock(HashMap<String, String> map) {
        super();
        this.map = map;
    }

    @Override
    public void run() {
        for (int i = 0; i<500000; i++) {
            map.put(UUID.randomUUID().toString(), UUID.randomUUID().toString());
            System.out.println("Running ~~");
        }
    }
}

main方法执行到一半后不会再打印”Running ~~”，而且方法不会执行结束，因此判断扩容过程形成死循环了。线程

JDK 1.7 HashMap扩容致使死循环的主要缘由
HashMap扩容致使死循环的主要缘由在于扩容后链表中的节点在新的hash桶使用头插法插入。指针

新的hash桶会倒置原hash桶中的单链表，那么在多个线程同时扩容的状况下就可能致使产生一个存在闭环的单链表，从而致使死循环。

JDK 1.8 HashMap扩容不会形成死循环的缘由
在JDK 1.8中执行上面的扩容死循环代码示例就不会发生死循环，咱们能够理解为在JDK 1.8 HashMap扩容不会形成死循环，但仍是须要理论依据才有信服力。

首先经过上面的分析咱们知道JDK 1.7中HashMap扩容发生死循环的主要缘由在于扩容后链表倒置以及链表过长。

那么在JDK 1.8中HashMap扩容不会形成死循环的主要缘由就从这两个角度去分析一下。

因为扩容是按两倍进行扩，即 N 扩为 N + N，所以就会存在低位部分 0 - (N-1)，以及高位部分 N - (2N-1)，因此在扩容时分为 loHead (low Head) 和 hiHead (high head)。

而后将原hash桶中单链表上的节点按照尾插法插入到loHead和hiHead所引用的单链表中。

因为使用的是尾插法，不会致使单链表的倒置，因此扩容的时候不会致使死循环。

经过上面的分析，不难发现循环的产生是由于新链表的顺序跟旧的链表是彻底相反的，因此只要保证建新链时仍是按照原来的顺序的话就不会产生循环。

若是单链表的长度达到 8 ，就会自动转成红黑树，而转成红黑树以前产生的单链表的逻辑也是借助loHead (low Head) 和 hiHead (high head)，采用尾插法。而后再根据单链表生成红黑树，也不会致使发生死循环。

这里虽然JDK 1.8 中HashMap扩容的时候不会形成死循环，可是若是多个线程同时执行put操做，可能会致使同时向一个单链表中插入数据，从而致使数据丢失的。

因此不管是JDK 1.7 仍是 1.8，HashMap线程都是不安全的，要使用线程安全的Map能够考虑ConcurrentHashMap。