多线程环境下操做HashMap的问题

时间 2019-11-15

原文原文链接

HashMap为何不是线程安全，并发操做Hashmap会带来什么问题：
这个问题曾经有一个面试官问过我，当时我天真的觉得是读写操做并发时存在脏数据的问题，当时面试官不置能否。我后面回来查资料，发现没有那么简单。并发操做HashMap，是有可能带来死循环以及数据丢失的问题的。html

具体状况以下：(如下代码转自美团点评技术团队的文章Java8系列之从新认识HashMap)java

情景以下代码:面试

public class HashMapInfiniteLoop { 数组
private static HashMap<Integer,String> map = new HashMap<Integer,String>(2，0.75f); 安全
public static void main(String[] args) { 并发
map.put(5， "C"); 高并发
new Thread("Thread1") { oop
public void run() { 性能
map.put(7, "B"); .net
System.out.println(map);
};
}.start();
new Thread("Thread2") {
public void run() {
map.put(3, "A);
System.out.println(map);
};
}.start();
}
}

其中，map初始化为一个长度为2的数组，loadFactor=0.75，threshold=2*0.75=1，也就是说当put第二个key的时候，map就须要进行扩容。

考虑这样一种状况:
先放出transfer的部分代码：

do {
Entry<K,V> next = e.next; //假设线程一执行到这里就被调度挂起了
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);

线程一、线程2都添加了数据以后，线程1执行到transfer()方法的第一行就被调度挂起了，这时线程2被调度来执行扩容操做。线程2的扩容操做结束以后，线程1被调度回来继续执行，此时因为线程2的执行，e已经指向了线程2修改以后的反转链表，可是线程1并不知道线程2已经在它以前作过这些操做了，因而它继续往下走，此时next=key(7),

而后计算索引。索引计算完以后执行e.next=newTable[i],此时e.next=key(7)。继续往下走，newTable[i]=e,此时newTable[i]=key(3)，再往下，e=next,此时e指向了key(7),本次循环结束。从线程二重组链表结束，到线程1第一轮循环结束的变化图以下:

一切看起来都尚未什么问题。而后新一轮循环开始

这一轮循环咱们不须要走完，就能发现问题。

第一句，执行后为:next=null;

第二句，计算索引，仍是i

第三句，在这里就出问题了，这句话执行的是e.next=newTable[i],咱们看上图，newTable[i]指向的是key(3),所以出现链表末尾的元素的next指针指向了链表头，循环链表就出现了。（按道理，HashMap是不存在循环链表的。）

第四句话，将链表头的元素换成key(7)，而循环链表依然存在。

第五句，e=null，执行到这循环结束，由于e=null了。

整个过程并不会发生明显的异常。看起来一切安好。顺利的完成了rehash，可是悲剧在后面：当咱们调用get（）这个链表中不存在的元素的时候，就会出现死循环。go die

一句话总结就是，并发环境下的rehash过程可能会带来循环链表，致使死循环导致线程挂掉。

所以并发环境下，建议使用Java.util.concurrent包中的ConcurrentHashMap以保证线程安全。

至于HashTable，它并未使用分段锁，而是锁住整个数组，高并发环境下效率很是的低，会致使大量线程等待。一样的，Synchronized关键字、Lock性能都不如分段锁实现的ConcurrentHashMap。