HashMap为何不是线程安全,并发操做Hashmap会带来什么问题:
这个问题曾经有一个面试官问过我,当时我天真的觉得是读写操做并发时存在脏数据的问题,当时面试官不置能否。我后面回来查资料,发现没有那么简单。并发操做HashMap,是有可能带来死循环以及数据丢失的问题的。html
具体状况以下:(如下代码转自美团点评技术团队的文章Java8系列之从新认识HashMap)java
情景以下代码:面试
public class HashMapInfiniteLoop {
数组
private static HashMap<Integer,String> map = new HashMap<Integer,String>(2,0.75f);
安全
public static void main(String[] args) {
并发
map.put(5, "C");
高并发
new Thread("Thread1") {
oop
public void run() {
性能
map.put(7, "B");
.net
System.out.println(map);
};
}.start();
new Thread("Thread2") {
public void run() {
map.put(3, "A);
System.out.println(map);
};
}.start();
}
}
其中,map初始化为一个长度为2的数组,loadFactor=0.75,threshold=2*0.75=1,也就是说当put第二个key的时候,map就须要进行扩容。
考虑这样一种状况:
先放出transfer的部分代码:
do {
Entry<K,V> next = e.next; //假设线程一执行到这里就被调度挂起了
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);
线程一、线程2都添加了数据以后,线程1执行到transfer()方法的第一行就被调度挂起了,这时线程2被调度来执行扩容操做。线程2的扩容操做结束以后,线程1被调度回来继续执行,此时因为线程2的执行,e已经指向了线程2修改以后的反转链表,可是线程1并不知道线程2已经在它以前作过这些操做了,因而它继续往下走,此时next=key(7),
而后计算索引。索引计算完以后执行e.next=newTable[i],此时e.next=key(7)。继续往下走,newTable[i]=e,此时newTable[i]=key(3),再往下,e=next,此时e指向了key(7),本次循环结束。从线程二重组链表结束,到线程1第一轮循环结束的变化图以下:
一切看起来都尚未什么问题。而后新一轮循环开始
这一轮循环咱们不须要走完,就能发现问题。
第一句,执行后为:next=null;
第二句,计算索引,仍是i
第三句,在这里就出问题了,这句话执行的是e.next=newTable[i],咱们看上图,newTable[i]指向的是key(3),所以出现链表末尾的元素的next指针指向了链表头,循环链表就出现了。(按道理,HashMap是不存在循环链表的。)
第四句话,将链表头的元素换成key(7),而循环链表依然存在。
第五句,e=null,执行到这循环结束,由于e=null了。
整个过程并不会发生明显的异常。看起来一切安好。顺利的完成了rehash,可是悲剧在后面:当咱们调用get()这个链表中不存在的元素的时候,就会出现死循环。go die
一句话总结就是,并发环境下的rehash过程可能会带来循环链表,致使死循环导致线程挂掉。
所以并发环境下,建议使用Java.util.concurrent包中的ConcurrentHashMap以保证线程安全。
至于HashTable,它并未使用分段锁,而是锁住整个数组,高并发环境下效率很是的低,会致使大量线程等待。 一样的,Synchronized关键字、Lock性能都不如分段锁实现的ConcurrentHashMap。