HashMap为何线程不安全(hash碰撞与扩容致使)

时间 2019-11-12

原文原文链接

一直以来都知道HashMap是线程不安全的，可是到底为何线程不安全，在多线程操做状况下何时线程不安全？java

让咱们先来了解一下HashMap的底层存储结构，HashMap底层是一个Entry数组，一旦发生Hash冲突的的时候，HashMap采用拉链法解决碰撞冲突，Entry内部的变量：数组

[java] view plain copy

final Object key;
Object value;
Entry next;
int hash;

经过Entry内部的next变量能够知道使用的是链表，这时候咱们能够知道，若是多个线程，在某一时刻同时操做HashMap并执行put操做，而有大于两个key的hash值相同，如图中a一、a2，这个时候须要解决碰撞冲突，而解决冲突的办法上面已经说过，对于链表的结构在这里再也不赘述，暂且不讨论是从链表头部插入仍是从尾部初入，这个时候两个线程若是刚好都取到了对应位置的头结点e1，而最终的结果可想而知，a一、a2两个数据中势必会有一个会丢失，如图所示：安全

再来看下put方法多线程

[java] view plain copy

public Object put(Object obj, Object obj1)
{
if(table == EMPTY_TABLE)
inflateTable(threshold);
if(obj == null)
return putForNullKey(obj1);
int i = hash(obj);
int j = indexFor(i, table.length);
for(Entry entry = table[j]; entry != null; entry = entry.next)
{
Object obj2;
if(entry.hash == i && ((obj2 = entry.key) == obj || obj.equals(obj2)))
{
Object obj3 = entry.value;
entry.value = obj1;
entry.recordAccess(this);
return obj3;
}
}
modCount++;
addEntry(i, obj, obj1, j);
return null;
}

put方法不是同步的，同时调用了addEntry方法：this

[java] view plain copy

void addEntry(int i, Object obj, Object obj1, int j)
{
if(size >= threshold && null != table[j])
{
resize(2 * table.length);
i = null == obj ? 0 : hash(obj);
j = indexFor(i, table.length);
}
createEntry(i, obj, obj1, j);
}

addEntry方法依然不是同步的，因此致使了线程不安全出现伤处问题，其余相似操做再也不说明，源码一看便知，下面主要说一下另外一个很是重要的知识点，一样也是HashMap非线程安全的缘由，咱们知道在HashMap存在扩容的状况，对应的方法为HashMap中的resize方法：spa

[java] view plain copy

void resize(int i)
{
Entry aentry[] = table;
int j = aentry.length;
if(j == 1073741824)
{
threshold = 2147483647;
return;
} else
{
Entry aentry1[] = new Entry[i];
transfer(aentry1, initHashSeedAsNeeded(i));
table = aentry1;
threshold = (int)Math.min((float)i * loadFactor, 1.073742E+009F);
return;
}
}

能够看到扩容方法也不是同步的，经过代码咱们知道在扩容过程当中，会新生成一个新的容量的数组，而后对原数组的全部键值对从新进行计算和写入新的数组，以后指向新生成的数组。.net

当多个线程同时检测到总数量超过门限值的时候就会同时调用resize操做，各自生成新的数组并rehash后赋给该map底层的数组table，结果最终只有最后一个线程生成的新数组被赋给table变量，其余线程的均会丢失。并且当某些线程已经完成赋值而其余线程刚开始的时候，就会用已经被赋值的table做为原始数组，这样也会有问题。线程