HashMap为何线程不安全(hash碰撞与扩容致使)

    一直以来都知道HashMap是线程不安全的,可是到底为何线程不安全,在多线程操做状况下何时线程不安全?java

让咱们先来了解一下HashMap的底层存储结构,HashMap底层是一个Entry数组,一旦发生Hash冲突的的时候,HashMap采用拉链法解决碰撞冲突,Entry内部的变量:数组

 

[java]  view plain  copy
 
  1. final Object key;  
  2. Object value;  
  3. Entry next;  
  4. int hash;  


        经过Entry内部的next变量能够知道使用的是链表,这时候咱们能够知道,若是多个线程,在某一时刻同时操做HashMap并执行put操做,而有大于两个key的hash值相同,如图中a一、a2,这个时候须要解决碰撞冲突,而解决冲突的办法上面已经说过,对于链表的结构在这里再也不赘述,暂且不讨论是从链表头部插入仍是从尾部初入,这个时候两个线程若是刚好都取到了对应位置的头结点e1,而最终的结果可想而知,a一、a2两个数据中势必会有一个会丢失,如图所示:安全

 

再来看下put方法多线程

 

[java]  view plain  copy
 
  1. public Object put(Object obj, Object obj1)  
  2.     {  
  3.         if(table == EMPTY_TABLE)  
  4.             inflateTable(threshold);  
  5.         if(obj == null)  
  6.             return putForNullKey(obj1);  
  7.         int i = hash(obj);  
  8.         int j = indexFor(i, table.length);  
  9.         for(Entry entry = table[j]; entry != null; entry = entry.next)  
  10.         {  
  11.             Object obj2;  
  12.             if(entry.hash == i && ((obj2 = entry.key) == obj || obj.equals(obj2)))  
  13.             {  
  14.                 Object obj3 = entry.value;  
  15.                 entry.value = obj1;  
  16.                 entry.recordAccess(this);  
  17.                 return obj3;  
  18.             }  
  19.         }  
  20.   
  21.         modCount++;  
  22.         addEntry(i, obj, obj1, j);  
  23.         return null;  
  24.     }  


put方法不是同步的,同时调用了addEntry方法:this

 

 

[java]  view plain  copy
 
  1. void addEntry(int i, Object obj, Object obj1, int j)  
  2.     {  
  3.         if(size >= threshold && null != table[j])  
  4.         {  
  5.             resize(2 * table.length);  
  6.             i = null == obj ? 0 : hash(obj);  
  7.             j = indexFor(i, table.length);  
  8.         }  
  9.         createEntry(i, obj, obj1, j);  
  10.     }  

addEntry方法依然不是同步的,因此致使了线程不安全出现伤处问题,其余相似操做再也不说明,源码一看便知,下面主要说一下另外一个很是重要的知识点,一样也是HashMap非线程安全的缘由,咱们知道在HashMap存在扩容的状况,对应的方法为HashMap中的resize方法:spa

 

 

[java]  view plain  copy
 
  1. void resize(int i)  
  2.     {  
  3.         Entry aentry[] = table;  
  4.         int j = aentry.length;  
  5.         if(j == 1073741824)  
  6.         {  
  7.             threshold = 2147483647;  
  8.             return;  
  9.         } else  
  10.         {  
  11.             Entry aentry1[] = new Entry[i];  
  12.             transfer(aentry1, initHashSeedAsNeeded(i));  
  13.             table = aentry1;  
  14.             threshold = (int)Math.min((float)i * loadFactor, 1.073742E+009F);  
  15.             return;  
  16.         }  
  17.     }  


         能够看到扩容方法也不是同步的,经过代码咱们知道在扩容过程当中,会新生成一个新的容量的数组,而后对原数组的全部键值对从新进行计算和写入新的数组,以后指向新生成的数组。.net

 


        当多个线程同时检测到总数量超过门限值的时候就会同时调用resize操做,各自生成新的数组并rehash后赋给该map底层的数组table,结果最终只有最后一个线程生成的新数组被赋给table变量,其余线程的均会丢失。并且当某些线程已经完成赋值而其余线程刚开始的时候,就会用已经被赋值的table做为原始数组,这样也会有问题。线程

相关文章
相关标签/搜索