一、JDK7及以前java
二、JKD8及以后node
由上面结构图可知,在JDK7及以前,HashMap采用位桶+链表实现,即便用链表处理冲突,同一hash值的链表都存储在一个链表里。可是当位于一个桶中的元素较多,即hash值相等的元素较多时,经过key值依次查找的效率较低。而JDK8对HashMap作了优化,采用位桶+链表+红黑树实现,当链表长度超过阈值(8)时,将链表转换为红黑树,使得HashMap存取速度更快。数据库
不一样JDK版本中HashMap重要参数对比数组
属性名 | 属性说明 | JDK7 | JDK8 |
loadFactor | 加载因子,初始值=0.75,与扩容有关 | √ | √ |
threshold | 临界值,与HashMap扩容相关 | √ | √ |
modCount | map中数据改变次数的统计 | √ | √ |
DEFAULT_INITIAL_CAPACITY | 默认的初始容量 ,=1<<4=16 | √ | √ |
MAXIMUM_CAPACITY | 最大容量,=1<<30 | √ | √ |
DEFAULT_LOAD_FACTOR | 默认加载因子,=0.75 | √ | √ |
TREEIFY_THRESHOLD | 使用TreeNode的临界值,默认=8 | × | √ |
UNTREEIFY_THRESHOLD | 与split方法有关 | × | √ |
MIN_TREEIFY_CAPACITY | 最小TreeNode的容量为64 | × | √ |
JDK8app
public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; this.threshold = tableSizeFor(initialCapacity); } public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR); } public HashMap() { this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted }
JDK7函数
public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; threshold = initialCapacity; init(); } public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR); } public HashMap() { this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR); }
比较发现最大的改变就是在无参构造函数时,JDK8仅仅是初始化loadFactor让其等于默认值。而JDK7是调用了一个有参的构造函数,参数使用了默认值。源码分析
Map经过构造函数new一个HashMap时,其内部存储数据的数组并无实例化,而是在PUT方法中去作了一件判断table是否为空的事,若为空就会调用resize()方法,resize()第一次调用就会实例化一个长度为DEFAULT_INITIAL_CAPACITY的Node[]。优化
先来看一张流程图:this
该流程图阐述了putVal()方法的整个执行过程。如今咱们来看putVal()的源码:spa
//对外开发使用 public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } //存值的真正执行者 final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { //定义一个数组,一个链表,n永远存放数组长度,i用于存放key的hash计算后的值,即key在数组中的索引 Node<K,V>[] tab; Node<K,V> p; int n, i; //判断table是否为空或数组长度为0,若是为空则经过resize()实例化一个数组并让tab做为其引用,而且让n等于实例化tab后的长度 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //根据key通过hash()方法获得的hash值与数组最大索引作与运算获得当前key所在的索引值,而且将当前索引上的Node赋予给p并判断是否该Node是否存在 if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null);//若tab[i]不存在,则直接将key-value插入该位置上。 //该位置存在数据的状况 else { Node<K,V> e; K k; //从新定义一个Node,和一个k // 该位置上数据Key计算后的hash等于要存放的Key计算后的hash而且该位置上的Key等于要存放的Key if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k)))) e = p; //true,将该位置的Node赋予给e else if (p instanceof TreeNode) //判断当前桶类型是不是TreeNode //ture,进行红黑树插值法,写入数据 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { //false, 遍历当前位置链表 for (int binCount = 0; ; ++binCount) { //查找当前位置链表上的表尾,表尾的next节点必然为null,找到表尾将数据赋给下一个节点 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); //是,直接将数据写到下个节点 // 若是此时已经到第八个了,还没找个表尾,那么从第八个开始就要进行红黑树操做 if (binCount >= TREEIFY_THRESHOLD - 1) treeifyBin(tab, hash); //红黑树插值具体操做 break; } //若是当前位置的key与要存放的key的相同,直接跳出,不作任何操做 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; //将下一个给到p进行逐个查找节点为空的Node p = e; } } //若是e不为空,即找到了一个去存储Key-value的Node if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; //当最后一次调整以后Size大于了临界值,须要调整数组的容量 if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }
源码以下:
//对外公开方法 public V get(Object key) { Node<K,V> e; return (e = getNode(hash(key), key)) == null ? null : e.value; } //实际逻辑控制方法 final Node<K,V> getNode(int hash, Object key) { //定义相关变量 Node<K,V>[] tab; Node<K,V> first, e; int n; K k; //保证Map中的数组不为空,而且存储的有值,而且查找的key对应的索引位置上有值 if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { // always check first node 第一次就找到了对应的值 if (first.hash == hash && ((k = first.key) == key || (key != null && key.equals(k)))) return first; //判断下一个节点是否存在 if ((e = first.next) != null) { //true,检测是不是TreeNode if (first instanceof TreeNode) return ((TreeNode<K,V>)first).getTreeNode(hash, key); //经过TreeNode的get方法获取值 //否,遍历链表 do { //判断下一个节点是不是要查找的对象 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; }while ((e = e.next) != null); } }//未找到,返回null return null; }
构造hash表时,若是不指明初始大小,默认大小为16(即Node数组大小16),若是Node[]数组中的元素达到(填充比*Node.length)从新调整HashMap大小变为原来2倍大小,扩容很耗时。
resize()源码以下:
final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; //未扩容时数组的容量 int oldThr = threshold; int newCap, newThr = 0;//定义新的容量和临界值 //当前Map容量大于零,非第一次put值 if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { //超过最大容量:2^30 //临界值等于Integer类型的最大值 0x7fffffff=2^31-1 threshold = Integer.MAX_VALUE; return oldTab; } //当前容量在默认值和最大值的一半之间 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; //新临界值为当前临界值的两倍 } //当前容量为0,可是当前临界值不为0,让新的容量等于当前临界值 else if (oldThr > 0) newCap = oldThr; //当前容量和临界值都为0,让新的容量为默认值,临界值=初始容量*默认加载因子 else { newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } //若是新的临界值为0 if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } //临界值赋值 threshold = newThr; //扩容table Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null) newTab[e.hash & (newCap - 1)] = e;//此时newCap = oldCap*2 else if (e instanceof TreeNode) //节点为红黑树,进行切割操做 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { //链表的下一个节点还有值,但节点位置又没有超过8 //lo就是扩容后仍然在原地的元素链表 //hi就是扩容后下标为 原位置+原容量 的元素链表,从而不须要从新计算hash。 Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; //循环链表直到链表末再无节点 do { next = e.next; //e.hash&oldCap == 0 判断元素位置是否还在原位置 if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); //循环链表结束,经过判断loTail是否为空来拷贝整个链表到扩容后table if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }
String类型和Integer类型的hashCode值,Map中hash方法
//String类型 HashCode public int hashCode() { int h = hash; if (h == 0 && value.length > 0) { char val[] = value; for (int i = 0; i < value.length; i++) { h = 31 * h + val[i]; } hash = h; } return h; } //Integer类型的 HashCode ,就是value自己 public static int hashCode(int value) { return value; } //HashMap中的hash(), 小于2^16的值的hashCode都是其自己 static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
HashMap put与resize的实例图
关于红黑树,能够查看《为何MySQL数据库要用B+树存储索引?》
参考
https://blog.csdn.net/weixin_37356262/article/details/80543218