JAVA容器-自问自答学HashMap

时间 2019-11-17

标签 java 容器自问 hashmap 栏目 Java 繁體版

原文原文链接

前言

此次我和你们一块儿学习HashMap，HashMap咱们在工做中常常会使用，并且面试中也很频繁会问到，由于它里面蕴含着不少知识点，能够很好的考察我的基础。但一个这么重要的东西，我为何没有在一开始就去学习它呢，由于它是由多种基础的数据结构和一些代码设计思想组成的。咱们要学习了这些基础，再学习HashMap，这样咱们才能更好的去理解它。古人云：无欲速，无见小利。欲速则不达，见小利则大事不成。html

HashMap其实就是ArrayList和LinkedList的数据结构加上hashCode和equals方法的思想设计出来的。没有理解上述说的知识点的同窗能够翻开我过往的文章记录。java

下面我就以面试问答的形式学习咱们的——HashMap（源码分析基于JDK8，辅以JDK7），问答内容只是对HashMap的一个总结概括，由于现时已经有大牛把HashMap通俗易懂的剖析了一遍，我学习HashMap也是主要经过这篇文章学习的，强烈推荐：美团点评技术团队的Java 8系列之从新认识HashMapnode

本文同步发布于简书：www.jianshu.com/p/32f67f9e7…程序员

问答内容

1.

问：HashMap有用过吗？您能给我说说他的主要用途吗？面试

答：数组

有用过，我在日常工做中常常会用到HashMap这种数据结构，HashMap是基于Map接口实现的一种键-值对<key,value>的存储结构，容许null值，同时非有序，非同步(即线程不安全)。HashMap的底层实现是数组 + 链表 + 红黑树（JDK1.8增长了红黑树部分）。它存储和查找数据时，是根据键key的hashCode的值计算出具体的存储位置。HashMap最多只容许一条记录的键key为null，HashMap增删改查等常规操做都有不错的执行效率，是ArrayList和LinkedList等数据结构的一种折中实现。

示例代码：安全

// 建立一个HashMap，若是没有指定初始大小，默认底层hash表数组的大小为16
        HashMap<String, String> hashMap = new HashMap<String, String>();
        // 往容器里面添加元素
        hashMap.put("小明", "好帅");
        hashMap.put("老王", "坑爹货");
        hashMap.put("老铁", "没毛病");
        hashMap.put("掘金", "好地方");
        hashMap.put("王五", "别搞事");
        // 获取key为小明的元素 好帅
        String element = hashMap.get("小明");
        // value : 好帅
        System.out.println(element);
        // 移除key为王五的元素
        String removeElement = hashMap.remove("王五");
        // value : 别搞事
        System.out.println(removeElement);
        // 修改key为小明的元素的值value 为 其实有点丑
        hashMap.replace("小明", "其实有点丑");
        // {老铁=没毛病, 小明=其实有点丑, 老王=坑爹货, 掘金=好地方}
        System.out.println(hashMap);
        // 经过put方法也能够达到修改对应元素的值的效果
        hashMap.put("小明", "其实还能够啦,开玩笑的");
        // {老铁=没毛病, 小明=其实还能够啦,开玩笑的, 老王=坑爹货, 掘金=好地方}
        System.out.println(hashMap);
        // 判断key为老王的元素是否存在(捉奸老王)
        boolean isExist = hashMap.containsKey("老王");
        // true , 老王居然来搞事
        System.out.println(isExist);
        // 判断是否有 value = "坑爹货" 的人
        boolean isHasSomeOne = hashMap.containsValue("坑爹货");
        // true 老王是坑爹货
        System.out.println(isHasSomeOne);
        // 查看这个容器里面还有几个家伙 value : 4
        System.out.println(hashMap.size());复制代码

HashMap的底层实现是数组 + 链表 + 红黑树（JDK1.8增长了红黑树部分），核心组成元素有：

int size;用于记录HashMap实际存储元素的个数；bash
float loadFactor;负载因子（默认是0.75，此属性后面详细解释）。数据结构
int threshold;下一次扩容时的阈值，达到阈值便会触发扩容机制resize（阈值 threshold = 容器容量 capacity * 负载因子 load factor）。也就是说，在容器定义好容量以后，负载因子越大，所能容纳的键值对元素个数就越多。多线程
Node<K,V>[] table; 底层数组，充当哈希表的做用，用于存储对应hash位置的元素Node<K,V>，此数组长度老是2的N次幂。（具体缘由后面详细解释）

示例代码：

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
·····

    /* ---------------- Fields -------------- */

    /**
     * 哈希表，在第一次使用到时进行初始化，重置大小是必要的操做，
     * 当分配容量时，长度老是2的N次幂。
     */
    transient Node<K,V>[] table;

    /**
     * 实际存储的key - value 键值对 个数
     */
    transient int size;


    /**
     * 下一次扩容时的阈值 
     * (阈值 threshold = 容器容量 capacity * 负载因子 load factor).
     * @serial
     */
    int threshold;

    /**
     * 哈希表的负载因子
     *
     * @serial
     */
    final float loadFactor;

·····
}复制代码

其中Node<K,V>[] table;哈希表存储的核心元素是Node<K,V>,Node<K,V>包含：

final int hash;元素的哈希值，决定元素存储在Node<K,V>[] table;哈希表中的位置。由final修饰可知，当hash的值肯定后，就不能再修改。
final K key; 键，由final修饰可知，当key的值肯定后，就不能再修改。
V value; 值
Node<K,V> next; 记录下一个元素结点(单链表结构，用于解决hash冲突)

示例代码：

/**
     * 定义HashMap存储元素结点的底层实现
     */
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;//元素的哈希值 由final修饰可知，当hash的值肯定后，就不能再修改
        final K key;// 键，由final修饰可知，当key的值肯定后，就不能再修改
        V value; // 值
        Node<K,V> next; // 记录下一个元素结点(单链表结构，用于解决hash冲突)


        /**
         * Node结点构造方法
         */
        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;//元素的哈希值
            this.key = key;// 键
            this.value = value; // 值
            this.next = next;// 记录下一个元素结点
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        /**
         * 为Node重写hashCode方法，值为：key的hashCode 异或 value的hashCode 
         * 运算做用就是将2个hashCode的二进制中，同一位置相同的值为0，不一样的为1。
         */
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        /**
         * 修改某一元素的值
         */
        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        /**
         * 为Node重写equals方法
         */
        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }复制代码

2.

问：您能说说HashMap经常使用操做的底层实现原理吗？如存储put(K key, V value)，查找get(Object key)，删除remove(Object key)，修改replace(K key, V value)等操做。

答：

调用put(K key, V value)操做添加key-value键值对时，进行了以下操做：

判断哈希表Node<K,V>[] table是否为空或者null，是则执行resize()方法进行扩容。
根据插入的键值key的hash值，经过(n - 1) & hash当前元素的hash值 & hash表长度 - 1（实际就是 hash值 % hash表长度）计算出存储位置table[i]。若是存储位置没有元素存放，则将新增结点存储在此位置table[i]。
若是存储位置已经有键值对元素存在，则判断该位置元素的hash值和key值是否和当前操做元素一致，一致则证实是修改value操做，覆盖value便可。
当前存储位置即有元素，又不和当前操做元素一致，则证实此位置table[i]已经发生了hash冲突，则经过判断头结点是不是treeNode，若是是treeNode则证实此位置的结构是红黑树，已红黑树的方式新增结点。
若是不是红黑树，则证实是单链表，将新增结点插入至链表的最后位置，随后判断当前链表长度是否大于等于 8，是则将当前存储位置的链表转化为红黑树。遍历过程当中若是发现key已经存在，则直接覆盖value。
插入成功后，判断当前存储键值对的数量大于阈值threshold 是则扩容。

示例代码：

/**
     * 添加key-value键值对
     *
     * @param key 键
     * @param value 值
     * @return 若是本来存在此key，则返回旧的value值，若是是新增的key-     
     *         value，则返回nulll
     */
    public V put(K key, V value) {
        //实际调用putVal方法进行添加 key-value 键值对操做
        return putVal(hash(key), key, value, false, true);
    }

    /**
     * 根据key 键 的 hashCode 经过 “扰动函数” 生成对应的 hash值
     * 通过此操做后，使每个key对应的hash值生成的更均匀，
     * 减小元素之间的碰撞概率（后面详细说明）
     */
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }


    /**
     * 添加key-value键值对的实际调用方法（重点）
     *
     * @param hash key 键的hash值
     * @param key 键
     * @param value 值
     * @param onlyIfAbsent 此值若是是true, 则若是此key已存在value，则不执
     * 行修改操做 
     * @param evict 此值若是是false，哈希表是在初始化模式
     * @return 返回本来的旧值, 若是是新增，则返回null
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        // 用于记录当前的hash表
        Node<K,V>[] tab; 
        // 用于记录当前的链表结点
        Node<K,V> p; 
        // n用于记录hash表的长度，i用于记录当前操做索引index
        int n, i;
        // 当前hash表为空
        if ((tab = table) == null || (n = tab.length) == 0)
            // 初始化hash表，并把初始化后的hash表长度值赋值给n
            n = (tab = resize()).length;
        // 1）经过 (n - 1) & hash 当前元素的hash值 & hash表长度 - 1
        // 2）肯定当前元素的存储位置，此运算等价于 当前元素的hash值 % hash表的长度
        // 3）计算出的存储位置没有元素存在
        if ((p = tab[i = (n - 1) & hash]) == null)
            // 4) 则新建一个Node结点，在该位置存储此元素
            tab[i] = newNode(hash, key, value, null);
        else { // 当前存储位置已经有元素存在了(不考虑是修改的状况的话，就表明发生hash冲突了)
            // 用于存放新增结点
            Node<K,V> e; 
            // 用于临时存在某个key值
            K k;
            // 1)若是当前位置已存在元素的hash值和新增元素的hash值相等
            // 2)而且key也相等，则证实是同一个key元素，想执行修改value操做
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;// 将当前结点引用赋值给e
            else if (p instanceof TreeNode) // 若是当前结点是树结点
                // 则证实当前位置的链表已变成红黑树结构，则已红黑树结点结构新增元素
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {// 排除上述状况，则证实已发生hash冲突，并hash冲突位置现时的结构是单链表结构
                for (int binCount = 0; ; ++binCount) {
                    //遍历单链表，将新元素结点放置此链表的最后一位
                    if ((e = p.next) == null) {
                        // 将新元素结点放在此链表的最后一位
                        p.next = newNode(hash, key, value, null);
                        // 新增结点后，当前结点数量是否大于等于 阈值 8 
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            // 大于等于8则将链表转换成红黑树
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 若是链表中已经存在对应的key，则覆盖value
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // 已存在对应key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null) //若是容许修改，则修改value为新值
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        // 当前存储键值对的数量 大于 阈值 是则扩容
        if (++size > threshold)
           // 重置hash大小，将旧hash表的数据逐一复制到新的hash表中（后面详细讲解）
            resize();
        afterNodeInsertion(evict);
        // 返回null，则证实是新增操做，而不是修改操做
        return null;
    }复制代码

调用get(Object key)操做根据键key查找对应的key-value键值对时，进行了以下操做：

1.先调用 hash(key)方法计算出 key 的 hash值

2.根据查找的键值key的hash值，经过(n - 1) & hash当前元素的hash值 & hash表长度 - 1（实际就是 hash值 % hash表长度）计算出存储位置table[i]，判断存储位置是否有元素存在。

若是存储位置有元素存放，则首先比较头结点元素，若是头结点的key的hash值和要获取的key的hash值相等，而且头结点的key自己和要获取的 key 相等，则返回该位置的头结点。
若是存储位置没有元素存放，则返回null。

3.若是存储位置有元素存放，可是头结点元素不是要查找的元素，则须要遍历该位置进行查找。

4.先判断头结点是不是treeNode，若是是treeNode则证实此位置的结构是红黑树，以红色树的方式遍历查找该结点，没有则返回null。

5.若是不是红黑树，则证实是单链表。遍历单链表，逐一比较链表结点，链表结点的key的hash值和要获取的key的hash值相等，而且链表结点的key自己和要获取的 key 相等，则返回该结点，遍历结束仍未找到对应key的结点，则返回null。

示例代码：

/**
     * 返回指定 key 所映射的 value 值
     * 或者 返回 null 若是容器里不存在对应的key
     *
     * 更确切地讲，若是此映射包含一个知足 (key==null ? k==null :key.equals(k))
     * 的从 k 键到 v 值的映射关系，
     * 则此方法返回 v；不然返回 null。（最多只能有一个这样的映射关系。）
     *
     * 返回 null 值并不必定 代表该映射不包含该键的映射关系；
     * 也可能该映射将该键显示地映射为 null。可以使用containsKey操做来区分这两种状况。 
     *
     * @see #put(Object, Object)
     */
    public V get(Object key) {
        Node<K,V> e;
        // 1.先调用 hash(key)方法计算出 key 的 hash值
        // 2.随后调用getNode方法获取对应key所映射的value值
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }


    /**
     * 获取哈希表结点的方法实现
     *
     * @param hash key 键的hash值
     * @param key 键
     * @return 返回对应的结点，若是结点不存在，则返回null
     */
    final Node<K,V> getNode(int hash, Object key) {
        // 用于记录当前的hash表 
        Node<K,V>[] tab; 
        // first用于记录对应hash位置的第一个结点，e充当工做结点的做用
        Node<K,V> first, e; 
        // n用于记录hash表的长度
        int n; 
        // 用于临时存放Key
        K k;
        // 经过 (n - 1) & hash 当前元素的hash值 & hash表长度 - 1
        // 判断当前元素的存储位置是否有元素存在 
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {//元素存在的状况
           // 若是头结点的key的hash值 和 要获取的key的hash值相等
           // 而且 头结点的key自己 和要获取的 key 相等
            if (first.hash == hash && // always check first node 老是检查头结点
                ((k = first.key) == key || (key != null && key.equals(k))))
                // 返回该位置的头结点
                return first;
            if ((e = first.next) != null) {// 头结点不相等
                if (first instanceof TreeNode) // 若是当前结点是树结点
                    // 则证实当前位置的链表已变成红黑树结构
                    // 经过红黑树结点的方式获取对应key结点
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {// 当前位置不是红黑树，则证实是单链表
                    // 遍历单链表，逐一比较链表结点
                    // 链表结点的key的hash值 和 要获取的key的hash值相等
                    // 而且 链表结点的key自己 和要获取的 key 相等
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        // 找到对应的结点则返回
                        return e;
                } while ((e = e.next) != null);
            }
        }
        // 经过上述查找均无找到，则返回null
        return null;
    }复制代码

调用remove(Object key)操做根据键key删除对应的key-value键值对时，进行了以下操做：

1.先调用 hash(key)方法计算出 key 的 hash值

若是存储位置有元素存放，则首先比较头结点元素，若是头结点的key的hash值和要获取的key的hash值相等，而且头结点的key自己和要获取的 key 相等，则该位置的头结点即为要删除的结点，记录此结点至变量node中。
若是存储位置没有元素存放，则没有找到对应要删除的结点，则返回null。

3.若是存储位置有元素存放，可是头结点元素不是要删除的元素，则须要遍历该位置进行查找。

4.先判断头结点是不是treeNode，若是是treeNode则证实此位置的结构是红黑树，以红色树的方式遍历查找并删除该结点，没有则返回null。

5.若是不是红黑树，则证实是单链表。遍历单链表，逐一比较链表结点，链表结点的key的hash值和要获取的key的hash值相等，而且链表结点的key自己和要获取的 key 相等，则此为要删除的结点，记录此结点至变量node中，遍历结束仍未找到对应key的结点，则返回null。

6.若是找到要删除的结点node，则判断是否须要比较value也是否一致，若是value值一致或者不须要比较value值，则执行删除结点操做，删除操做根据不一样的状况与结构进行不一样的处理。

若是当前结点是树结点，则证实当前位置的链表已变成红黑树结构，经过红黑树结点的方式删除对应结点。
若是不是红黑树，则证实是单链表。若是要删除的是头结点，则当前存储位置table[i]的头结点指向删除结点的下一个结点。
若是要删除的结点不是头结点，则将要删除的结点的后继结点node.next赋值给要删除结点的前驱结点的next域，即p.next = node.next;。

7.HashMap当前存储键值对的数量 - 1，并返回删除结点。

示例代码：

/**
     * 今后映射中移除指定键的映射关系（若是存在）。
     *
     * @param  key 其映射关系要从映射中移除的键
     * @return 与 key 关联的旧值；若是 key 没有任何映射关系，则返回 null。
     *        （返回 null 还可能表示该映射以前将 null 与 key 关联。）
     */
    public V remove(Object key) {
        Node<K,V> e;
        // 1.先调用 hash(key)方法计算出 key 的 hash值
        // 2.随后调用removeNode方法删除对应key所映射的结点
        return (e = removeNode(hash(key), key, null, false, true)) == null ?
            null : e.value;
    }


    /**
     * 删除哈希表结点的方法实现
     *
     * @param hash 键的hash值
     * @param key 键
     * @param value 用于比较的value值，当matchValue 是 true时才有效, 不然忽略
     * @param matchValue 若是是 true 只有当value相等时才会移除
     * @param movable 若是是 false当执行移除操做时，不删除其余结点
     * @return 返回删除结点node，不存在则返回null
     */
    final Node<K,V> removeNode(int hash, Object key, Object value,
                               boolean matchValue, boolean movable) {
        // 用于记录当前的hash表
        Node<K,V>[] tab; 
        // 用于记录当前的链表结点
        Node<K,V> p; 
        // n用于记录hash表的长度，index用于记录当前操做索引index
        int n, index;
        // 经过 (n - 1) & hash 当前元素的hash值 & hash表长度 - 1
        // 判断当前元素的存储位置是否有元素存在 
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (p = tab[index = (n - 1) & hash]) != null) {// 元素存在的状况
            // node 用于记录找到的结点，e为工做结点
            Node<K,V> node = null, e; 
            K k; V v;
           // 若是头结点的key的hash值 和 要获取的key的hash值相等
           // 而且 头结点的key自己 和要获取的 key 相等
           // 则证实此头结点就是要删除的结点
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                // 记录要删除的结点的引用地址至node中
                node = p;
            else if ((e = p.next) != null) {// 头结点不相等
                if (p instanceof TreeNode)// 若是当前结点是树结点
                    // 则证实当前位置的链表已变成红黑树结构
                    // 经过红黑树结点的方式获取对应key结点
                    // 记录要删除的结点的引用地址至node中
                    node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
                else {// 当前位置不是红黑树，则证实是单链表
                    do {
                        // 遍历单链表，逐一比较链表结点
                        // 链表结点的key的hash值 和 要获取的key的hash值相等
                        // 而且 链表结点的key自己 和要获取的 key 相等
                        if (e.hash == hash &&
                            ((k = e.key) == key ||
                             (key != null && key.equals(k)))) {
                            // 找到则记录要删除的结点的引用地址至node中，中断遍历
                            node = e;
                            break;
                        }
                        p = e;
                    } while ((e = e.next) != null);
                }
            }
            // 若是找到要删除的结点，则判断是否须要比较value也是否一致
            if (node != null && (!matchValue || (v = node.value) == value ||
                                 (value != null && value.equals(v)))) {
                // value值一致或者不须要比较value值，则执行删除结点操做
                if (node instanceof TreeNode) // 若是当前结点是树结点
                    // 则证实当前位置的链表已变成红黑树结构
                    // 经过红黑树结点的方式删除对应结点
                    ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
                else if (node == p) // node 和 p相等，则证实删除的是头结点
                    // 当前存储位置的头结点指向删除结点的下一个结点
                    tab[index] = node.next;
                else // 删除的不是头结点
                    // p是删除结点node的前驱结点，p的next改成记录要删除结点node的后继结点
                    p.next = node.next;
                ++modCount;
               // 当前存储键值对的数量 - 1
                --size;
                afterNodeRemoval(node);
                // 返回删除结点
                return node;
            }
        }
        // 不存在要删除的结点，则返回null
        return null;
    }复制代码

调用replace(K key, V value)操做根据键key查找对应的key-value键值对，随后替换对应的值value，进行了以下操做：

先调用 hash(key)方法计算出 key 的 hash值
随后调用getNode方法获取对应key所映射的value值。
记录元素旧值，将新值赋值给元素，返回元素旧值，若是没有找到元素，则返回null。

示例代码：

/**
     * 替换指定 key 所映射的 value 值
     *
     * @param key 对应要替换value值元素的key键
     * @param value 要替换对应元素的新value值
     * @return 返回本来的旧值，若是没有找到key对应的元素，则返回null
     * @since 1.8 JDK1.8新增方法
     */
    public V replace(K key, V value) {
        Node<K,V> e;
        // 1.先调用 hash(key)方法计算出 key 的 hash值
        // 2.随后调用getNode方法获取对应key所映射的value值
        if ((e = getNode(hash(key), key)) != null) {// 若是找到对应的元素
            // 元素旧值
            V oldValue = e.value;
            // 将新值赋值给元素
            e.value = value;
            afterNodeAccess(e);
            // 返回元素旧值
            return oldValue;
        }
        // 没有找到元素，则返回null
        return null;
    }复制代码

3.

问 1：您上面说，存放一个元素时，先计算它的hash值肯定它的存储位置，而后再把这个元素放到对应的位置上，那万一这个位置上面已经有元素存在呢，新增的这个元素怎么办？

问 2：hash冲突（或者叫hash碰撞）是什么？为何会出现这种现象，如何解决hash冲突？

答：

hash冲突：当咱们调用put(K key, V value)操做添加key-value键值对，这个key-value键值对存放在的位置是经过扰动函数(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16)计算键key的hash值。随后将这个hash值 % 模上哈希表Node<K,V>[] table的长度获得具体的存放位置。因此put(K key, V value)多个元素，是有可能计算出相同的存放位置。此现象就是hash冲突或者叫hash碰撞。
例子以下：
元素 A 的hash值为 9，元素 B 的hash值为 17。哈希表Node<K,V>[] table的长度为8。则元素 A 的存放位置为9 % 8 = 1，元素 B 的存放位置为17 % 8 = 1。两个元素的存放位置均为table[1]，发生了hash冲突。
hash冲突的避免：既然会发生hash冲突，咱们就应该想办法避免此现象的发生，解决这个问题最关键就是若是生成元素的hash值。Java是使用“扰动函数”生成元素的hash值。

示例代码：

/**
    * JDK 7 的 hash方法
    */
    final int hash(int h) {

        h ^= k.hashCode();

        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

   /**
    * JDK 8 的 hash方法
    */
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }复制代码

Java7作了4次16位右位移异或混合，Java 8中这步已经简化了，只作一次16位右位移异或混合，而不是四次，但原理是不变的。例子以下：

右位移16位，正好是32bit的一半，本身的高半区和低半区作异或，就是为了混合原始哈希码的高位和低位，以此来加大低位的随机性。并且混合后的低位掺杂了高位的部分特征，这样高位的信息也被变相保留下来。

上述扰动函数的解释参考自：JDK 源码中 HashMap 的 hash 方法原理是什么？

hash冲突解决：解决hash冲突的方法有不少，常见的有：开发定址法，
再散列法，链地址法，公共溢出区法（详细说明请查看个人文章JAVA基础-自问自答学hashCode和equals）。HashMap是使用链地址法解决hash冲突的，当有冲突元素放进来时，会将此元素插入至此位置链表的最后一位，造成单链表。可是因为是单链表的缘故，每当经过hash % length找到该位置的元素时，均须要从头遍历链表，经过逐一比较hash值，找到对应元素。若是此位置元素过多，形成链表过长，遍历时间会大大增长，最坏状况下的时间复杂度为O(N)，形成查找效率太低。因此当存在位置的链表长度大于等于 8 时，HashMap会将链表转变为红黑树，红黑树最坏状况下的时间复杂度为O(logn)。以此提升查找效率。

4.

问：HashMap的容量为何必定要是2的n次方？

答：

由于调用put(K key, V value)操做添加key-value键值对时，具体肯定此元素的位置是经过 hash值 % 模上哈希表Node<K,V>[] table的长度 hash % length 计算的。可是"模"运算的消耗相对较大，经过位运算h & (length-1)也能够获得取模后的存放位置，而位运算的运行效率高，但只有length的长度是2的n次方时，h & (length-1) 才等价于 h % length。
并且当数组长度为2的n次幂的时候，不一样的key算出的index相同的概率较小，那么数据在数组上分布就比较均匀，也就是说碰撞的概率小，相对的，查询的时候就不用遍历某个位置上的链表，这样查询效率也就较高了。

例子：

上图中，左边两组的数组长度是16（2的4次方），右边两组的数组长度是15。两组的hash值均为8和9。
当数组长度是15时，当它们和1110进行&与运算（相同为1，不一样为0）时，计算的结果都是1000，因此他们都会存放在相同的位置table[8]中，这样就发生了hash冲突，那么查询时就要遍历链表，逐一比较hash值，下降了查询的效率。
同时，咱们能够发现，当数组长度为15的时候，hash值均会与14（1110）进行&与运算，那么最后一位永远是0，而0001，0011，0101，1001，1011，0111，1101这几个位置永远都不能存放元素了，空间浪费至关大，更糟的是这种状况中，数组可使用的位置比数组长度小了不少，这意味着进一步增长了碰撞的概率，减慢了查询的效率。

因此，HashMap的容量是2的n次方，有利于提升计算元素存放位置时的效率，也下降了hash冲突的概率。所以，咱们使用HashMap存储大量数据的时候，最好先预先指定容器的大小为2的n次方，即便咱们不指定为2的n次方，HashMap也会把容器的大小设置成最接近设置数的2的n次方，如，设置HashMap的大小为 7 ，则HashMap会将容器大小设置成最接近7的一个2的n次方数，此值为 8 。

上述回答参考自：深刻理解HashMap

示例代码：

/**
     * 返回一个比指定数cap大的，而且大小是2的n次方的数
     * Returns a power of two size for the given target capacity.
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }复制代码

5.

问：HashMap的负载因子是什么，有什么做用？

答：负载因子表示哈希表空间的使用程度（或者说是哈希表空间的利用率）。

例子以下：
底层哈希表Node<K,V>[] table的容量大小capacity为 16，负载因子load factor为 0.75，则当存储的元素个数size = capacity 16 * load factor 0.75等于 12 时，则会触发HashMap的扩容机制，调用resize()方法进行扩容。
当负载因子越大，则HashMap的装载程度就越高。也就是能容纳更多的元素，元素多了，发生hash碰撞的概率就会加大，从而链表就会拉长，此时的查询效率就会下降。
当负载因子越小，则链表中的数据量就越稀疏，此时会对空间形成浪费，可是此时查询效率高。
咱们能够在建立HashMap 时根据实际须要适当地调整load factor 的值；若是程序比较关心空间开销、内存比较紧张，能够适当地增长负载因子；若是程序比较关心时间开销，内存比较宽裕则能够适当的减小负载因子。一般状况下，默认负载因子 (0.75) 在时间和空间成本上寻求一种折衷，程序员无需改变负载因子的值。
所以，若是咱们在初始化HashMap时，就预估知道须要装载key-value键值对的容量size，咱们能够经过size / load factor 计算出咱们须要初始化的容量大小initialCapacity，这样就能够避免HashMap由于存放的元素达到阈值threshold而频繁调用resize()方法进行扩容。从而保证了较好的性能。

6.

问：您能说说HashMap和HashTable的区别吗？

答：HashMap和HashTable有以下区别：

1）容器总体结构：

HashMap的key和value都容许为null，HashMap遇到key为null的时候，调用putForNullKey方法进行处理，而对value没有处理。
Hashtable的key和value都不容许为null。Hashtable遇到null，直接返回NullPointerException。

2）容量设定与扩容机制：

HashMap默认初始化容量为 16，而且容器容量必定是2的n次方，扩容时，是以原容量 2倍的方式进行扩容。
Hashtable默认初始化容量为 11，扩容时，是以原容量 2倍再加 1的方式进行扩容。即int newCapacity = (oldCapacity << 1) + 1;。

3）散列分布方式（计算存储位置）：

HashMap是先将key键的hashCode通过扰动函数扰动后获得hash值，而后再利用 hash & (length - 1)的方式代替取模，获得元素的存储位置。
Hashtable则是除留余数法进行计算存储位置的（由于其默认容量也不是2的n次方。因此也没法用位运算替代模运算），int index = (hash & 0x7FFFFFFF) % tab.length;。
因为HashMap的容器容量必定是2的n次方，因此能使用hash & (length - 1)的方式代替取模的方式计算元素的位置提升运算效率，但Hashtable的容器容量不必定是2的n次方，因此不能使用此运算方式代替。

4）线程安全（最重要）：

HashMap 不是线程安全，若是想线程安全，能够经过调用synchronizedMap(Map<K,V> m)使其线程安全。可是使用时的运行效率会降低，因此建议使用ConcurrentHashMap容器以此达到线程安全。
Hashtable则是线程安全的，每一个操做方法前都有synchronized修饰使其同步，但运行效率也不高，因此仍是建议使用ConcurrentHashMap容器以此达到线程安全。

所以，Hashtable是一个遗留容器，若是咱们不须要线程同步，则建议使用HashMap，若是须要线程同步，则建议使用ConcurrentHashMap。

此处再也不对Hashtable的源码进行逐一分析了，若是想深刻了解的同窗，能够参考此文章
Hashtable源码剖析

7.

问：您说HashMap不是线程安全的，那若是多线程下，它是如何处理的？而且什么状况下会发生线程不安全的状况？

答：

HashMap不是线程安全的，若是多个线程同时对同一个HashMap更改数据的话，会致使数据不一致或者数据污染。若是出现线程不安全的操做时，HashMap会尽量的抛出ConcurrentModificationException防止数据异常，当咱们在对一个HashMap进行遍历时，在遍历期间，咱们是不能对HashMap进行添加，删除等更改数据的操做的，不然也会抛出ConcurrentModificationException异常，此为fail-fast（快速失败）机制。从源码上分析，咱们在put,remove等更改HashMap数据时，都会致使modCount的改变，当expectedModCount != modCount时，则抛出ConcurrentModificationException。若是想要线程安全，能够考虑使用ConcurrentHashMap。
并且，在多线程下操做HashMap，因为存在扩容机制，当HashMap调用resize()进行自动扩容时，可能会致使死循环的发生。

因为时间关系，我暂不带着你们一块儿去分析resize()方法致使死循环发生的现象形成缘由了，迟点有空我会再补充上去，请见谅，你们能够参考以下文章：

Java 8系列之从新认识HashMap

谈谈HashMap线程不安全的体现

8.

问：咱们在使用HashMap时，选取什么对象做为key键比较好，为何？

答：

可变对象：指建立后自身状态能改变的对象。换句话说，可变对象是该对象在建立后它的哈希值可能被改变。
咱们在使用HashMap时，最好选择不可变对象做为key。例如String，Integer等不可变类型做为key是很是明智的。
若是key对象是可变的，那么key的哈希值就可能改变。在HashMap中可变对象做为Key会形成数据丢失。由于咱们再进行hash & (length - 1)取模运算计算位置查找对应元素时，位置可能已经发生改变，致使数据丢失。

详细例子说明请参考：危险！在HashMap中将可变对象用做Key

总结

HashMap是基于Map接口实现的一种键-值对<key,value>的存储结构，容许null值，同时非有序，非同步(即线程不安全)。HashMap的底层实现是数组 + 链表 + 红黑树（JDK1.8增长了红黑树部分）。
HashMap定位元素位置是经过键key通过扰动函数扰动后获得hash值，而后再经过hash & (length - 1)代替取模的方式进行元素定位的。
HashMap是使用链地址法解决hash冲突的，当有冲突元素放进来时，会将此元素插入至此位置链表的最后一位，造成单链表。当存在位置的链表长度大于等于 8 时，HashMap会将链表转变为红黑树，以此提升查找效率。
HashMap的容量是2的n次方，有利于提升计算元素存放位置时的效率，也下降了hash冲突的概率。所以，咱们使用HashMap存储大量数据的时候，最好先预先指定容器的大小为2的n次方，即便咱们不指定为2的n次方，HashMap也会把容器的大小设置成最接近设置数的2的n次方，如，设置HashMap的大小为 7 ，则HashMap会将容器大小设置成最接近7的一个2的n次方数，此值为 8 。
HashMap的负载因子表示哈希表空间的使用程度（或者说是哈希表空间的利用率）。当负载因子越大，则HashMap的装载程度就越高。也就是能容纳更多的元素，元素多了，发生hash碰撞的概率就会加大，从而链表就会拉长，此时的查询效率就会下降。当负载因子越小，则链表中的数据量就越稀疏，此时会对空间形成浪费，可是此时查询效率高。
HashMap不是线程安全的，Hashtable则是线程安全的。但Hashtable是一个遗留容器，若是咱们不须要线程同步，则建议使用HashMap，若是须要线程同步，则建议使用ConcurrentHashMap。
在多线程下操做HashMap，因为存在扩容机制，当HashMap调用resize()进行自动扩容时，可能会致使死循环的发生。
咱们在使用HashMap时，最好选择不可变对象做为key。例如String，Integer等不可变类型做为key是很是明智的。

因为最近工做较忙，也有拖延症发做的问题，因此文章迟迟未能完成发布，现时完成的文章其实对我而言，也不算太好，但仍是打算先发出来让你们看看，一块儿学习学习，看有什么很差的地方，我再慢慢改进，若是此文对你有帮助，请给个赞，谢谢你们。

参考文章

Java 8系列之从新认识HashMap
JDK 源码中 HashMap 的 hash 方法原理是什么？
深刻理解HashMap
HashMap负载因子
 Hashtable源码剖析
 危险！在HashMap中将可变对象用做Key
谈谈HashMap线程不安全的体现