JDK8 对 hash算法和寻址算法作了哪些优化？

点击蓝色“程序员大帝 ”关注我哟java

加个“星标”，及时阅读最新技术文章node

每日鸡汤，好喝

正文

接着上篇文章《HashMap加载因子为何是0.75？转化红黑树阈值为8？》，我们继续聊聊 HashMap 这个重要的数据结构。虽然它很简单，可是每一次读源码，我都有不一样的体会，固然惟一不变的是对 Doug Lea 大神的崇拜。
nginx

在 JDK8 以后，对 HashMap 进行了重写，最显而易见的固然是引入了红黑树。由此而来，对它的哈希算法和寻址算法也作了必定的优化。程序员

正文

寻址算法面试

在插入和查找数据的时候，咱们会根据 key 获得它对应的 hash 值，而后再根据这个 hash 值进行一系列计算，获得元素在数组的下标位置，这个计算过程就是就是寻址算法。算法

 final Node<K,V> getNode(int hash, Object key) {
 Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&            (first = tab[(n - 1) & hash]) != null) {            if (first.hash == hash && // always check first node                ((k = first.key) == key || (key != null && key.equals(k)))) return first;
 if ((e = first.next) != null) {
                if (first instanceof TreeNode) return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {                    if (e.hash == hash &&                        ((k = e.key) == key || (key != null && key.equals(k))))                        return e;                } while ((e = e.next) != null);            } }        return null; }

其中最关键的是下面这一行，它展现了如何经过计算好的 hash 值来获得对应的哈希槽的位置：数组

first = tab[(n - 1) & hash])

你们第一个想法确定是经过模运算来计算，所以引出了下面的问题
bash

HashMap 中寻址算法为何使用&（与运算），代替模运算？微信

咱们知道了一个 key 的 hash 值，用这个hash值跟数组长度取模，就能够获得下标位置，其中 n 是数组的长度：数据结构

（n - 1) & hash

若是使用与运算，其实该算法的结果和模运算的结果是相同的。

可是，对于现代的处理器来讲，除法和求余数（模运算）是最慢的动做。

根据数学公式：

a % b = （b-1） & a

当 b 是 2 的指数时，等式成立。你们应该记起来，HashMap 默认的长度必定是 2 的指数幂，因此这一个等式针对 HashMap 是永远成立的。经过与运算，提升了运算的效率。

哈希算法

static final int hash(Object key) {
     int h;      return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}

看完源代码，第一次确定会被其中的异或运算和右移运算搞蒙，为何要异或呢？为何要移位？并且移位 16？

咱们分析一下：

首先，假设有一种状况，若是数组长度 n=16，那么根据寻址算法，也就是哈希值和 15 这个数进行与运算

对象 A 的 hashCode 为 1000 0100 0111 0001 0000 0111 1000 0000

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111

对象 B 的 hashCode 为 0111 0111 0011 1000 1010 0001 0100 0000

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111

咱们会发现 A、B 和 15 这个数进行与运后，得出来的结果都是 0，这样的散列结果太让人失望了。很明显不是一个好的散列算法。

可是若是咱们将 hashCode 值右移 16 位，而后再进行异或运算（若是两个数不一样，结果为1，相同为0），这样的话，就能避免咱们上面的状况的发生。

对象A hashCode： 1000 0100 0111 0001 0000 0111 1000 0000

对象A hashCode右移16位： 0000 0000 0000 0000 1000 0100 0111 0001

异或运算： 1000 0100 0111 0001 1000 0011 1111 0001

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111

与运算： 0000 0000 0000 0000 0000 0000 0000 0001

对象B hashCode： 0111 0111 0011 1000 1010 0001 0100 0000

对象B hashCode右移16位： 0000 0000 0000 0000 0111 0111 0011 1000

异或运算： 0111 0111 0011 1000 1101 0110 0100 1000

n-1=15 0000 0000 0000 0000 0000 0000 0000 1111

与运算： 0000 0000 0000 0000 0000 0000 0000 1000

经过结果能够看出来，这样异或运算获得结果，再和 n-1 与运算，获得结果不一样，避免了 hash 冲突。

文末福利

找工做的小伙伴能够后台联系我，拉你进秋招/内推/面试群，我也给你们整理了各大公司的内推通道、简历模板还有历年的笔试题，你们要好好准备哦。

还能够帮助你们免费修改简历、模拟面试哦~可能下期视频的主角就是你哦~

我是无忌，Stay Tuned！

本文分享自微信公众号 - 程序员大帝（kingcoding）。
若有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一块儿分享。