点击蓝色“程序员大帝 ”关注我哟java
加个“星标”,及时阅读最新技术文章node
每日鸡汤,好喝
正文
接着上篇文章《HashMap加载因子为何是0.75?转化红黑树阈值为8?》,我们继续聊聊 HashMap 这个重要的数据结构。虽然它很简单,可是每一次读源码,我都有不一样的体会,固然惟一不变的是对 Doug Lea 大神的崇拜。
nginx
在 JDK8 以后,对 HashMap 进行了重写,最显而易见的固然是引入了红黑树。由此而来,对它的哈希算法和寻址算法也作了必定的优化。程序员
正文
寻址算法面试
在插入和查找数据的时候,咱们会根据 key 获得它对应的 hash 值,而后再根据这个 hash 值进行一系列计算,获得元素在数组的下标位置,这个计算过程就是就是寻址算法。算法
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k)))) return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode) return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do { if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } while ((e = e.next) != null); } } return null; }
其中最关键的是下面这一行,它展现了如何经过计算好的 hash 值来获得对应的哈希槽的位置:数组
first = tab[(n - 1) & hash])
你们第一个想法确定是经过模运算来计算,所以引出了下面的问题
bash
HashMap 中寻址算法为何使用&(与运算),代替模运算?微信
咱们知道了一个 key 的 hash 值,用这个hash值跟数组长度取模,就能够获得下标位置,其中 n 是数组的长度:数据结构
(n - 1) & hash
若是使用与运算,其实该算法的结果和模运算的结果是相同的。
可是,对于现代的处理器来讲,除法和求余数(模运算)是最慢的动做。
根据数学公式:
a % b = (b-1) & a
当 b 是 2 的指数时,等式成立。你们应该记起来,HashMap 默认的长度必定是 2 的指数幂,因此这一个等式针对 HashMap 是永远成立的。经过与运算,提升了运算的效率。
哈希算法
static final int hash(Object key) {
int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}
看完源代码,第一次确定会被其中的异或运算和右移运算搞蒙,为何要异或呢?为何要移位?并且移位 16?
咱们分析一下:
首先,假设有一种状况,若是数组长度 n=16,那么根据寻址算法,也就是哈希值 和 15 这个数进行与运算
对象 A 的 hashCode 为 1000 0100 0111 0001 0000 0111 1000 0000
n-1=15 0000 0000 0000 0000 0000 0000 0000 1111
对象 B 的 hashCode 为 0111 0111 0011 1000 1010 0001 0100 0000
n-1=15 0000 0000 0000 0000 0000 0000 0000 1111
咱们会发现 A、B 和 15 这个数进行与运后,得出来的结果都是 0, 这样的散列结果太让人失望了。很明显不是一个好的散列算法。
可是若是咱们将 hashCode 值右移 16 位,而后再进行异或运算(若是两个数不一样,结果为1,相同为0),这样的话,就能避免咱们上面的状况的发生。
对象A hashCode: 1000 0100 0111 0001 0000 0111 1000 0000
对象A hashCode右移16位: 0000 0000 0000 0000 1000 0100 0111 0001
异或运算: 1000 0100 0111 0001 1000 0011 1111 0001
n-1=15 0000 0000 0000 0000 0000 0000 0000 1111
与运算: 0000 0000 0000 0000 0000 0000 0000 0001
对象B hashCode: 0111 0111 0011 1000 1010 0001 0100 0000
对象B hashCode右移16位: 0000 0000 0000 0000 0111 0111 0011 1000
异或运算: 0111 0111 0011 1000 1101 0110 0100 1000
n-1=15 0000 0000 0000 0000 0000 0000 0000 1111
与运算: 0000 0000 0000 0000 0000 0000 0000 1000
经过结果能够看出来,这样异或运算获得结果,再和 n-1 与运算,获得结果不一样,避免了 hash 冲突。
文末福利
找工做的小伙伴能够后台联系我,拉你进秋招/内推/面试群,我也给你们整理了各大公司的内推通道、简历模板还有历年的笔试题,你们要好好准备哦。
还能够帮助你们免费修改简历、模拟面试哦~可能下期视频的主角就是你哦~
我是无忌,Stay Tuned!
本文分享自微信公众号 - 程序员大帝(kingcoding)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。