HashMap的死循环-HashMap Infinite Loop

时间 2019-11-30

标签 hashmap 循环 infinite loop 繁體版

原文原文链接

问题的症状

从前咱们的Java代码由于一些缘由使用了HashMap这个东西，可是当时的程序是单线程的，一切都没有问题。后来，咱们的程序性能有问题，因此须要变成多线程的，因而，变成多线程后到了线上，发现程序常常占了100%的CPU，查看堆栈，你会发现程序都Hang在了HashMap.get()这个方法上了，重启程序后问题消失。可是过段时间又会来。并且，这个问题在测试环境里可能很难重现。java

Hash表数据结构

HashMap一般会用一个指针数组（假设为table[]）来作分散全部的key，当一个key被加入时，会经过Hash算法经过key算出这个数组的下标i，而后就把这个<key, value>插到table[i]中，若是有两个不一样的key被算在了同一个i，那么就叫冲突，又叫碰撞，这样会在table[i]上造成一个链表。算法

咱们知道，若是table[]的尺寸很小，好比只有2个，若是要放进10个keys的话，那么碰撞很是频繁，因而一个O(1)的查找算法，就变成了链表遍历，性能变成了O(n)，这是Hash表的缺陷。数组

因此，Hash表的尺寸和容量很是的重要。通常来讲，Hash表这个容器当有数据要插入时，都会检查容量有没有超过设定的thredhold，若是超过，须要增大Hash表的尺寸，可是这样一来，整个Hash表里的元素都须要被重算一遍。这叫rehash，这个成本至关的大。数据结构

HashMap的rehash源代码

Put一个Key,Value对到Hash表中：多线程

public V put(K key, V value) {
    ......
    //算Hash值
    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    //若是该key已被插入，则替换掉旧的value （连接操做）
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    //该key不存在，须要增长一个结点
    addEntry(hash, key, value, i);
    return null;
}
复制代码

检查容量是否超标并发

void addEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
    table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
    //查看当前的size是否超过了咱们设定的阈值threshold，若是超过，须要resize
    if (size++ >= threshold)
        resize(2 * table.length);
}
复制代码

新建一个更大尺寸的hash表，而后把数据从老的Hash表中迁移到新的Hash表中oop

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    ......
    //建立一个新的Hash Table
    Entry[] newTable = new Entry[newCapacity];
    //将Old Hash Table上的数据迁移到New Hash Table上
    transfer(newTable);
    table = newTable;
    threshold = (int)(newCapacity * loadFactor);
}

void transfer(Entry[] newTable) {
    Entry[] src = table;
    int newCapacity = newTable.length;
    //下面这段代码的意思是：
    // 从OldTable里摘一个元素出来，而后放到NewTable中
    for (int j = 0; j < src.length; j++) {
        Entry<K,V> e = src[j];
        if (e != null) {
            src[j] = null;
            do {
                Entry<K,V> next = e.next;
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } while (e != null);
        }
    }
}
复制代码

正常的ReHash的过程

我假设了咱们的hash算法就是简单的用key mod 一下表的大小（也就是数组的长度）。
最上面的是old hash 表，其中的Hash表的size=2, 因此key = 3, 7, 5，在mod2之后都冲突在table[1]这里了。
接下来的三个步骤是Hash表 resize成4，而后全部的<key,value> 从新rehash的过程。

并发下的Rehash

1.假设咱们有两个线程。我用红色和浅蓝色标注了一下。

再贴一下transfer代码中的这个细节：性能

do {
    Entry<K,V> next = e.next; // <--假设线程一执行到这里就被调度挂起了
    int i = indexFor(e.hash, newCapacity);
    e.next = newTable[i];
    newTable[i] = e;
    e = next;
} while (e != null);
复制代码

而咱们的线程二执行完成了。因而咱们有下面的这个样子。测试

注意，由于Thread1的 e 指向了key(3)，而next指向了key(7)，其在线程二rehash后，指向了线程二重组后的链表。咱们能够看到链表的顺序被反转后。this

2.线程一被调度回来执行。

先是执行 newTalbe[i] = e
而后是e = next，致使了e指向了key(7)
而下一次循环的next = e.next致使了next指向了key(3)

3.一切安好

线程一接着工做。把key(7)摘下来，放到newTable[i]的第一个，而后把e和next往下移。

4.环形连接出现

e.next = newTable[i] 致使 key(3).next 指向了 key(7) 注意：此时的key(7).next 已经指向了key(3)，环形链表就这样出现了。

因而，当咱们的线程一调用到，HashTable.get(11)时，悲剧就出现了——Infinite Loop。

1. JAVA中HASHMAP致使死循环（HashMap Infinite Loop）
2. hashmap死循环
3. HashMap的死循环
4. 【转】Java HashMap的死循环
5. Java HashMap的死循环
6. JAVA HASHMAP的死循环
7. HashMap resize导致死循环
8. JDK1.7的HashMap死循环
9. 疫苗：JAVA HASHMAP的死循环
10. HashMap死循环分析
更多相关文章...
• PHP 循环 - While 循环 - PHP教程
• PHP 循环 - For 循环 - PHP教程
• 漫谈MySQL的锁机制
• 互联网组织的未来：剖析GitHub员工的任性之源