原创|你真的了解HashMap吗？(HashMap源码分析)

时间 2019-11-09

标签原创了解 hashmap 源码分析繁體版

原文原文链接

**面试

前言

**数组

讲讲hashMap，简单的东西你还真不必定理解，真心的以为须要有一篇文章把它给讲明白，这样就不再怕面试被问到了。安全

HashMap介绍bash

HashMap初始化数据结构

HashMap扩容机制函数

HashMap数据结构性能

HashMap数据碰撞的解决学习

HashMap使用ui

1、HashMap介绍

他是基于哈希表的 Map 接口的实现。此实现提供全部可选的映射操做，并容许使用 null 值和 null 键。此类不保证映射的顺序，特别是它不保证该顺序恒久不变。此实现假定哈希函数将元素适当地分布在各桶之间，可为基本操做（get 和 put）提供稳定的性能。另外，HashMap是非线程安全的，而Hashtable是线程安全的。this

HashMap是继承了AbstractMap类,实现了 Map，Cloneable, Serializable 接口.

public class HashMap<K,V>
    extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
复制代码

2、HashMap初始化

重要参数说明

//初始化的容量大小
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    //最大容量大小
    static final int MAXIMUM_CAPACITY = 1 << 30;
    //默认负载因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
复制代码

HashMap初始化的时候就作两件事,初始化了容量(比做一个桶)的大小为16和负载因子为0.75

public HashMap() {
     //初始化桶大小DEFAULT_INITIAL_CAPACITY=16  
     //负载因子DEFAULT_LOAD_FACTOR=0.75
     this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}
public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        //若是容量超过最大的值，取最大值
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        //初始化负载因子0.75
        this.loadFactor = loadFactor;
        //初始化桶大小16
        threshold = initialCapacity;
        init();
    }
复制代码

3、HashMap扩容机制

负载因子能够理解为饱满度，负载因子越大，占用的的空间越小，可是查询的效率越低。负载因子越小，占用空间越大，可是会提升查询效率。这是由数据结构决定的，下面讲。

HashMap 的实际容量就是因子*容量，其默认值是 16×0.75=12；这个很重要，对效率有必定影响！当存入HashMap的对象超过这个容量时，HashMap 就会就须要 resize（扩容2倍后重排）。

private void inflateTable(int toSize) {
        //最接近且大于toSize的2的冪数
        int capacity = roundUpToPowerOf2(toSize);
        //定义最大的实际容量，超过这个值就须要扩容
        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
        //定义Entry数组，放put数据
        table = new Entry[capacity];
        initHashSeedAsNeeded(capacity);
  }
  //最接近且大于number的2的冪数,例如number为3返回结果是4，number为4返回结果为4
   private static int roundUpToPowerOf2(int number) {
        return number >= MAXIMUM_CAPACITY
                ? MAXIMUM_CAPACITY
                : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
    }
//添加元素，并判断是否须要扩容
void addEntry(int hash, K key, V value, int bucketIndex) {
      //size为当前数组大小，threshold为实际最大容量,若是大于就扩容
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);//扩容
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
        //添加
        createEntry(hash, key, value, bucketIndex);
    }
    //扩容
    void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        //判断老的数组是否等于最大容量，若是等于不容许扩容
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }
        //定义新的数据
        Entry[] newTable = new Entry[newCapacity];
        //从新再新的数组中定义老的数据
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
    //须要从新在新的数组中计算保存位置，并保存
void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }
复制代码

由于从新建立新的数据，从新计算元素的存储位置很是的影响性能，因此最好预估元素的多少，在建立HashMap的时候定义它的大小，最好为2的冪数，这样能够更好的利用空降。

4、HashMap数据结构

HashMap是一个散列桶（数组和链表），它存储的内容是键值对key-value映射，数组和链表的数据结构，能在查询和修改方面继承了数组的线性查询和链表的寻址修改。（横排表示数组，纵排表示链表）
复制代码

5、HashMap数据碰撞的解决

由于哈希值有哈希冲突的存在，因此不一样的key可能有相同的哈希值。这个是后就须要经过链表结构来解决问题了。

正常状况，当咱们put存储一个key-value数据的时候，HashMap会计根据key的哈希值计算应该在桶中保存的位置，判断该位置是否有数据，若是有数据，须要判断hash和key时候相等，若是相等，新的值替换老的值，并返回老的值。（这个不是“碰撞”，这中状况key是同样的）

public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        //计算哈希
        int hash = hash(key);
        //计算桶中的位置
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
          //判断哈希和key是否同样
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {        //同样
              //哈希同样，key也同样
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        //i位置数据为空；或者数据不为空，hash不同；或者哈希同样，key不同
        modCount++;
        //添加
        addEntry(hash, key, value, i);
        return null;
    }
复制代码

i位置数据为空；或者数据不为空，hash不同；或者哈希同样（哈希碰撞），key不同，走下面流程：

下面源码中，bucketIndex为新的数据在数组中的位置，若是这个位置没有数据，会保存新数据，而且它在链表中的下一数据是null（e为null），若是这个位置已经有数据，会在这个位置保存新的数据，它在链表中的下一个数据是老的数据(e)。

void createEntry(int hash, K key, V value, int bucketIndex) {
        //获取当前位置的数据e，有多是null
        Entry<K,V> e = table[bucketIndex];
        //当前位置保存新的数据，历史数据e为新数据的链表相联的数据
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        size++;
}
复制代码

假如哈希值不同，会产生碰撞吗？答案是确定的.

首先咱们看一下，hashMap中数据在桶中位置计算方式

static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }
复制代码

“与”运算扩展：

参加运算的两个数据，按二进制位进行“与”运算。

运算规则：0&0=0;0&1=0;1&0=0;1&1=1;

即：两位同时为“1”，结果才为“1”，不然为0

举例说明： 1&(16-1)=1 17&(16-1)=1

因此咱们能够理解，当桶的容量是固定的时候，负载因子越大，最大实际容量就会越大，须要保存的数据就越多。“碰撞”的状况出现的状况就会更多，增长了HashMap中链表结构中的数据，下降查询的效率。增长了空间利用率。

相反，当负载因子越小的时候，桶的实际容量就会越小，能够存的数据越少，碰撞状况减小，减小链表数据，增长查询效率。下降了空间利用率。

6、HashMap的简单使用

搞定~~~~~

喜欢的小伙伴记得关注一下~各类学习资料免费领取~