哈希表知识点小结

时间 2019-12-13

标签哈希知识小结繁體版

原文原文链接

Set集合底层是基于HashMap的，再准备看Map源码集合前得有哈希表和红黑树相关的数据结构的知识。数组

对哈希表进行了温习，对知识点作出如下小结数据结构

1.为何须要哈希表?Hash函数是干什么用的？函数

2. 哈希碰撞是什么？哈希碰撞的解决方法有哪些？性能

3.哈希表的优缺点是什么？优化

1.为何须要哈希表？哈希表是什么？Hash函数是干什么用的？ 搜索引擎

不管是数组仍是链表都对查询显得有些无力，要想知道某个元素是否在其中只有从头至尾进行对比查询，效率较低。出现这个问题的根源就是咱们没办法直接根据一个元素找到它的存储位置。哈希表便应运而生了。 spa

哈希表(散列表)：是经过关键码值（Key）进行访问的一种数据结构。Key经过特定的哈希函数进行计算映射成一个int数值获得。设计

哈希函数就是用来计算获得特定的int型数值的规则，如数据结构所学到的除留余数法，直接定址法等 blog

2.解决hash碰撞的方法有哪些？继承

咱们知道int的值是有限的，它只有2^32^个，经过哈希函数计算后的所获得的int数值会有重复，此时会产生冲突，即哈希碰撞。解决方法有许多，如二维数组法，开放定址法，数组+链表法等

开放地址法：哈希表基本不会像数组同样每一个位置都有元素，这样就能够将碰撞的元素插入到这些空闲的位置中区，这种方案称为定址法。有一次线性探测，二次线性探测，这都是数据结构考过的内容，但其可扩展性不佳，且JDK源代码中也不是使用这种方法解决

二维数组法：即将碰撞的元素按照顺序依次存储起来，但最大的缺点是数组的大小是固定的，因此第二维的数组长度都是同样的，可是哈希碰撞必定是比较少发生的状况，也就是咱们声明了一个很大的数组，可是其中大部分都是闲置的，这就浪费了大量的内存。以下图所示

拉链法：目前比较通用的一种方式，数组+链表组合的方式。这是当前比较理想的方法，既继承了数组的优势，又在碰撞时继承了链表的优势，这也是哈希表强大的地方之一。当出现哈希碰撞时，在该位置的数据就经过链表的方式连接起来，以下图所示：

在JDK1.7及以前的版本中，HashMap的存储结构和上图是一致的，在JDK1.8以后还加入了红黑树以进一步优化，以后将对树，二叉树，红黑树进行整理。

2.哈希碰撞的优缺点

哈希表是一种优化存储的思想，具体存储元素的依然是其余的数据结构。设计良好的哈希表，能同时兼备数组和链表的优势，它能在插入和查找时都具有良好的性能。然而设计很差的哈希表，有可能会出现较多的哈希碰撞，致使链表过长，从而哈希表会更像一个链表。还有当数据量很大时，为防止链表过长，就须要对数组进行扩容，这时就涉及到了数组的拷贝，其对性能的影响也很严重，因此须要提早对可能的状况有良好的预测，才能真正发挥哈希表的优点。

PS：以上皆为纯理论的知识点，具体的实现代码须要结合搜索引擎加以练习。后面两天会去作这方面练习。