HashMap和HashTable的比较

时间 2019-11-13

原文原文链接

https://blog.csdn.net/wangxing233/article/details/79452946java

HashMap 与HashTable的区别面试

HashMap与Hashtable的区别是面试中常常遇到的一个问题。这个问题看似简单，但若是深究进去，也能了解到很多知识。本文对二者历来源，特性，算法等多个方面进行对比总结。力争多角度，全方位的展现两者的不一样，作到此问题的终结版。算法

1 做者
Hashtable的做者：

HashMap的做者：编程

Hash Map的做者比Hashtable的做者多了著名顶顶的并发大神Doug Lea。他写了util.concurrent包。著有并发编程圣经Concurrent Programming in Java: Design Principles and Patterns 一书。他的我的主页： http://g.oswego.edu/浏览器

Josh Bloch 为领导了众多Java平台特性的设计和实现，其中包括Java Collection框架、java.math包以及assert机制。著有 Effective Java 一书。安全

Arthur van Hoff最先任职于硅谷的Sun Microsystems公司，从事Java程序语言的早期开发工做。设计并实现了JDK 1.0的许多方面，包括Java编译器、Java调试器、许多标准Java类以及HotJava浏览器。随后创立了多家成功的企业，其中包括Marimba（1999年IPO）、Strangeberry（后被TiVo收购）、ZING（后被Dell收购）和Ellerdale（后被Flipboard收购）。Java命名来源有这么一种说法，来源于开发人员名字的组合：James Gosling、Arthur Van Hoff和Andy Bechtolsheim首字母的缩写。数据结构

Neal Gafter是Java SE 4和5语言加强的主要设计者和实现者，他的Java闭包实现赢得了OpenJDK创新者挑战赛的大奖。他也在继续参与SE 7和8的语言发展。以前Neal在为Google的在线日历工做，也曾经是C++标准委员会的一员，并曾在Sun微系统公司，MicroTec研究院和德州仪器领导开发C和C++编译器。现在Neal在微软开发.NET平台编程语言。Neal是《Java Puzzlers：Traps, Pitfalls and Corner Cases》（Addison Wesley，2005）一书的合做者。他拥有罗彻斯特大学计算机科学的博士学位。多线程

可见这些做者都是java乃至整个it领域大名鼎鼎的人物。也只有这些大师级人物才能写出HashMap这么大道至简的数据类型了。闭包

2 产生时间
Hashtable是java一开始发布时就提供的键值映射的数据结构，而HashMap产生于JDK1.2。虽然Hashtable比HashMap出现的早一些，可是如今Hashtable基本上已经被弃用了。而HashMap已经成为应用最为普遍的一种数据类型了。形成这样的缘由一方面是由于Hashtable是线程安全的，效率比较低。另外一方面多是由于Hashtable没有遵循驼峰命名法吧。。。并发

3 继承的父类不一样
HashMap和Hashtable不只做者不一样，并且连父类也是不同的。HashMap是继承自AbstractMap类，而HashTable是继承自Dictionary类。不过它们都实现了同时实现了map、Cloneable（可复制）、Serializable（可序列化）这三个接口

Dictionary类是一个已经被废弃的类（见其源码中的注释）。父类都被废弃，天然而然也没人用它的子类Hashtable了。
* NOTE: This class is obsolete. New implementations should
* implement the Map interface, rather than extending this class.

4 对外提供的接口不一样
Hashtable比HashMap多提供了elments() 和contains() 两个方法。

elments() 方法继承自Hashtable的父类Dictionnary。elements() 方法用于返回此Hashtable中的value的枚举。

contains()方法判断该Hashtable是否包含传入的value。它的做用与containsValue()一致。事实上，contansValue() 就只是调用了一下contains() 方法。

5 对Null key 和Null value的支持不一样
Hashtable既不支持Null key也不支持Null value。Hashtable的put()方法的注释中有说明。

当key为Null时，调用put() 方法，运行到下面这一步就会抛出空指针异常。由于拿一个Null值去调用方法了。

当value为null值时，Hashtable对其作了限制，运行到下面这步也会抛出空指针异常。

HashMap中，null能够做为键，这样的键只有一个；能够有一个或多个键所对应的值为null。当get()方法返回null值时，多是 HashMap中没有该键，也可能使该键所对应的值为null。所以，在HashMap中不能由get()方法来判断HashMap中是否存在某个键，而应该用containsKey()方法来判断。

6 线程安全性不一样
Hashtable是线程安全的，它的每一个方法中都加入了Synchronize方法。在多线程并发的环境下，能够直接使用Hashtable，不须要本身为它的方法实现同步

HashMap不是线程安全的，在多线程并发的环境下，可能会产生死锁等问题。具体的缘由在下一篇文章中会详细进行分析。使用HashMap时就必需要本身增长同步处理，

虽然HashMap不是线程安全的，可是它的效率会比Hashtable要好不少。这样设计是合理的。在咱们的平常使用当中，大部分时间是单线程操做的。HashMap把这部分操做解放出来了。当须要多线程操做的时候可使用线程安全的ConcurrentHashMap。ConcurrentHashMap虽然也是线程安全的，可是它的效率比Hashtable要高好多倍。由于ConcurrentHashMap使用了分段锁，并不对整个数据进行锁定。

7 遍历方式的内部实现上不一样
Hashtable、HashMap都使用了 Iterator。而因为历史缘由，Hashtable还使用了Enumeration的方式。

HashMap的Iterator是fail-fast迭代器。当有其它线程改变了HashMap的结构（增长，删除，修改元素），将会抛出ConcurrentModificationException。不过，经过Iterator的remove()方法移除元素则不会抛出ConcurrentModificationException异常。但这并非一个必定发生的行为，要看JVM。

JDK8以前的版本中，Hashtable是没有fast-fail机制的。在JDK8及之后的版本中，HashTable也是使用fast-fail的，源码以下：

modCount的使用相似于并发编程中的CAS（Compare and Swap）技术。咱们能够看到这个方法中，每次在发生增删改的时候都会出现modCount++的动做。而modcount能够理解为是当前hashtable的状态。每发生一次操做，状态就向前走一步。设置这个状态，主要是因为hashtable等容器类在迭代时，判断数据是否过期时使用的。尽管hashtable采用了原生的同步锁来保护数据安全。可是在出现迭代数据的时候，则没法保证边迭代，边正确操做。因而使用这个值来标记状态。一旦在迭代的过程当中状态发生了改变，则会快速抛出一个异常，终止迭代行为。

8 初始容量大小和每次扩充容量大小的不一样
Hashtable默认的初始大小为11，以后每次扩充，容量变为原来的2n+1。HashMap默认的初始化大小为16。以后每次扩充，容量变为原来的2倍。

建立时，若是给定了容量初始值，那么Hashtable会直接使用你给定的大小，而HashMap会将其扩充为2的幂次方大小。也就是说Hashtable会尽可能使用素数、奇数。而HashMap则老是使用2的幂做为哈希表的大小。

之因此会有这样的不一样，是由于Hashtable和HashMap设计时的侧重点不一样。Hashtable的侧重点是哈希的结果更加均匀，使得哈希冲突减小。当哈希表的大小为素数时，简单的取模哈希的结果会更加均匀。而HashMap则更加关注hash的计算效率问题。在取模计算时，若是模数是2的幂，那么咱们能够直接使用位运算来获得结果，效率要大大高于作除法。HashMap为了加快hash的速度，将哈希表的大小固定为了2的幂。固然这引入了哈希分布不均匀的问题，因此HashMap为解决这问题，又对hash算法作了一些改动。这从而致使了Hashtable和HashMap的计算hash值的方法不一样
9 计算hash值的方法不一样
为了获得元素的位置，首先须要根据元素的 KEY计算出一个hash值，而后再用这个hash值来计算获得最终的位置。

Hashtable直接使用对象的hashCode。hashCode是JDK根据对象的地址或者字符串或者数字算出来的int类型的数值。而后再使用除留余数发来得到最终的位置。

Hashtable在计算元素的位置时须要进行一次除法运算，而除法运算是比较耗时的。
HashMap为了提升计算效率，将哈希表的大小固定为了2的幂，这样在取模预算时，不须要作除法，只须要作位运算。位运算比除法的效率要高不少。

HashMap的效率虽然提升了，可是hash冲突却也增长了。由于它得出的hash值的低位相同的几率比较高，而计算位运算

为了解决这个问题，HashMap从新根据hashcode计算hash值后，又对hash值作了一些运算来打散数据。使得取得的位置更加分散，从而减小了hash冲突。固然了，为了高效，HashMap只作了一些简单的位处理。从而不至于把使用2 的幂次方带来的效率提高给抵消掉。

附上关于这个问题的说明： Joshua Bloch: The downside of using a power-of-two is that the resulting hash table is very sensitive to the quality of the hash function (hashCode). It is imperative that any change in the input must affect the low order bits of the hash value. (Ideally, it should affect all bits of the hash value with equal likelihood.) Because we have no assurance that this is true, we put in a secondary (or “defensive”) hash function when we switched to the power-of-two hash table. This hash function is applied to the results of hashCode before masking off the low order bits. Its job is to scatter the information over all the bits, and in particular, into the low order bits. Of course it has to run very fast, or you lose the benefit of switching to the power-of-two-sized table. The original secondary hash function in 1.4 turned out to be insufficient. We knew that this was a theoretical possibility, but we thought that it didn’t affect any practical data sets. We were wrong. The replacement secondary hash function (which I developed with the aid of a computer) has strong statistical properties that pretty much guarantee good bucket distribution.-------------------