Hashtable数据存储结构-遍历规则，Hash类型的复杂度为啥都是O(1)-源码分析(阿里)

时间 2019-11-20

标签 hashtable 数据存储结构遍历规则 hash 类型复杂度为啥都是源码分析阿里栏目 Java 繁體版

原文原文链接

hashmap的扩容因子是0.75 缘由参考：HashMap默认加载因子为何选择0.75？(阿里)html

Hashtable 是一个很常见的数据结构类型，前段时间阿里的面试官说只要搞懂了HashTable，hashMap,HashSet,treeMap,treeSet这几个数据结构，阿里的数据结构面试没问题。java

一查才发现，这里面的知识确实很多，都很经典，所以作一个专题面试

经过此文章，能够了解到一下内容（我去美团，京东，阿里基本每次都问这几个问题）算法

(1) Hashtable的存储结构 (数组+链表)数组

(2)Hashtable的扩容原理，扩容因子0.75，bucket的初始大小11.(扩容的函数为2N+1,hashMap的扩容函数是2N,之因此是2的倍数，是由于，Hashtable为了保证速度，扩容直接位移<<1这样就是2的倍数）安全

(3)添加，查找操做的深层次原理，数据结构

(4)搜素的几种方法，以及为何会产生这几种搜索方法。函数

首先总览一下：post

Hashtable与Map关系以下图：性能

从图中能够看出：
(1) Hashtable继承于Dictionary类，实现了Map接口。Map是"key-value键值对"接口，Dictionary是声明了操做"键值对"函数接口的抽象类。
(2) Hashtable是经过"拉链法"实现的哈希表。它包括几个重要的成员变量：table, count, threshold, loadFactor, modCount。
　　table是一个Entry[]数组类型，而Entry实际上就是一个单向链表。哈希表的"key-value键值对"都是存储在Entry数组中的。
　　count是Hashtable的大小，它是Hashtable保存的键值对的数量。
　　threshold是Hashtable的阈值，用于判断是否须要调整Hashtable的容量。threshold的值="容量*加载因子"。
　　loadFactor就是加载因子。
　　modCount是用来实现fail-fast机制的

和HashMap同样，Hashtable 也是一个散列表，它存储的内容是键值对(key-value)映射，都是数组+链表的形式存储数据：

定义以下：

public class Hashtable<K,V>
    extends Dictionary<K,V>
    implements Map<K,V>, Cloneable, java.io.Serializable {
....

public Hashtable() {
this(11, 0.75f);
} 

}

由此能看出两点：

(1)、Hashtable默认 bucket 容量是 11 ，扩容因子是0.75.

也就是说若是如今咱们建立一个Hashtable，若是里面有8个数值，由于：8>=11*0.75;那么，在添加到第8个数值的时候，Hashtable会扩容，

Hashtable 的实例有两个参数影响其性能：初始容量和加载因子。容量是哈希表中桶的数量，初始容量就是哈希表建立时的容量。注意，哈希表的状态为 open：在发生“哈希冲突”的状况下，单个桶会存储多个条目，这些条目必须按顺序搜索。加载因子是对哈希表在其容量自动增长以前能够达到多满的一个尺度。初始容量和加载因子这两个参数只是对该实现的提示。关于什么时候以及是否调用 rehash 方法的具体细节则依赖于该实现。一般，默认加载因子是 0.75, 这是在时间和空间成本上寻求一种折衷。加载因子太高虽然减小了空间开销，但同时也增长了查找某个条目的时间（在大多数 Hashtable 操做中，包括 get 和 put 操做，都反映了这一点）。

这是Hashtable的构造函数：默认初始容量是11，而加载因子是0.75；

 protected void rehash() {
        int oldCapacity = table.length;
        Entry<?,?>[] oldMap = table;

        // overflow-conscious code
        int newCapacity = (oldCapacity << 1) + 1; if (newCapacity - MAX_ARRAY_SIZE > 0) {
            if (oldCapacity == MAX_ARRAY_SIZE)
                // Keep running with MAX_ARRAY_SIZE buckets
                return;
            newCapacity = MAX_ARRAY_SIZE;
        }}

红色的字体代表 Hashtable 扩容的函数是直接左移动1位，并加一，也就是：扩大为原来的2n+1；

(2)、Hashtable 继承于Dictionary，实现了Map、Cloneable、java.io.Serializable接口。

Hashtable包含的方法：elements() ，其做用是返回“全部value”的枚举对象

public synchronized Enumeration<V> elements() {
    return this.<V>getEnumeration(VALUES);
 }

// 获取Hashtable的枚举类对象
private <T> Enumeration<T> getEnumeration(int type) {
if (count == 0) {
return Collections.emptyEnumeration();
} else {
return new Enumerator<>(type, false);
}
}

从中，咱们能够看出：

(1) 若Hashtable的实际大小为0,则返回“空枚举类”对象emptyEnumerator；
(2) 不然，返回正常的Enumerator的对象。(Enumerator实现了迭代器和枚举两个接口，请注意这两个接口，这是咱们后面介绍搜索方法时，会涉及到的)

咱们先看看emptyEnumerator对象是如何实现的

private static Enumeration emptyEnumerator = new EmptyEnumerator();
// 空枚举类                                                                                         
// 当Hashtable的实际大小为0；此时，又要经过Enumeration遍历Hashtable时，返回的是“空枚举类”的对象。   
private static class EmptyEnumerator implements Enumeration<Object> {                               
                                                                                                    
    EmptyEnumerator() {                                                                             
    }                                                                                               
                                                                                                    
    // 空枚举类的hasMoreElements() 始终返回false                                                    
    public boolean hasMoreElements() {                                                              
        return false;                                                                               
    }                                                                                               
                                                                                                    
    // 空枚举类的nextElement() 抛出异常                                                             
    public Object nextElement() {                                                                   
        throw new NoSuchElementException("Hashtable Enumerator");                                   
    }                                                                                               
}

咱们在来看看Enumeration类，Enumerator的做用是提供了“经过elements()遍历Hashtable的接口” 和 “经过entrySet()遍历Hashtable的接口”。由于，它同时实现了 “Enumerator接口”和“Iterator接口”。

 private class Enumerator<T> implements Enumeration<T>, Iterator<T> {
        Entry<?,?>[] table = Hashtable.this.table;
        int index = table.length;
        Entry<?,?> entry;
        Entry<?,?> lastReturned;
        int type;

....
}

三、如下为Hashtable 包含的函数，函数都是同步的，每一个前面都有synchronized,这意味着它是线程安全的。

  public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {
            throw new NullPointerException();
        }

        // Makes sure the key is not already in the hashtable.
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
....
}

由此咱们也能看出：Hashtable的key、value都不能够为null。

看源码：若是value为空抛出异常，若是 key为空 key.hashCode会抛出异常

咱们都知道：Hashtable 的key 和value 都不能为空，HashMap的key 和value 均可觉得空，就是这个缘由。

此外，Hashtable中的映射不是有序的。

四、 Hashmap同样，Hashtable也是一个散列表，它也是经过“拉链法”解决哈希冲突的。

Hashtable的“拉链法”相关内容

Hashtable数据存储数组，是由一个Entry数组组成的，而 Entry 自己是多个key,value的链表，其中链表中的每一个值都有个next指针，指向本链表的下一个元素。

private transient Entry[] table;

Hashtable中的key-value都是存储在table数组中的。以下所示，数据节点Entry的数据结构

private static class Entry<K,V> implements Map.Entry<K,V> {   
  // 哈希值                                                                                       
     int hash;                                                                                       
     K key;                                                                                          
     V value;                                                                                        
     // 指向的下一个Entry，即链表的下一个节点                                                        
     Entry<K,V> next;                                                                                
                                                                                                     
     // 构造函数                                                                                     
     protected Entry(int hash, K key, V value, Entry<K,V> next) {                                    
         this.hash = hash;                                                                           
         this.key = key;                                                                             
         this.value = value;                                                                         
         this.next = next;                                                                           
     }                                                                                               
                                                                                                     
     protected Object clone() {                                                                      
         return new Entry<K,V>(hash, key, value,                                                     
               (next==null ? null : (Entry<K,V>) next.clone()));                                     
     }                                                                                               
                                                                                                     
     public K getKey() {                                                                             
         return key;                                                                                 
     }                                                                                               
                                                                                                     
     public V getValue() {                                                                           
         return value;                                                                               
     }                                                                                               
                                                                                                     
     // 设置value。若value是null，则抛出异常。                                                       
     public V setValue(V value) {                                                                    
         if (value == null)                                                                          
             throw new NullPointerException();                                                       
                                                                                                     
         V oldValue = this.value;                                                                    
         this.value = value;                                                                         
         return oldValue;                                                                            
     }                                                                                               
                                                                                                     
     // 覆盖equals()方法，判断两个Entry是否相等。                                                    
     // 若两个Entry的key和value都相等，则认为它们相等。                                              
     public boolean equals(Object o) {                                                               
         if (!(o instanceof Map.Entry))                                                              
             return false;                                                                           
         Map.Entry e = (Map.Entry)o;                                                                 
                                                                                                     
         return (key==null ? e.getKey()==null : key.equals(e.getKey())) &&                           
            (value==null ? e.getValue()==null : value.equals(e.getValue()));                         
     }                                                                                               
                                                                                                     
     public int hashCode() {                                                                         
         return hash ^ (value==null ? 0 : value.hashCode());                                         
     }                                                                                               
                                                                                                     
     public String toString() {                                                                      
         return key.toString()+"="+value.toString();                                                 
     }                                                                                               
 }

从中，咱们能够看出 Entry 实际上就是一个单向链表。这也是为何咱们说Hashtable是经过拉链法解决哈希冲突的。

Entry 实现了Map.Entry 接口，即实现getKey(), getValue(), setValue(V value), equals(Object o), hashCode()这些函数。这些都是基本的读取/修改key、value值的函数。

拿put()方法举例： put() 的做用是对外提供接口，让Hashtable对象能够经过put()将“key-value”添加到Hashtable中。

流程大致是先判断 hash值，而后判断equals值

PUT流程图：

若是对hashcode和equals 方法的区别不了解能够参考：Java == ,equals 和 hashcode 的区别和联系(阿里面试)

put 方法的整个流程为：

判断 value 是否为空，为空则抛出异常；
计算 key 的 hash 值，并根据 hash 值得到 key 在 table 数组中的位置 index，若是 table[index] 元素不为空，则进行迭代，若是遇到相同的 key，则直接替换，并返回旧 value；
不然，咱们能够将其插入到 table[index] 位置。

public synchronized V put(K key, V value) {   
 // Hashtable中不能插入value为null的元素！！！                                                                                             
    if (value == null) { throw new NullPointerException(); } // 若“Hashtable中已存在键为key的键值对”， // 则用“新的value”替换“旧的value” Entry tab[] = table; int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { V old = e.value; e.value = value; return old; } } // 若“Hashtable中不存在键为key的键值对”， // (01) 将“修改统计数”+1 modCount++; // (02) 若“Hashtable实际容量” > “阈值”(阈值=总的容量 * 加载因子) // 则调整Hashtable的大小 if (count >= threshold) { // Rehash the table if the threshold is exceeded  rehash(); tab = table; index = (hash & 0x7FFFFFFF) % tab.length; } // (03) 将“Hashtable中index”位置的Entry(链表)保存到e中 Entry<K,V> e = tab[index]; // (04) 建立“新的Entry节点”，并将“新的Entry”插入“Hashtable的index位置”，并设置e为“新的Entry”的下一个元素(即“新Entry”为链表表头)。 tab[index] = new Entry<K,V>(hash, key, value, e); // (05) 将“Hashtable的实际容量”+1 count++; return null; }

经过一个实际的例子来演示一下这个过程：

假设咱们如今Hashtable的容量为5，已经存在了(5,5)，(13,13)，(16,16)，(17,17)，(21,21)这 5 个键值对，目前他们在Hashtable中的位置以下：

如今，咱们插入一个新的键值对，put(16,22)，假设key=16的索引为1.但如今索引1的位置有两个Entry了，因此程序会对链表进行迭代。迭代的过程当中，发现其中有一个Entry的key和咱们要插入的键值对的key相同，因此如今会作的工做就是将newValue=22替换oldValue=16，而后返回oldValue=16.

而后咱们如今再插入一个，put(33,33)，key=33的索引为3，而且在链表中也不存在key=33的Entry，因此将该节点插入链表的第一个位置。

再看一下Get()方法，咱们知道Hashtable的时间复杂度是O(1),但你知道它是如何经过散列码的方式作到O(1)的吗？

Hashtable 直接用hash取了hashtable模，用模作了index,而后定位到bucket桶的数组位置，这个位置上面可能有一个hashcode相同的entry链表；而后对这链表进行遍历，找到key等于指定值的entry，所以时间复杂度为O(1),HashMap,HashTable,HashSet 只要是以Hash为基础的数据结构都是O(1)

参考：HashMap, HashTable，HashSet,TreeMap 的时间复杂度

get() 的做用就是获取key对应的value，没有的话返回null

   public synchronized V get(Object key) {
        Entry<?,?> tab[] = table; int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { return (V)e.value; } } return null; }

相比较于 put 方法，get 方法则简单不少。其过程就是首先经过 hash()方法求得 key 的哈希值，而后根据 hash 值获得 index 索引（上述两步所用的算法与 put 方法都相同）。而后迭代链表，返回匹配的 key 的对应的 value；找不到则返回 null。

五、刚才提到 Hashtable 继承了继承了字典类型：Dictionary类型。而字典类型依赖于： Enumerator

Enumerator实现了方法：Enumeration<T>, Iterator<T>

private class Enumerator<T> implements Enumeration<T>, Iterator<T> {
        Entry<?,?>[] table = Hashtable.this.table;
        int index = table.length;
        Entry<?,?> entry;
        Entry<?,?> lastReturned;
        int type;

        /**
         * Indicates whether this Enumerator is serving as an Iterator
         * or an Enumeration.  (true -> Iterator).
         */
        boolean iterator;

所以：搜索有五种方法进行搜素：

(1) 利用Iterator迭代器,遍历Hashtable的键值对

第一步：根据entrySet()获取Hashtable的“键值对”的Set集合。
第二步：经过Iterator迭代器遍历“第一步”获得的集合。

    Iterator iter=table.entrySet().iterator();
        
        while(iter.hasNext()){
            Entry entry =(Entry) iter.next();
            //获取key
            String key=(String)entry.getKey();
            
            Object value=entry.getValue();
            
            System.out.println("key="+key+"  value="+value);
        }

(2) 经过Iterator遍历Hashtable的键

第一步：根据keySet()获取Hashtable的“键”的Set集合。
第二步：经过Iterator迭代器遍历“第一步”获得的集合。

// 假设table是Hashtable对象
// table中的key是String类型，value是Integer类型
String key = null;
Integer integ = null;
Iterator iter = table.keySet().iterator();
while (iter.hasNext()) {
        // 获取key
    key = (String)iter.next();
        // 根据key，获取value
    integ = (Integer)table.get(key);
}

(3)、经过Iterator遍历Hashtable的值

第一步：根据value()获取Hashtable的“值”的集合。
第二步：经过Iterator迭代器遍历“第一步”获得的集合。

// 假设table是Hashtable对象
// table中的key是String类型，value是Integer类型
Integer value = null;
Collection c = table.values();
Iterator iter= c.iterator();
while (iter.hasNext()) {
    value = (Integer)iter.next();
}

(4)、经过Enumeration遍历Hashtable的键

第一步：根据keys()获取Hashtable的集合。
第二步：经过Enumeration遍历“第一步”获得的集合。

Enumeration enu = table.keys();
while(enu.hasMoreElements()) {
    System.out.println(enu.nextElement());
}

(5)、经过Enumeration遍历Hashtable的值

第一步：根据elements()获取Hashtable的集合。
第二步：经过Enumeration遍历“第一步”获得的集合。

Enumeration enu = table.elements();
while(enu.hasMoreElements()) {
    System.out.println(enu.nextElement());
}

遍历测试程序以下：

import java.util.Collection;
import java.util.Enumeration;
import java.util.Hashtable;
import java.util.Iterator;
import java.util.Map.Entry;

public class hashtabletest {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        
        Hashtable table =new Hashtable();
        
        table.put("张三",20);
        table.put("李四",30);
        table.put("王五", 50);
         
        
//        4.1 遍历Hashtable的键值对
//
//        第一步：根据entrySet()获取Hashtable的“键值对”的Set集合。
//        第二步：经过Iterator迭代器遍历“第一步”获得的集合。
        Iterator iter=table.entrySet().iterator();
        
        while(iter.hasNext()){
            Entry entry =(Entry) iter.next();
            //获取key
            String key=(String)entry.getKey();
            
            Object value=entry.getValue();
            
            System.out.println("key="+key+"  value="+value);
        }
        
//        //4.2 经过Iterator遍历Hashtable的键

//第一步：根据keySet()获取Hashtable的“键”的Set集合。
//第二步：经过Iterator迭代器遍历“第一步”获得的集合。
        
        Iterator itkey=table.keySet().iterator();
        while(itkey.hasNext()){
            
      String key=(String)        itkey.next();
      Object value=table.get(key);
      
      System.out.println("key=="+key+"  value="+value);
        }
        
        
//        4.3 经过Iterator遍历Hashtable的值
//
//        第一步：根据value()获取Hashtable的“值”的集合。
//        第二步：经过Iterator迭代器遍历“第一步”获得的集合。
        
    Collection c=      table.values();
    Iterator itvalue=c.iterator();
    while(itvalue.hasNext()){
        
        Object value =itvalue.next();        
        
        System.out.println(" value="+value);
    }
    
//    4.4 经过Enumeration遍历Hashtable的键
//
//    第一步：根据keys()获取Hashtable的集合。
//    第二步：经过Enumeration遍历“第一步”获得的集合。
    
    Enumeration enu=table.keys();
    while(enu.hasMoreElements()){
        
        System.out.println("elements="+enu.nextElement());
    }
    
//    4.5 经过Enumeration遍历Hashtable的值
//    第一步：根据elements()获取Hashtable的集合。
//    第二步：经过Enumeration遍历“第一步”获得的集合。
    
    Enumeration entry=table.elements();
    while(entry.hasMoreElements()){
        
        System.out.println(" element111s ="+entry.nextElement());
    }
        
        

    }

}

结果为：

key=王五  value=50
key=张三  value=20
key=李四  value=30
key==王五  value=50
key==张三  value=20
key==李四  value=30
 value=50
 value=20
 value=30
elements=王五
elements=张三
elements=李四
 element111s =50
 element111s =20
 element111s =30

六、其余的函数

(1) contains() 和 containsValue()

contains() 和 containsValue() 的做用都是判断Hashtable是否包含“值(value)”

public boolean containsValue(Object value) {
    return contains(value);
  }

remove() remove() 的做用就是删除Hashtable中键为key的元素

Hashtable实现的Cloneable接口 Hashtable实现了Cloneable接口，即实现了clone()方法。

clone()方法的做用很简单，就是克隆一个Hashtable对象并返回。

Hashtable实现的Serializable接口,分别实现了串行读取、写入功能。

串行写入函数就是将Hashtable的“总的容量，实际容量，全部的Entry”都写入到输出流中
串行读取函数：根据写入方式读出将Hashtable的“总的容量，实际容量，全部的Entry”依次读出

参考：深刻Java集合学习系列：Hashtable的实现原理
参考：HashTable的实现原理分析