Android中须要了解的数据结构（二）

时间 2019-12-05

原文原文链接

前言

前面了解完List接口的相关实现类 Android中须要了解的数据结构（一）java

Map接口

Map与List、Set接口不一样，它是由一系列键值对组成的集合，提供了key到Value的映射。在Map中它保证了key与value之间的一一对应关系。也就是说一个key对应一个value，因此它不能存在相同的key值，固然value值能够相同。
实现map的集合有：HashMap、HashTable、TreeMap、WeakHashMap。bootstrap

HashMap

public class HashMap<K,V> extends AbstractMap<K,V>
        implements Map<K,V>, Cloneable, Serializable {}
    
复制代码

HashMap继承了Map，实现了map的全部方法。key和value容许使用所有的元素，包括null，注意遍历hashMap是随机的，若是你想定义遍历顺序，请使用LinkedHashMap。
在Java言中，最基本的结构就是两种，一个是数组，另一个是模拟指针（引用），全部的数据结构均可以用这两个基本结构来构造的，HashMap也不例外。HashMap其实是一个“链表散列”的数据结构，即数组和链表的结合体。数组

Java8 对HashMap 底层作了优化本文以Java8为例安全

/**
    * An empty table instance to share when the table is not inflated.
    * Orcle的JDK中名字叫Node<K,V>
    */
    static final HashMapEntry<?,?>[] EMPTY_TABLE = {};

    /**
    The table, resized as necessary. Length MUST Always be a power of two.
    Orcle的JDK中名字叫Node<K,V>
    */
    transient HashMapEntry<K,V>[] table = (HashMapEntry<K,V>[]) EMPTY_TABLE;


    //Orcle的JDK
    /**
       * The table, initialized on first use, and resized as
       * necessary. When allocated, length is always a power of two.
       * (We also tolerate length zero in some operations to allow
       * bootstrapping mechanics that are currently not needed.)
       */
      transient Node<K,V>[] table;
    
      /**
       * Holds cached entrySet(). Note that AbstractMap fields are used
       * for keySet() and values().
       */
      transient Set<Map.Entry<K,V>> entrySet;
复制代码

数组名叫table，初始化时为空。HashMapEntry/Node是HashMap的静态内部类，数据节点都保存在这里面：bash

static class HashMapEntry<K, V> implements Entry<K, V> {
      final K key;
      V value;
      final int hash;
      HashMapEntry<K, V> next;  
  }

  //java8
  static class Node<K,V> implements Map.Entry<K,V> {
          final int hash;
          final K key;
          V value;
          Node<K,V> next;
  }
复制代码

public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

    /**
     * Returns a power of two size for the given target capacity.
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
}
复制代码

int threshold;// 所能容纳的key-value对极限 
    final float loadFactor;//负载因子 默认0.75
    int modCount;  
    int size;
    /**
     * The table, initialized on first use, and resized as
     * necessary. When allocated, length is always a power of two.
     * (We also tolerate length zero in some operations to allow
     * bootstrapping mechanics that are currently not needed.)
     */
    transient Node<K,V>[] table;
复制代码

HashMap是经过transient Node<K,V>[]table来存储数据，Node就是数组的元素，每一个Node其实就是一个key-value对，它持有一个指向下一个元素的引用，这就构成了链表。数据结构

那么为何要有链表呢？缘由是为了解决 哈希冲突 当咱们新增或者查找一个元素的时候,咱们都会经过将咱们的key的hashcode经过哈希函数映射到数组中的某个位置，经过数组下标一次定位就可完成操做。
若是两个不一样的元素，经过哈希函数得出的实际存储地址相同怎么办？也就是说，当咱们对某个元素进行哈希运算，获得一个存储地址，而后要进行插入的时候，发现已经被其余元素占用了，其实这就是所谓的哈希冲突，也叫哈希碰撞。
哈希冲突的解决方案有多种:开放定址法（发生冲突，继续寻找下一块未被占用的存储地址），再散列函数法，链地址法，而HashMap便是采用了链地址法，也就是数组+链表的方式。多线程

HashMap中的核心put方法：app

public V put(K key, V value) {
        // 对key的hashCode()作hash
        return putVal(hash(key), key, value, false, true);
    }

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //tab为空则建立
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //计算index，并对null作处理 
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            // 节点key存在，直接覆盖value
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //判断该链为红黑树
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            //该链为链表
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                         //链表长度大于8转换为红黑树进行处理
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        //超过最大容量 就扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }
复制代码

HashMap中put元素的时候，先根据key的hashCode从新计算hash值，根据hash值获得这个元素在数组中的位置（即下标）,若是数组该位置上已经存放有其余元素了，则经过key 的 equals 比较返回 true，新添加 Node 的 value 将覆盖集合中原有 Node 的 value，但key不会覆盖。若是这两个 Node 的 key 经过 equals 比较返回 false，新添加的 Node 将与集合中原有 Node 造成链表。函数

因此重写equals方法必需要重写hashcode方法post

HashMap由数组+链表组成的，数组是HashMap的主体，链表则是主要为了解决哈希冲突而存在的，若是定位到的数组位置不含链表,那么对于查找，添加等操做很快，仅需一次寻址便可；若是定位到的数组包含链表，对于添加操做，其时间复杂度为O(n)，首先遍历链表，存在即覆盖，不然新增；对于查找操做来说，仍需遍历链表，而后经过key对象的equals方法逐一比对查找。因此，性能考虑，HashMap中的链表出现越少，性能才会越好。

Hashtable

public class Hashtable<K,V> extends Dictionary<K,V>
    implements Map<K,V>, Cloneable, java.io.Serializable{}
    
    public Hashtable(int initialCapacity) {
        this(initialCapacity, 0.75f);
    }

    /**
     * Constructs a new, empty hashtable with a default initial capacity (11)
     * and load factor (0.75).
     */
    public Hashtable() {
        this(11, 0.75f);
    }
    public Hashtable(Map<? extends K, ? extends V> t) {
        this(Math.max(2*t.size(), 11), 0.75f);
        putAll(t);
    }
复制代码

Hashtable继承Dictionary类，一样是经过key-value键值对保存数据的数据结构。解决冲突时与HashMap也同样也是采用了散列链表的形式，Hashtable和HashMap最大的不一样是Hashtable的方法都是同步的，在多线程中，你能够直接使用Hashtable，而若是要使用HashMap，则必需要本身实现同步来保证线程安全。固然，若是你不须要使用同步的话，HashMap的性能是确定优于Hashtable的。此外，HashMap是接收null键和null值的，而Hashtable不能够。

Hashtable于HashMap的区别

HashMap是继承自AbstractMap类，而HashTable是继承自Dictionary类，不过它们都实现了同时实现了map、Cloneable、Serializable这三个接口。
HashMap支持key或者value为null，而HashTable不支持。
Hashtable默认的初始大小为11，以后每次扩充，容量变为原来的2n+1。HashMap默认的初始化大小为16。以后每次扩充，容量变为原来的2倍。

计算hash值的方法不一样

//Hashtable
     for (int i = oldCapacity ; i-- > 0 ;) {
         for (HashtableEntry<K,V> old = (HashtableEntry<K,V>)oldMap[i] ; old != null ; ){
             HashtableEntry<K,V> e = old;
             old = old.next;

             int index = (e.hash & 0x7FFFFFFF) % newCapacity;
             e.next = (HashtableEntry<K,V>)newMap[index];
             newMap[index] = e;
         }
     
     //HashMap
     static final int hash(Object key) {
         int h;
         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
     }
复制代码

Hashtable在计算元素的位置时须要进行一次除法运算，而除法运算是比较耗时的。

TreeMap

public class TreeMap<K,V> extends AbstractMap<K,V>
        implements NavigableMap<K,V>, Cloneable, java.io.Serializable{}
复制代码

有序散列表，实现SortedMap接口，底层经过红黑树实现。能够根据key的天然顺序进行自动排序，当key是自定义对象时，TreeMap也能够根据自定义的Comparator进行排序。另外，TreeMap和HashMap同样，也是非同步的。