前面了解完List接口的相关实现类 Android中须要了解的数据结构(一)java
Map与List、Set接口不一样,它是由一系列键值对组成的集合,提供了key到Value的映射。在Map中它保证了key与value之间的一一对应关系。也就是说一个key对应一个value,因此它不能存在相同的key值,固然value值能够相同。
实现map的集合有:HashMap、HashTable、TreeMap、WeakHashMap。bootstrap
public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable {}
复制代码
HashMap继承了Map,实现了map的全部方法。key和value容许使用所有的元素,包括null, 注意遍历hashMap是随机的,若是你想定义遍历顺序,请使用LinkedHashMap。
在Java言中,最基本的结构就是两种,一个是数组,另一个是模拟指针(引用),全部的数据结构均可以用这两个基本结构来构造的,HashMap也不例外。HashMap其实是一个“链表散列”的数据结构,即数组和链表的结合体。数组
Java8 对HashMap 底层作了优化 本文以Java8为例安全
/**
* An empty table instance to share when the table is not inflated.
* Orcle的JDK中名字叫Node<K,V>
*/
static final HashMapEntry<?,?>[] EMPTY_TABLE = {};
/**
The table, resized as necessary. Length MUST Always be a power of two.
Orcle的JDK中名字叫Node<K,V>
*/
transient HashMapEntry<K,V>[] table = (HashMapEntry<K,V>[]) EMPTY_TABLE;
//Orcle的JDK
/**
* The table, initialized on first use, and resized as
* necessary. When allocated, length is always a power of two.
* (We also tolerate length zero in some operations to allow
* bootstrapping mechanics that are currently not needed.)
*/
transient Node<K,V>[] table;
/**
* Holds cached entrySet(). Note that AbstractMap fields are used
* for keySet() and values().
*/
transient Set<Map.Entry<K,V>> entrySet;
复制代码
数组名叫table,初始化时为空。HashMapEntry/Node是HashMap的静态内部类,数据节点都保存在这里面:bash
static class HashMapEntry<K, V> implements Entry<K, V> {
final K key;
V value;
final int hash;
HashMapEntry<K, V> next;
}
//java8
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
}
复制代码
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
/**
* Returns a power of two size for the given target capacity.
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
}
复制代码
int threshold;// 所能容纳的key-value对极限
final float loadFactor;//负载因子 默认0.75
int modCount;
int size;
/**
* The table, initialized on first use, and resized as
* necessary. When allocated, length is always a power of two.
* (We also tolerate length zero in some operations to allow
* bootstrapping mechanics that are currently not needed.)
*/
transient Node<K,V>[] table;
复制代码
HashMap是经过transient Node<K,V>[]table
来存储数据,Node就是数组的元素,每一个Node其实就是一个key-value对,它持有一个指向下一个元素的引用,这就构成了链表。 数据结构
那么为何要有链表呢?缘由是为了解决 哈希冲突 当咱们新增或者查找一个元素的时候,咱们都会经过将咱们的key的hashcode经过哈希函数映射到数组中的某个位置,经过数组下标一次定位就可完成操做。
若是两个不一样的元素,经过哈希函数得出的实际存储地址相同怎么办?也就是说,当咱们对某个元素进行哈希运算,获得一个存储地址,而后要进行插入的时候,发现已经被其余元素占用了,其实这就是所谓的哈希冲突,也叫哈希碰撞。
哈希冲突的解决方案有多种:开放定址法(发生冲突,继续寻找下一块未被占用的存储地址),再散列函数法,链地址法,而HashMap便是采用了链地址法,也就是数组+链表的方式。多线程
HashMap中的核心put方法:app
public V put(K key, V value) {
// 对key的hashCode()作hash
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//tab为空则建立
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//计算index,并对null作处理
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
// 节点key存在,直接覆盖value
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//判断该链为红黑树
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//该链为链表
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//链表长度大于8转换为红黑树进行处理
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//超过最大容量 就扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
复制代码
HashMap中put元素的时候,先根据key的hashCode从新计算hash值,根据hash值获得这个元素在数组中的位置(即下标),若是数组该位置上已经存放有其余元素了,则经过key 的 equals 比较返回 true,新添加 Node 的 value 将覆盖集合中原有 Node 的 value,但key不会覆盖。若是这两个 Node 的 key 经过 equals 比较返回 false,新添加的 Node 将与集合中原有 Node 造成 链表。函数
因此重写equals方法必需要重写hashcode方法post
HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,若是定位到的数组位置不含链表,那么对于查找,添加等操做很快,仅需一次寻址便可;若是定位到的数组包含链表,对于添加操做,其时间复杂度为O(n),首先遍历链表,存在即覆盖,不然新增;对于查找操做来说,仍需遍历链表,而后经过key对象的equals方法逐一比对查找。因此,性能考虑,HashMap中的链表出现越少,性能才会越好。
public class Hashtable<K,V> extends Dictionary<K,V>
implements Map<K,V>, Cloneable, java.io.Serializable{}
public Hashtable(int initialCapacity) {
this(initialCapacity, 0.75f);
}
/**
* Constructs a new, empty hashtable with a default initial capacity (11)
* and load factor (0.75).
*/
public Hashtable() {
this(11, 0.75f);
}
public Hashtable(Map<? extends K, ? extends V> t) {
this(Math.max(2*t.size(), 11), 0.75f);
putAll(t);
}
复制代码
Hashtable继承Dictionary类,一样是经过key-value键值对保存数据的数据结构。 解决冲突时与HashMap也同样也是采用了散列链表的形式,Hashtable和HashMap最大的不一样是Hashtable的方法都是同步的,在多线程中,你能够直接使用Hashtable,而若是要使用HashMap,则必需要本身实现同步来保证线程安全。固然,若是你不须要使用同步的话,HashMap的性能是确定优于Hashtable的。此外,HashMap是接收null键和null值的,而Hashtable不能够。
Hashtable于HashMap的区别
//Hashtable
for (int i = oldCapacity ; i-- > 0 ;) {
for (HashtableEntry<K,V> old = (HashtableEntry<K,V>)oldMap[i] ; old != null ; ){
HashtableEntry<K,V> e = old;
old = old.next;
int index = (e.hash & 0x7FFFFFFF) % newCapacity;
e.next = (HashtableEntry<K,V>)newMap[index];
newMap[index] = e;
}
//HashMap
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
复制代码
Hashtable在计算元素的位置时须要进行一次除法运算,而除法运算是比较耗时的。public class TreeMap<K,V> extends AbstractMap<K,V>
implements NavigableMap<K,V>, Cloneable, java.io.Serializable{}
复制代码
有序散列表,实现SortedMap接口,底层经过红黑树实现。能够根据key的天然顺序进行自动排序,当key是自定义对象时,TreeMap也能够根据自定义的Comparator进行排序。另外,TreeMap和HashMap同样,也是非同步的。