本文快速回顾了Java中容器的知识点,用做面试复习,事半功倍。html
上篇:主要为容器概览,容器中用到的设计模式,List源码java
中篇:Map源码git
下篇:Set源码,容器总结github
Java基础知识点面试手册(上)面试
容器主要包括 Collection 和 Map 两种,Collection 又包含了 List、Set 以及 Queue。算法
数组和集合的区别:编程
TreeSet:基于红黑树实现,支持有序性操做,可是查找效率不如 HashSet,HashSet 查找时间复杂度为 O(1),TreeSet 则为 O(logN);设计模式
LinkedHashSet:具备 HashSet 的查找效率,且内部使用链表维护元素的插入顺序。数组
ArrayList:基于动态数组实现,支持随机访问;安全
Vector:和 ArrayList 相似,但它是线程安全的;
LinkedList:能够用它来支持双向队列;
HashMap:基于哈希实现;
HashTable:和 HashMap 相似,但它是线程安全的,这意味着同一时刻多个线程能够同时写入 HashTable 而且不会致使数据不一致。它是遗留类,不该该去使用它。
ConcurrentHashMap:支持线程安全,而且 ConcurrentHashMap 的效率会更高,由于 ConcurrentHashMap 引入了分段锁。
LinkedHashMap:使用链表来维护元素的顺序,顺序为插入顺序或者最近最少使用(LRU)顺序。
https://blog.csdn.net/Kato_op/article/details/80356618
Fail-fast 机制是 java 集合(Collection)中的一种错误机制。 当多个线程对同一个集合的内容进行操做时,就可能会产生 fail-fast 事件。
迭代器在遍历时直接访问集合中的内容,而且在遍历过程当中使用一个modCount变量,
集合中在被遍历期间若是内容发生变化(增删改),就会改变modCount的值,
每当迭代器使用 hashNext()/next()遍历下一个元素以前,都会执行checkForComodification()方法检测,modCount变量和expectedmodCount值是否相等,
注意,若是集合发生变化时修改modCount值, 恰好有设置为了expectedmodCount值, 则异常不会抛出.(好比删除了数据,再添加一条数据)
因此,通常来讲,存在非同步的并发修改时,不可能做出任何坚定的保证。
迭代器的快速失败行为应该仅用于检测程序错误, 而不是用他来同步。
java.util包下的集合类都是Fail-Fast机制的,不能在多线程下发生并发修改(迭代过程当中被修改).
采用安全失败(Fail-Safe)机制的集合容器,在遍历时不是直接在集合内容上访问的,而是先copy原有集合内容,在拷贝的集合上进行遍历。
原理:
因为迭代时是对原集合的拷贝的值进行遍历,因此在遍历过程当中对原集合所做的修改并不能被迭代器检测到,因此不会出发ConcurrentModificationException
缺点:
迭代器并不能访问到修改后的内容(简单来讲就是, 迭代器遍历的是开始遍历那一刻拿到的集合拷贝,在遍历期间原集合发生的修改迭代器是不知道的)
使用场景:
java.util.concurrent包下的容器都是Fail-Safe的,能够在多线程下并发使用,并发修改
从 JDK 1.5 以后可使用 foreach 方法来遍历实现了 Iterable 接口的聚合对象。
List<String> list =newArrayList<>(); list.add("a"); list.add("b"); for(String item : list){ System.out.println(item); }
适配器模式解释:https://www.jianshu.com/p/93821721bf08
java.util.Arrays#asList() 能够把数组类型转换为 List 类型。
@SafeVarargs public static <T> List<T> asList(T... a)
若是要将数组类型转换为 List 类型,应该注意的是 asList() 的参数为泛型的变长参数,所以不能使用基本类型数组做为参数,只能使用相应的包装类型数组。
Integer[ ] arr = {1, 2, 3}; List list = Arrays.asList(arr);
也可使用如下方式生成 List。
List list = Arrays.asList(1 ,2, 3);
实现了 RandomAccess 接口,所以支持随机访问。这是理所固然的,由于 ArrayList 是基于数组实现的。
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable
若是不够时,须要使用 grow() 方法进行扩容,新容量的大小为 oldCapacity+(oldCapacity>>1),也就是旧容量的 1.5 倍。
扩容操做须要调用 Arrays.copyOf() 把原数组整个复制到新数组中
所以最好在建立 ArrayList 对象时就指定大概的容量大小,减小扩容操做的次数。
public boolean add(E e) { ensureCapacityInternal(size + 1); // Increments modCount!! elementData[size++] = e; return true; } private void ensureCapacityInternal(int minCapacity) { if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); } ensureExplicitCapacity(minCapacity); } private void ensureExplicitCapacity(int minCapacity) { modCount++; // overflow-conscious code if (minCapacity - elementData.length > 0) grow(minCapacity); } private void grow(int minCapacity) { // overflow-conscious code int oldCapacity = elementData.length; int newCapacity = oldCapacity + (oldCapacity >> 1); if (newCapacity - minCapacity < 0) newCapacity = minCapacity; if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); }
add(E e)
首先去检查一下数组的容量是否足够
add(int index, E element)
步骤:
步骤:
public E remove(int index) { rangeCheck(index); modCount++; E oldValue = elementData(index); int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work return oldValue; }
须要调用 System.arraycopy() 将 index+1 后面的元素都复制到 index 位置上,复制的代价很高。
看到arraycopy(),咱们能够发现:该方法是由C/C++来编写的
modCount 用来记录 ArrayList 结构发生变化的次数。结构发生变化是指添加或者删除至少一个元素的全部操做,或者是调整内部数组的大小,仅仅只是设置元素的值不算结构发生变化。
在进行序列化或者迭代等操做时,须要比较操做先后 modCount 是否改变,若是改变了须要抛出 ConcurrentModificationException。
private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException{ // Write out element count, and any hidden stuff int expectedModCount = modCount; s.defaultWriteObject(); // Write out size as capacity for behavioural compatibility with clone() s.writeInt(size); // Write out all elements in the proper order. for (int i=0; i<size; i++) { s.writeObject(elementData[i]); } if (modCount != expectedModCount) { throw new ConcurrentModificationException(); } }
ArrayList 提供了三种方式的构造器:
补充:transient讲解
http://www.importnew.com/21517.html
你只须要实现Serilizable接口,将不须要序列化的属性前添加关键字transient,序列化对象的时候,这个属性就不会序列化到指定的目的地中。
ArrayList 基于数组实现,而且具备动态扩容特性,所以保存元素的数组不必定都会被使用,那么就不必所有进行序列化。
保存元素的数组 elementData 使用 transient 修饰,该关键字声明数组默认不会被序列化。
transient Object[] elementData; // non-private to simplify nested class access
ArrayList 实现了 writeObject() 和 readObject() 来控制只序列化数组中有元素填充那部份内容。
private void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException { elementData = EMPTY_ELEMENTDATA; // Read in size, and any hidden stuff s.defaultReadObject(); // Read in capacity s.readInt(); // ignored if (size > 0) { // be like clone(), allocate array based upon size not capacity ensureCapacityInternal(size); Object[] a = elementData; // Read in all elements in the proper order. for (int i=0; i<size; i++) { a[i] = s.readObject(); } } }
private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException{ // Write out element count, and any hidden stuff int expectedModCount = modCount; s.defaultWriteObject(); // Write out size as capacity for behavioural compatibility with clone() s.writeInt(size); // Write out all elements in the proper order. for (int i=0; i<size; i++) { s.writeObject(elementData[i]); } if (modCount != expectedModCount) { throw new ConcurrentModificationException(); } }
序列化时须要使用 ObjectOutputStream 的 writeObject() 将对象转换为字节流并输出。而 writeObject() 方法在传入的对象存在 writeObject() 的时候会去反射调用该对象的 writeObject() 来实现序列化。反序列化使用的是 ObjectInputStream 的 readObject() 方法,原理相似。
ArrayList list = new ArrayList(); ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream(file)); oos.writeObject(list);
可使用 Collections.synchronizedList(); 获得一个线程安全的 ArrayList。
List<String> list = new ArrayList<>(); List<String> synList = Collections.synchronizedList(list);
也可使用 concurrent 并发包下的 CopyOnWriteArrayList 类。
List<String> list = new CopyOnWriteArrayList<>();
public boolean add(E e) { final ReentrantLock lock = this.lock; lock.lock(); try { Object[] elements = getArray(); int len = elements.length; Object[] newElements = Arrays.copyOf(elements, len + 1); newElements[len] = e; setArray(newElements); return true; } finally { lock.unlock(); } } final void setArray(Object[] a) { array = a; } @SuppressWarnings("unchecked") private E get(Object[] a, int index) { return (E) a[index]; }
CopyOnWriteArrayList 在写操做的同时容许读操做,大大提升了读操做的性能,所以很适合读多写少的应用场景。
基于双向链表实现,内部使用 Node 来存储链表节点信息。
private static class Node<E> { E item; Node<E> next; Node<E> prev; }
每一个链表存储了 Head 和 Tail 指针:
transient Node<E> first; transient Node<E> last;
set方法和get方法其实差很少,根据下标来判断是从头遍历仍是从尾遍历
LinkedList实现了Deque接口,所以,咱们能够操做LinkedList像操做队列和栈同样
LinkedList的方法比ArrayList的方法多太多了,这里我就不一一说明了。具体可参考:
本人目前为后台开发工程师,主要关注Python爬虫,后台开发等相关技术。
拥有专栏:Leetcode题解(Java/Python)、Python爬虫开发
https://www.zhihu.com/people/yang-zhen-dong-1/
拥有专栏:码农面试助攻手册
https://juejin.im/user/5b48015ce51d45191462ba55
https://www.jianshu.com/u/b5f225ca2376