首先,在探索集合以前,咱们先来思考一个问题,集合是什么?java
针对一个特定的问题,若是事先不知道须要多少个对象,或者它们的持续时间有多长,那么也不知道如何保存那些对象。既然如此,怎样才能知道那些对象要求多说空间呢?事先上根本没法提早知道,除非进入运行期。
在面向对象的设计中,大多数问题的解决办法彷佛都有些轻率——只是简单地建立另外一种类型的对象。用于解决特定问题的新型对象容纳了指向其余对象的引用。固然,也能够用数组来作一样的事情,那是大多数语言都具备的一种功能。 但不能只看到这一点。这种新对象一般叫做“集合”(亦叫做一个“容器”)。在 须要的时候,集合会自动扩充本身,以便适应咱们在其中置入的任何东西。因此 咱们事先没必要知道要在一个集合里容下多少东西。只需建立一个集合,之后的工做让它本身负责好了。设计模式
上文摘抄自《Thinking in Java》,集合解决的问题是,在编译期间不知道要多少个对象,可是数组必须在申明的时候明确指明数组长度,若是食用数组,申请太多的空间就会形成资源浪费,若是申请太少空间,就不够用。因此引出了一个概念叫“容器”,来解决这个问题,这个容器就是咱们今天要研究的对象--“集合”。数组
咱们先来看一下类关系图~bash
Java 提供的集合都在 Java.utils 包下,集合主要分两类,Collection 和 Map。咱们用到的各类类型的集合,都是实现自这两个接口。集合的实现类有不少,开发过程当中,咱们须要根据不一样的需求,选择合适的集合设计,以便高效率的解决咱们的实际问题。至于什么场景用哪种类型的容器,使用这种容器能带来哪些好处,这就是咱们要研究的核心点,也是咱们用好 Java 集合的精髓。数据结构
磨刀不误砍柴工,咱们在探索集合的架构设计以前,咱们先来研究一下Iterator。架构
Iterator :[计]迭代器,迭代程序ui
迭代器,这里用到的就是设计模式中的迭代器模式。this
迭代器模式
定义:提供一种方法访问一个容器对象中各个元素,而又不暴露该对象的内部细节。spa
这里咱们的重点不是迭代器模式,对“迭代器模式”感兴趣的童鞋能够自行去了解一波。线程
先来看看接口 Iterator 的设计。
public interface Iterator<E> {
boolean hasNext();
E next();
default void remove() {
throw new UnsupportedOperationException("remove");
}
default void forEachRemaining(Consumer<? super E> var1) {
Objects.requireNonNull(var1);
while(this.hasNext()) {
var1.accept(this.next());
}
}
}复制代码
一共四个方法,其中hasNext()和 next()方法是迭代必须方法。remove()和forEachRemaining()方法有默认实现,小伙伴不要纠结接口怎么会有默认实现方法,这是 Java 8 的新特性。
#fail-fast 与 ConcurrentModificationException
fail-fast:是java集合(Collection)中的一种错误机制。当多个线程对同一个集合的内容进行操做时,就可能会产生fail-fast事件。
ConcurrentModificationException:出现 fail-fast 问题的时候就会抛出这个异常。
可能问题描述得有点抽象,我举个例子:假设有个 ArrayList 集合A,A里面包含10个元素,分别是0~9。假设线程a在获取第5个元素的过程当中,线程b操做A删除了第一个元素。那么问题来了,此时a线程是获取的到结果是5,可是个人本意应该是取到结果4,此时程序发生了错误,所以产生 fail-fast 问题,遂抛出异常。
###解决方案
Iterator 的实现类通常之内部类的形式写在集合类里面。功能的实现是根据各类集合实现的特定实现,好比说 ArrayList 和 LinkedArrayList 的数据结构不同,因此 Iterator 实现也不同。
这里以 ArrayList 的 Iterator 举例子讲一下 Iterator 的代码实现。
在看源码以前,咱们先来回顾一下 Iterator 的使用。
不使用 Iterator 遍历集合是这样的:
for(int i=0; i<list.size();i++){
// ...
}
//使用 Iterator 遍历集合是这样的:
Iterator iterator = list.iterator();
while (iterator.hasNext()){
Object obj = iterator.next()
}复制代码
通常状况,若是只是遍历获取集合的全部元素,我选择使用第一种方式,由于用 iterator 感受好麻烦的样子。可是确定不少童鞋都犯过一个这样的错误,咱们在 for 循环里面对集合进行了remove操做,可是最后的结果和咱们指望的不同,这时候老手告诉你,集合不能这样操做,若是你要remove,请用 iterator操做,那样不会出问题,因而,咱们默默的记下了这个结论。稍后,咱们会在Iterator 的源码里面找到缘由。
private class Itr implements Iterator<E> {
int cursor;//当前角标位置
int lastRet;//用来标记当前须要删除的元素角标
int expectedModCount;//ArrayList元素个数
private Itr() {
this.lastRet = -1;//角标默认指向-1
this.expectedModCount = ArrayList.this.modCount;
}
public E next() {
this.checkForComodification();//检查 fail-fast
int var1 = this.cursor;
if(var1 >= ArrayList.this.size) {
throw new NoSuchElementException();//角标越界
} else {
Object[] var2 = ArrayList.this.elementData;//ArrayList的底层实现实际上就是一个数组
if(var1 >= var2.length) {//double check
throw new ConcurrentModificationException();
} else {
this.cursor = var1 + 1;
return var2[this.lastRet = var1];
}
}
}
public boolean hasNext() {
//检查是否大于数组长度
return this.cursor != ArrayList.this.size;
}
public void remove() {
if(this.lastRet < 0) {
throw new IllegalStateException();
} else {
this.checkForComodification();
try {
ArrayList.this.remove(this.lastRet);//调用ArrayList的remove
this.cursor = this.lastRet;//cursor
this.lastRet = -1;//避免同时调用两次remove
this.expectedModCount = ArrayList.this.modCount;//更新数组长度
} catch (IndexOutOfBoundsException var2) {
throw new ConcurrentModificationException();
}
}
}
}复制代码
注视我都写在代码里面了,其实ArrayList.Iterator 就是一个对数组的遍历,较之直接 for()循环ArrayList,优势是作了 fail-fast 检查,而且增长了在遍历过程当中删除的功能。
再来详细讲一下for()循环里面不能用list.remove(i)的缘由。由于在 for(int i=0; i<list.size();i++) 语句中,假设 list 有4个元素,假若是在 i = 0 的时候调用了list.remove(i),此时就出现了取值错位而且漏值的状况。可是在Iterator 里面,咱们能够看到有一行这样的代码 this.cursor = this.lastRet 改变了当前数组的角标。
这里分享一个使用for循环而后再在循环里面删除值而且不会出错的办法
for (int i = list.size()-1; i >=0; i--) {
String s = list.get(i);
if (s.equals("remove")) {
list.remove(i);
}
}复制代码
好了,很简单的逻辑,Iterator 就分享到这里吧,不一样的集合里面的 Iterator 的实现方式不同,可是逻辑都是同样的,因此就再也不赘述了。
古耐~