Java 基础(二)集合源码解析 Iterator

首先,在探索集合以前,咱们先来思考一个问题,集合是什么?java

针对一个特定的问题,若是事先不知道须要多少个对象,或者它们的持续时间有多长,那么也不知道如何保存那些对象。既然如此,怎样才能知道那些对象要求多说空间呢?事先上根本没法提早知道,除非进入运行期。
在面向对象的设计中,大多数问题的解决办法彷佛都有些轻率——只是简单地建立另外一种类型的对象。用于解决特定问题的新型对象容纳了指向其余对象的引用。固然,也能够用数组来作一样的事情,那是大多数语言都具备的一种功能。 但不能只看到这一点。这种新对象一般叫做“集合”(亦叫做一个“容器”)。在 须要的时候,集合会自动扩充本身,以便适应咱们在其中置入的任何东西。因此 咱们事先没必要知道要在一个集合里容下多少东西。只需建立一个集合,之后的工做让它本身负责好了。
设计模式

上文摘抄自《Thinking in Java》,集合解决的问题是,在编译期间不知道要多少个对象,可是数组必须在申明的时候明确指明数组长度,若是食用数组,申请太多的空间就会形成资源浪费,若是申请太少空间,就不够用。因此引出了一个概念叫“容器”,来解决这个问题,这个容器就是咱们今天要研究的对象--“集合”。数组

咱们先来看一下类关系图~bash

Java 提供的集合都在 Java.utils 包下,集合主要分两类,Collection 和 Map。咱们用到的各类类型的集合,都是实现自这两个接口。集合的实现类有不少,开发过程当中,咱们须要根据不一样的需求,选择合适的集合设计,以便高效率的解决咱们的实际问题。至于什么场景用哪种类型的容器,使用这种容器能带来哪些好处,这就是咱们要研究的核心点,也是咱们用好 Java 集合的精髓。数据结构

磨刀不误砍柴工,咱们在探索集合的架构设计以前,咱们先来研究一下Iterator。架构

Iterator

Iterator :[计]迭代器,迭代程序ui

迭代器,这里用到的就是设计模式中的迭代器模式。this

迭代器模式
定义:提供一种方法访问一个容器对象中各个元素,而又不暴露该对象的内部细节。spa

这里咱们的重点不是迭代器模式,对“迭代器模式”感兴趣的童鞋能够自行去了解一波。线程

先来看看接口 Iterator 的设计。

public interface Iterator<E> {
    boolean hasNext();

    E next();

    default void remove() {
        throw new UnsupportedOperationException("remove");
    }

    default void forEachRemaining(Consumer<? super E> var1) {
        Objects.requireNonNull(var1);

        while(this.hasNext()) {
            var1.accept(this.next());
        }
    }
}复制代码

一共四个方法,其中hasNext()和 next()方法是迭代必须方法。remove()和forEachRemaining()方法有默认实现,小伙伴不要纠结接口怎么会有默认实现方法,这是 Java 8 的新特性。

  • hasNext():是否有下一个元素
  • next():获取下一个元素
  • remove():删除当前元素,非必须的方法,有须要可重写实现。
  • forEachRemaining():给剩下来全部元素作了一个自定义的相同操做。非必须的方法,有须要可重写实现。

#fail-fast 与 ConcurrentModificationException

fail-fast:是java集合(Collection)中的一种错误机制。当多个线程对同一个集合的内容进行操做时,就可能会产生fail-fast事件。
ConcurrentModificationException:出现 fail-fast 问题的时候就会抛出这个异常。

可能问题描述得有点抽象,我举个例子:假设有个 ArrayList 集合A,A里面包含10个元素,分别是0~9。假设线程a在获取第5个元素的过程当中,线程b操做A删除了第一个元素。那么问题来了,此时a线程是获取的到结果是5,可是个人本意应该是取到结果4,此时程序发生了错误,所以产生 fail-fast 问题,遂抛出异常。

###解决方案

  1. 在遍历过程当中全部涉及到改变modCount值得地方所有加上synchronized。
  2. 用 CopyOnWriteArrayList,ConcurrentHashMap 替换 ArrayList, HashMap,它们的功能和名字同样,在写入时会建立一个 copy,而后在这个 copy 版本上进行修改操做,这样就不会影响原来的迭代。不过坏处就是浪费内存。

Iterator 实现迭代功能

Iterator 的实现类通常之内部类的形式写在集合类里面。功能的实现是根据各类集合实现的特定实现,好比说 ArrayList 和 LinkedArrayList 的数据结构不同,因此 Iterator 实现也不同。

这里以 ArrayList 的 Iterator 举例子讲一下 Iterator 的代码实现。
在看源码以前,咱们先来回顾一下 Iterator 的使用。

不使用 Iterator 遍历集合是这样的:
for(int i=0; i<list.size();i++){  
        // ... 
    } 
//使用 Iterator 遍历集合是这样的:

Iterator iterator = list.iterator();
while (iterator.hasNext()){
    Object obj = iterator.next()
}复制代码

通常状况,若是只是遍历获取集合的全部元素,我选择使用第一种方式,由于用 iterator 感受好麻烦的样子。可是确定不少童鞋都犯过一个这样的错误,咱们在 for 循环里面对集合进行了remove操做,可是最后的结果和咱们指望的不同,这时候老手告诉你,集合不能这样操做,若是你要remove,请用 iterator操做,那样不会出问题,因而,咱们默默的记下了这个结论。稍后,咱们会在Iterator 的源码里面找到缘由。

private class Itr implements Iterator<E> {
        int cursor;//当前角标位置
        int lastRet;//用来标记当前须要删除的元素角标
        int expectedModCount;//ArrayList元素个数

    private Itr() {
        this.lastRet = -1;//角标默认指向-1
        this.expectedModCount = ArrayList.this.modCount;
    }

    public E next() {
        this.checkForComodification();//检查 fail-fast
        int var1 = this.cursor;
        if(var1 >= ArrayList.this.size) {
            throw new NoSuchElementException();//角标越界
        } else {
            Object[] var2 = ArrayList.this.elementData;//ArrayList的底层实现实际上就是一个数组
            if(var1 >= var2.length) {//double check
                throw new ConcurrentModificationException();
            } else {
                this.cursor = var1 + 1;
                return var2[this.lastRet = var1];
            }
        }
    }

    public boolean hasNext() {
        //检查是否大于数组长度
        return this.cursor != ArrayList.this.size;
    }

    public void remove() {
        if(this.lastRet < 0) {
            throw new IllegalStateException();
        } else {
            this.checkForComodification();
            try {
                ArrayList.this.remove(this.lastRet);//调用ArrayList的remove
                this.cursor = this.lastRet;//cursor
                this.lastRet = -1;//避免同时调用两次remove
                this.expectedModCount = ArrayList.this.modCount;//更新数组长度
            } catch (IndexOutOfBoundsException var2) {
                throw new ConcurrentModificationException();
            }
        }
    }
}复制代码

注视我都写在代码里面了,其实ArrayList.Iterator 就是一个对数组的遍历,较之直接 for()循环ArrayList,优势是作了 fail-fast 检查,而且增长了在遍历过程当中删除的功能。

再来详细讲一下for()循环里面不能用list.remove(i)的缘由。由于在 for(int i=0; i<list.size();i++) 语句中,假设 list 有4个元素,假若是在 i = 0 的时候调用了list.remove(i),此时就出现了取值错位而且漏值的状况。可是在Iterator 里面,咱们能够看到有一行这样的代码 this.cursor = this.lastRet 改变了当前数组的角标。

这里分享一个使用for循环而后再在循环里面删除值而且不会出错的办法

for (int i = list.size()-1; i >=0; i--) {
    String s = list.get(i);
    if (s.equals("remove")) {
        list.remove(i);
    }
}复制代码

好了,很简单的逻辑,Iterator 就分享到这里吧,不一样的集合里面的 Iterator 的实现方式不同,可是逻辑都是同样的,因此就再也不赘述了。

古耐~

相关文章
相关标签/搜索