此次咱们来简单聊聊 Stream#forEach 源码

前言

上回说到了java.util.stream.Stream#forEach的三个问题:java

  • java.util.stream.Stream#forEach 是顺序消费吗?
  • java.util.stream.Stream#forEach 是快速失败吗?
  • java.util.stream.Stream#forEach 以前添加元素会怎么样?

关于这三个问题的答案,能够点击 Stream#foreach方法摸底三问,你都了解吗 编程

Stream#forEach 源码解析

public static void main(String[] args) {
  List<Integer> list = new ArrayList<>(Arrays.asList(1, 2, 3, 4));
  list
    .stream()
    .forEach(System.out::println);
}
复制代码

list.stream();方法是调用的Collection中的 default 方法:java.util.Collection#stream安全

java.util.Collection#stream

能够看到,java.util.Collection#stream方法中,作了两件事情:并发

  1. 调用spliterator()方法,建立Spliterator对象。在ArrayList中,其实是建立了ArrayListSpliterator这个实现类的实例对象。框架

  2. 调用StreamSupport.stream(spliterator(), false);方法。在本示例中,该方法返回了ReferencePipeline.Head这个实现类的实例对象。源码分析

java.util.stream.ReferencePipeline.Head#forEach源码中,首先会判断是否为并行流,若是不是则调用sourceStageSpliterator()方法获取Spliterator对象,而后调用java.util.Spliterator#forEachRemaining方法。性能

Stream#forEach

也就是说,在顺序流中,java.util.stream.Stream#forEach方法其实是委托给了java.util.Spliterator#forEachRemaining方法。spa

Spliterator

什么是Spliterator呢?线程

Spliterator = Splitting(拆分数据源) + Iterator(迭代数据)code

Spliterator中主要有如下几个 API:

  • java.util.Spliterator#trySplit:该方法返回一个新的Spliterator对象,用于在多个线程中分别迭代元素,以实现并行处理。
  • java.util.Spliterator#forEachRemaining:在单个线程中顺序迭代元素。

须要注意的是,Spliterator自己不支持并发编程,它只是提供了一些方法来供开发者使用,要实现并发编程,还须要和 Fork/Join 、线程池之类的框架一块儿使用。

java.util.List#spliterator

Spliterator VS Iterator

Iterator Spliterator
since 1.2 since 1.8
适用于 Collection 适用于 Collection 和 Stream(Map 除外)
不支持并发编程操做 支持并发编程

源码分析

java.util.Spliterator 接口有不少的实现类,本文就以java.util.ArrayList.ArrayListSpliterator为例。

public static void main(String[] args) {
  List<Integer> integers = new ArrayList<>(Arrays.asList(1, 2, 3, 4, 5, 6));
  Spliterator<Integer> spliterator = integers.spliterator();
}
复制代码

当调用java.util.ArrayList#spliterator方法时,实际上是建立了ArrayListSpliterator对象。

java.util.ArrayList#spliterator

ArrayListSpliterator

ArrayList中有一个内部类:java.util.ArrayList.ArrayListSpliterator实现了Spliterator接口。

先来看一下相关的 doc 文档:

ArrayListSpliterator

ArrayListSpliterator是一个基于索引的、二分的、懒加载的Spliterator

对于可变的List,主要依靠modCount来检测并发。同时,为了兼顾性能和并发安全性,相较于ArrayList,对modCount的检测是比较保守的。为了实现这个目的,主要作了如下这两件事情:

  1. 延迟初始化fenceexpectedModCount
  2. 对性能最敏感的forEach操做,只在方法结束时执行ConcurrentModificationException检查。

构造器和成员变量

Spliterator构造器

ArrayListSpliterator 中有三个成员变量:

  • ArrayList<E> list;:存放 ArrayList 对象
  • int index:保存当前索引位置
  • int fence: 懒加载,直到执行迭代时才会修改,用来记录传入 list 的 size
  • int expectedModCount:懒加载,用来记录 list 的 modCount

ArrayListSpliterator#forEachRemaining

forEachRemaining

Spliterator#forEachRemaining方法中,将list引用传给了临时变量list,同时更新modCount的值,因此在执行Spliterator#forEachRemaining方法前,往List中添加新元素也是能够的。

而对modCount值的检查正如 doc 中描述的那样,在调用最频繁的forEachRemaining方法中,为了兼顾性能和并发安全,只会在方法结束时执行ConcurrentModificationException检查。

ArrayListSpliterator#trySplit

ArrayListSpliterator#trySplit方法的源码也很是简单:

ArrayListSpliterator#trySplit

总结

在顺序流中,java.util.stream.Stream#forEach方法其实是委托给了java.util.Spliterator#forEachRemaining方法来实现的。

java.util.Spliterator是JDK8新增的一个接口,相比于java.util.Iterator接口,该接口不只能够实现顺序迭代集合元素,还能够支持并发编程。


欢迎关注我的公众号:

Coder小黑
相关文章
相关标签/搜索