你使用过Java8中的parallelStream？

时间 2020-06-06

标签使用 java8 java parallelstream 栏目 Java 繁體版

原文原文链接

前言

并行编程势不可挡，Java从1.7开始就提供了Fork/Join 支持并行处理。java1.8 进一步增强。html

并行处理就是将任务拆分子任务，分发给多个处理器同时处理，以后合并。java

Stream API

Java 8 引入了许多特性，Stream API是其中重要的一部分。区别 InputStream OutputStream，Stream API 是处理对象流而不是字节流。git

执行原理以下，流分串行和并行两种执行方式github

// 串行执行流
stream().filter(e -> e > 10).count();
// 并行执行流
.parallelStream().filter(e -> e > 10).count()

ParallelStreams执行原理

并行执行时，java将流划分为多个子流，分散在不一样CPU并行处理，而后进行合并。编程

并行必定比串行更快吗？这不必定，取决于两方面条件：网络

处理器核心数量，并行处理核心数越多天然处理效率会更高。
处理的数据量越大，优点越强。这也很好理解，好比十我的干一我的就能完成的活儿会比它本身干更便宜？

ParallelStreams注意事项

使用并行流时，不要使用collectors.groupingBy,collectors.toMap，替代为oracle

collectors.groupingByConcurrent , collectors.toConcurrentMap，或直接使用串行流。学习

缘由，并行流执行时，经过操做Key来合并多个map的操做比较昂贵。详细你们能够查看官网介绍。this

https://docs.oracle.com/javas...

Map<String, List<Person>> byGender = 
  roster
      .stream()
      .collect(Collectors.groupingBy(Person::getGender));

ConcurrentMap<String, List<Person>> byGender =         
  roster
      .parallelStream()
      .collect(Collectors.groupingByConcurrent(Person::getGender));

ParallelStreams 默认使用 ForkJoinPool.commonPool()线程池。spa

注意：默认状况下，你写的 ParallelStreams 都是经过该线程池调度执行，整个应用程序都共享这个线程池。

看一个例子，咱们查询一批新闻数据，能够利用并行化来处理远程新闻下载。

public List<News> queryNews(Stream<String> ids) {
     return ids.parallel()
            .map(this::getNews) // 网络操做，新闻下载
            .collect(toList());
}

由于是网络操做，存在不少不肯定性，假如某个任务运行时间较长，致使线程池资源占据，阻塞其它线程，这样就阻止了其余的并行流任务正常进行。

若是解决这个问题的其中一种方式，进行线程池隔离。那么如何自定义并行流的线程池呢？

ForkJoinPool 构造参数咱们默认设置为CPU核心数。

ForkJoinPool customThreadPool = new ForkJoinPool(4);
long actualTotal = customThreadPool
  .submit(() -> roster.parallelStream().reduce(0, Integer::sum)).get();

针对 Stream API 一些局限性，Github上有个开源库作了补充。

https://github.com/pivovarit/...

总结

Java 1.8 提供的Stream API简化了代码，很好用。不过在使用过程当中应该注意以上问题。

欢迎你们留言交流，一块儿学习分享！！！