并行编程势不可挡,Java从1.7开始就提供了Fork/Join 支持并行处理。java1.8 进一步增强。html
并行处理就是将任务拆分子任务,分发给多个处理器同时处理,以后合并。java
Java 8 引入了许多特性,Stream API是其中重要的一部分。区别 InputStream OutputStream,Stream API 是处理对象流而不是字节流。git
执行原理以下,流分串行和并行两种执行方式github
// 串行执行流 stream().filter(e -> e > 10).count(); // 并行执行流 .parallelStream().filter(e -> e > 10).count()
并行执行时,java将流划分为多个子流,分散在不一样CPU并行处理,而后进行合并。编程
并行必定比串行更快吗?这不必定,取决于两方面条件:网络
使用并行流时,不要使用collectors.groupingBy,collectors.toMap,替代为oracle
collectors.groupingByConcurrent , collectors.toConcurrentMap,或直接使用串行流。学习
缘由,并行流执行时,经过操做Key来合并多个map的操做比较昂贵。详细你们能够查看官网介绍。this
https://docs.oracle.com/javas...
Map<String, List<Person>> byGender = roster .stream() .collect(Collectors.groupingBy(Person::getGender)); ConcurrentMap<String, List<Person>> byGender = roster .parallelStream() .collect(Collectors.groupingByConcurrent(Person::getGender));
ParallelStreams 默认使用 ForkJoinPool.commonPool()线程池。spa
注意:默认状况下,你写的 ParallelStreams 都是经过该线程池调度执行,整个应用程序都共享这个线程池。
看一个例子,咱们查询一批新闻数据,能够利用并行化来处理远程新闻下载。
public List<News> queryNews(Stream<String> ids) { return ids.parallel() .map(this::getNews) // 网络操做,新闻下载 .collect(toList()); }
由于是网络操做,存在不少不肯定性,假如某个任务运行时间较长,致使线程池资源占据,阻塞其它线程,这样就阻止了其余的并行流任务正常进行。
若是解决这个问题的其中一种方式,进行线程池隔离。那么如何自定义并行流的线程池呢?
ForkJoinPool 构造参数咱们默认设置为CPU核心数。
ForkJoinPool customThreadPool = new ForkJoinPool(4); long actualTotal = customThreadPool .submit(() -> roster.parallelStream().reduce(0, Integer::sum)).get();
针对 Stream API 一些局限性,Github上有个开源库作了补充。
https://github.com/pivovarit/...
Java 1.8 提供的Stream API简化了代码,很好用。不过在使用过程当中应该注意以上问题。
欢迎你们留言交流,一块儿学习分享!!!