java8-Stream流【转】

时间 2020-06-14

标签 java8 java stream 栏目 Java 繁體版

原文原文链接

Stream是Java 8中引入的一个新的抽象层。 Stream 是对集合（Collection）对象功能的加强，它专一于对集合对象进行各类很是便利、高效的聚合操做（aggregate operation），或者大批量数据操做 (bulk data operation)。 Stream API 借助于一样新出现的 Lambda 表达式，极大的提升编程效率和程序可读性。同时它提供串行和并行两种模式进行汇聚操做，并发模式可以充分利用多核处理器的优点 Stream 不是集合元素，它不是数据结构并不保存数据，它是有关算法和计算的，它更像一个高级版本的 Iterator。获取一个数据源（source）→ 数据转换→执行操做获取想要的结果，每次转换原有 Stream 对象不改变，返回一个新的 Stream 对象（能够有多使用流，能够以相似于SQL语句的声明方式来处理数据。例如，如下SQL语句 SELECT max（salary），employee_id，employee_name FROM Employee 上述SQL表达式自动返回最高受薪雇员的详细信息，而不须要客户端作任何事情。在Java中使用集合框架，开发人员必须使用循环并进行重复检查。另外一个问题是效率;因为如今的电脑基本都是多核处理器，所以Java开发人员能够编写并行代码处理，可是每每会出错为了解决这些问题，Java 8引入了流的概念，让开发人员以声明方式处理数据，并利用多核架构，而无需为其编写任何特定的代码。 (代码简洁+多核处理) stream并非某种数据结构并不保存数据，它是有关算法和计算的，它更像一个高级版本的 Iterator。获取一个数据源（source）→ 数据转换→执行操做获取想要的结果，每次转换原有 Stream 对象不改变，返回一个新的 Stream 对象（能够有屡次转换），这就容许对其操做能够像链条同样排列，变成一个管道，它只是数据源的一种视图。这里的数据源能够是一个数组，Java容器或I/O channel等。正因如此要获得一个stream一般不会手动建立，而是调用对应的工具方法，好比：

调用Collection.stream()或者Collection.parallelStream()方法
调用Arrays.stream(T[] array)方法

经常使用的四种stream接口继承关系以下图:

图中4种stream接口继承自 BaseStream，其中 IntStream, LongStream, DoubleStream对应三种基本类型（ int, long, double，注意不是包装类型）， Stream对应全部剩余类型的stream视图。为不一样数据类型设置不一样stream接口，能够1.提升性能，2.增长特定接口函数

你可能会奇怪为何不把 IntStream等设计成 Stream的子接口？毕竟这接口中的方法名大部分是同样的。答案是这些方法的名字虽然相同，可是返回类型不一样，若是设计成父子接口关系，这些方法将不能共存，由于Java不容许只有返回类型不一样的方法重载。虽然大部分状况下stream是容器调用 Collection.stream()方法获得的，但stream和collections有如下不一样：

无存储。stream不是一种数据结构，它只是某种数据源的一个视图，数据源能够是一个数组，Java容器或I/O channel等。
为函数式编程而生。对stream的任何修改都不会修改背后的数据源，好比对stream执行过滤操做并不会删除被过滤的元素，而是会产生一个不包含被过滤元素的新stream。(从新生成+副本)
惰式执行。stream上的操做并不会当即执行，只有等到用户真正须要结果的时候才会执行。(中间操做和结束操做)
可消费性。stream只能被“消费”一次，一旦遍历过就会失效，就像容器的迭代器那样，想要再次遍历必须从新生成。

count = strings.stream().filter(string -> string.isEmpty()).count();//filter里面是定义好的规则 其参数就是predicate
System.out.println("Empty Strings: " + count);
 
count = strings.stream().filter(string -> string.length() == 3).count();
System.out.println("Strings of length 3: " + count);

每次使用都是从新调用stream() 对stream的操做分为为两类，中间操做(intermediate operations)和结束操做(terminal operations)，两者特色是：

中间操做老是会惰式执行，调用中间操做只会生成一个标记了该操做的新stream，仅此而已。
结束操做会触发实际计算，计算发生时会把全部中间操做积攒的操做以pipeline的方式执行，这样能够减小迭代次数。计算完成以后stream就会失效。下表汇总了Stream接口的部分常见方法：

操做类型	接口方法
中间操做	concat() distinct() filter() flatMap() limit() map() peek() skip() sorted() parallel() sequential() unordered()
结束操做	allMatch() anyMatch() collect() count() findAny() findFirst() forEach() forEachOrdered() max() min() noneMatch() reduce() toArray()

为何不在集合类实现这些操做，而是定义了全新的Stream API？Oracle官方给出了几个重要缘由：一是集合类持有的全部元素都是存储在内存中的，很是巨大的集合类会占用大量的内存，而Stream的元素倒是在访问的时候才被计算出来，这种“延迟计算”的特性有点相似Clojure的lazy-seq，占用内存不多。二是集合类的迭代逻辑是调用者负责，一般是 for循环，而Stream的迭代是隐含在对Stream的各类操做中，例如 map()。对于基本数值型，目前有三种对应的包装类型 Stream：IntStream、LongStream、DoubleStream。关键字: filter:是一个中间操做,接受一个predicate接口类型的变量，并将全部流对象中的元素进行过滤。filter(s -> s.getState()==State.pay) map:是一个对于流对象的中间操做，经过给定的方法，它可以把流对象中的每个元素对应到另一个对象上。map(s -> s.getPlanNo()) / map(s -> Plan::planNo) / 价格变成 10倍 map(s -> s.getPrice().multiply(BigDecimal.valueOf(10))) reduce:把 Stream 元素组合起来。它提供一个起始值（种子），而后依照运算规则（BinaryOperator）,返回单个的结果值，而且reduce操做每处理一个元素老是建立一个新值 BigDecimal total = stream().reduce(BigDecimal.zero, (a,b) -> a.add(b)); 或 BigDecimal total = stream().reduce(BigDecimal.ZERO, BigDecimal::add) limit : 返回 Stream 的前面 n 个元素；skip 则是扔掉前 n 个元素 sorted: 一个中间操做，可以返回一个排过序的流对象的视图。流对象中的元素会默认按照天然顺序进行排序，除非你本身指定一个Comparator接口来改变排序规则. collect: 修改现存的值 Collectors 类的主要做用就是辅助进行各种有用的 reduction 操做 groupingBy 按规则分组:stream().collect(Collectors.groupingBy(p->p.getState())) partitioningBy 是一种特殊的 groupingBy，它依照条件测试的是否两种结果来构造返回的数据结构，get(true) 和 get(false) 能即为所有的元素对象。 Stream 有三个 match 方法，从语义上说： allMatch：Stream 中所有元素符合传入的 predicate，返回 true anyMatch：Stream 中只要有一个元素符合传入的 predicate，返回 true noneMatch：Stream 中没有一个元素符合传入的 predicate，返回 true