简洁方便的集合处理——Java 8 stream流

背景

java 8已经发行好几年了,前段时间java 12也已经问世,但平时的工做中,不少项目的环境还停留在java1.7中。并且java8的不少新特性都是革命性的,好比各类集合的优化、lambda表达式等,因此咱们仍是要去了解java8的魅力。html

今天咱们来学习java8的Stream,并不须要理论基础,直接能够上手去用。java

我接触stream的缘由,是我要搞一个用户收入消费的数据分析。起初的统计筛选分组都是打算用sql语言直接从mysql里获得结果来展示的。但在操做中咱们发现这样频繁地访问数据库,性能会受到很大的影响,分析速度会很慢。因此咱们但愿能经过访问一次数据库就拿到全部数据,而后放到内存中去进行数据分析统计过滤。mysql

接着,我看了stream的API,发现这就是我想要的。sql

1、Stream理解

在java中咱们称Stream为『』,咱们常常会用流去对集合进行一些流水线的操做。stream就像工厂同样,只须要把集合、命令还有一些参数灌输到流水线中去,就能够加工成得出想要的结果。这样的流水线能大大简洁代码,减小操做。数据库

2、Stream流程

原集合 —> 流  —> 各类操做(过滤、分组、统计) —> 终端操做

 

Stream流的操做流程通常都是这样的,先将集合转为流,而后通过各类操做,好比过滤、筛选、分组、计算。最后的终端操做,就是转化成咱们想要的数据,这个数据的形式通常仍是集合,有时也会按照需求输出count计数。下文会一一举例。数组

在这里插入图片描述

3、API功能举例

首先,定义一个用户对象,包含姓名、年龄、性别和籍贯四个成员变量:数据结构

import lombok.AllArgsConstructor; import lombok.Builder; import lombok.Data; import lombok.NoArgsConstructor; import lombok.extern.log4j.Log4j; @Data @NoArgsConstructor @AllArgsConstructor @Log4j @Builder public class User { //姓名
    private String name; //年龄
    private Integer age; //性别
    private Integer sex; //所在省市
    private String address; }

 

这里用lombok简化了实体类的代码。函数

而后建立须要的集合数据,也就是源数据:性能

//1.构建咱们的list
List<User> list= Arrays.asList( new User("钢铁侠",40,0,"华盛顿"), new User("蜘蛛侠",20,0,"华盛顿"), new User("赵丽颖",30,1,"湖北武汉市"), new User("詹姆斯",35,0,"洛杉矶"), new User("李世民",60,0,"山西省太原市"), new User("蔡徐坤",20,1,"陕西西安市"), new User("葫芦娃的爷爷",70,0,"山西省太原市") );

 

3.1 过滤

1)建立流 stream() / parallelStream()

  • stream() : 串行流
  • parallelStream(): 并行流

2)filter 过滤(T-> boolean)

好比要过滤年龄在40岁以上的用户,就能够这样写:学习

List<User> filterList = list.stream().filter(user -> user.getAge() >= 40) .collect(toList());

 

filter里面,->箭头后面跟着的是一个boolean值,能够写任何的过滤条件,就至关于sql中where后面的东西,换句话说,能用sql实现的功能这里均可以实现

打印结果:

在这里插入图片描述

3)distinct 去重

和sql中的distinct关键字很类似。为了看到效果,此处在原集合中加入一个重复的人,就选择钢铁侠吧,复联4钢铁侠不幸遇害,你们仍是比较伤心的。

List<User> list= Arrays.asList( new User("钢铁侠",40,0,"华盛顿"), new User("钢铁侠",40,0,"华盛顿"), new User("蜘蛛侠",20,0,"华盛顿"), new User("赵丽颖",30,1,"湖北武汉市"), new User("詹姆斯",35,0,"洛杉矶"), new User("李世民",60,0,"山西省太原市"), new User("蔡徐坤”,18,1,"陕西西安市"),
        new User("葫芦娃的爷爷",70,0,"山西省太原市") );

 

//distinct 去重
List<User> distinctList = filterList.stream().distinct() .collect(toList());

 

打印结果:

在这里插入图片描述

4)sorted排序

若是流中的元素的类实现了 Comparable 接口,即有本身的排序规则,那么能够直接调用 sorted() 方法对元素进行排序,如: 

Comparator.comparingInt

 

反之, 须要调用 sorted((T, T) -> int) 实现 Comparator 接口。

//sorted()
List<User> sortedList = distinctList.stream().sorted(Comparator.comparingInt(User::getAge)) .collect(toList());

 

打印结果:

在这里插入图片描述

结果按照年龄从小到大进行排序。

5)limit() 返回前n个元素

若是想知道这里面年龄最小的是谁,可做以下操做:

//limit 返回前n个元素
List<User> limitList = sortedList.stream().limit(1) .collect(toList());

 

在这里插入图片描述

6)skip()

与limit偏偏相反,skip的意思是跳过,也就是去除前n个元素。

打印结果:

在这里插入图片描述

果真,前两我的都被去除了,只剩下最老的葫芦娃爷爷。

3.2 映射

1)map(T->R)

map是将T类型的数据转为R类型的数据,好比咱们想要设置一个新的list,存储用户全部的城市信息。

//map(T->R)
List<String> cityList = list.stream().map(User::getAddress).distinct().collect(toList());

 

打印结果:

在这里插入图片描述

2)flatMap(T -> Stream)

将流中的每个元素 T 映射为一个流,再把每个流链接成为一个流。

//flatMap(T -> Stream<R>)
List<String> flatList = new ArrayList<>(); flatList.add("唱,跳"); flatList.add("rape,篮球,music"); flatList = flatList.stream().map(s -> s.split(",")).flatMap(Arrays::stream).collect(toList());

 

打印结果:

在这里插入图片描述

这里原集合中的数据由逗号分割,使用split进行拆分后,获得的是Stream<string[]>,字符串数组组成的流,要使用flatMap的

Arrays::stream

将Stream<string[]>转为Stream,而后把流相链接,组成了完整的唱、跳、rap、篮球和music。

3.3 查找

1)allMatch(T->boolean)

检测是否所有知足参数行为,假如这些用户是网吧上网的用户名单,那就须要检查是否是每一个人都年满18周岁了。

boolean isAdult = list.stream().allMatch(user -> user.getAge() >= 18);

 

打印结果:

true

 

2)anyMatch(T->boolean)

检测是否有任意元素知足给定的条件,好比,想知道同窗名单里是否有女生。

//anyMatch(T -> boolean) 是否有任意一个元素知足给定的条件
boolean isGirl = list.stream().anyMatch(user -> user.getSex() == 1);

 

打印结果:

true

 

说明集合中有女生存在。

3)noneMatch(T -> boolean)

流中是否有元素匹配给定的 T -> boolean 条件。

好比检测有没有来自巴黎的用户。

boolean isLSJ = list.stream().noneMatch(user -> user.getAddress().contains("巴黎"));

 

打印结果:

true

 

打印true说明没有巴黎的用户。

4)findFirst( ):找到第一个元素

Optional<User> fristUser  = list.stream().findFirst();

 

打印结果:

User(name=钢铁侠, age=40, sex=0, address=华盛顿)

 

5)findAny():找到任意一个元素

Optional<User> anyUser  = list.stream().findAny();

 

打印结果:

User(name=钢铁侠, age=40, sex=0, address=华盛顿)

 

这里咱们发现findAny返回的也老是第一个元素,那么为何还要进行区分呢?由于在并行流 parallelStream() 中找到的确实是任意一个元素。

Optional<User> anyParallelUser  = list.parallelStream().findAny();

 

打印结果 :

Optional[User(name=李世民, age=60, sex=0, address=山西省太原市)]

 

3.4 概括计算

1)求用户的总人数

long count = list.stream().collect(Collectors.counting());

 

咱们能够简写为:

long count = list.stream().count();

 

运行结果:

8

 

2)获得某一属性的最大最小值

// 求最大年龄
Optional<User> max = list.stream().collect(Collectors.maxBy( Comparator.comparing(User::getAge))); // 求最小年龄
Optional<User> min = list.stream().collect(Collectors.minBy( Comparator.comparing(User::getAge)));

 

运行结果:

在这里插入图片描述

在这里插入图片描述

3)求年龄总和是多少

// 求年龄总和
int totalAge = list.stream().collect(Collectors.summingInt(User::getAge));

 

运行结果:

313

 

咱们常常会用BigDecimal来记录金钱,假设想获得BigDecimal的总和:

// 得到列表对象金额, 使用reduce聚合函数,实现累加器
BigDecimal sum = myList.stream() .map(User::getMoney) .reduce(BigDecimal.ZERO,BigDecimal::add);

 

4)求年龄平均值

//求年龄平均值
double avgAge = list.stream().collect( Collectors.averagingInt(User::getAge));

 

运行结果:

39.125

 

5)一次性获得元素的个数、总和、最大值、最小值

IntSummaryStatistics statistics = list.stream().collect( Collectors.summarizingInt(User::getAge));

 

运行结果:

在这里插入图片描述

6)字符串拼接

要将用户的姓名连成一个字符串并用逗号分割。

String names = list.stream().map(User::getName) .collect(Collectors.joining(", "));

 

运行结果:

钢铁侠, 钢铁侠, 蜘蛛侠, 赵丽颖, 詹姆斯, 李世民, 蔡徐坤, 葫芦娃的爷爷

 

3.5 分组

在数据库操做中,咱们常常经过GROUP BY关键字对查询到的数据进行分组,java8的流式处理也提供了分组的功能。使用Collectors.groupingBy来进行分组。

1)能够根据用户所在城市进行分组

Map<String, List<User>> cityMap = list.stream() .collect(Collectors.groupingBy(User::getAddress));

 

在这里插入图片描述

结果是一个map,key为不重复的城市名,value为属于该城市的用户列表。已经实现了分组。

2)二级分组,先根据城市分组再根据性别分组

Map<String, Map<Integer, List<User>>> group = list.stream().collect( Collectors.groupingBy(User::getAddress, // 一级分组,按所在地区
                Collectors.groupingBy(User::getSex))); // 二级分组,按性别

 

运行结果:

在这里插入图片描述

3)若是仅仅想统计各城市的用户个数是多少,并不须要对应的list

按城市分组并统计人数:

Map<String, Long> cityCountMap = list.stream() .collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));

 

运行结果:

在这里插入图片描述

4)固然,也能够先进行过滤再分组并统计人数

Map<String,Long> map = list.stream().filter(user -> user.getAge() <= 30) .collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));

 

运行结果:

在这里插入图片描述

5)partitioningBy 分区

分区与分组的区别在于,分区是按照 true 和 false 来分的,所以partitioningBy 接受的参数的 lambda 也是 T -> boolean

//根据年龄是否小于等于30来分区
Map<Boolean, List<User>> part = list.stream() .collect(partitioningBy(user -> user.getAge() <= 30));

 

运行结果:

在这里插入图片描述

总结

到目前为止,stream的功能咱们已经用了不少了,感受有点眼花缭乱却无所不能,stream能作的事情远远不止这些。

咱们能够多学习使用stream,把原来复杂的sql查询,一遍又一遍地for循环的复杂代码重构,让代码更简洁易懂,可读性强。

拓展阅读:Redis专题(1):构建知识图谱

Redis专题(2):Redis数据结构底层探秘

做者:杨亨

来源:宜信技术学院

原文出处:https://www.cnblogs.com/yixinjishu/p/11081783.html

相关文章
相关标签/搜索