一、简介

Stream 将要处理的元素集合看作一种流,在流的过程中,借助Stream API对流中的元素进行操作,比如:筛选、排序、聚合等。

Stream 流的概述

Stream 流操作是 Java 8 提供一个重要新特性,它允许开发人员以声明性方式处理集合,其核心类库主要改进了对集合类的 API 和新增 Stream 操作。Stream 类中每一个方法都对应集合上的一种操作。将真正的函数式编程引入到 Java 中,能 让代码更加简洁,极大地简化了集合的处理操作,提高了开发的效率和生产力。
同时 Stream 不是一种数据结构,它只是某种数据源的一个视图,数据源可以是一个数组,Java 容器或I/O channel等。在 Stream 中的操作每一次都会产生新的流,内部不会像普通集合操作一样立刻获取值,而是惰性取值,只有等到用户真正需要结果的时候才会执行。并且对于现在调用的方法,本身都是一种高层次构件,与线程模型无关。因此在并行使用中,开发者们无需再去操心线程和锁了。Stream 内部都已经做好了 。
关于对 Stream 流的理解,你可以把他当成工厂中的流水线,每个 Stream 流的操作过程遵循着创建 -->操作 -->获取结果的过程,就像流水线上的节点一样组成一个个链条。除此之外你还可以把他理解成 sql 的视图,集合就相当于数据表中的数据,获取 Stream 流的过程就是确定数据表的属性和元数据的过程,元数据的每一个元素就是表中的数据,对 Stream 流进行操作的过程就是通过 sql 对这些数据进行查找、过滤、组合、计算、操作、分组等过程,获取结果就是 sql 执行完毕之后获取的结果视图一样,深入理解 Stream 流可以让我们使用更加简洁的代码获取自己想要的数据。

Stream 流是Java8Collection类新增的一种功能,利用Stream,我们可以

  1. 不写 for 循环,而遍历整个Collection,且速度更快
  2. 替换 Collection 中的成员(类型和值都可以替换)
  3. 收集替换结果,然后将原Collection类转为任意想要的新Collection

Stream 可以由数组或集合创建,对流的操作分为两种:

  1. 中间操作:会返回一个流,通过这种方式可以将多个中间操作连接起来,形成一个调用链,从而转换为另外 一个流。除非调用链后存在一个终端操作,否则中间操作对流不会进行任何结果处理。
  2. 终端操作:每个流只能进行一次终端操作,终端操作结束后流无法再次使用。终端操作会产生一个新的集合或值,会返回一个具体的结果,如booleanlistinteger等。

Stream 特性:

  1. Stream 不存储数据,而是按照特定的规则对数据进行计算,一般会输出结果。
  2. Stream 不会改变数据源,通常情况下会产生一个新的集合或一个值。
  3. Stream 具有延迟执行特性,只有调用终端操作时,中间操作才会执行。

二、创建

如果是数组的话,可以使用Arrays.stream()或者Stream.of()创建流;如果是集合的话,可以直接使用stream()方法创建流,因为该方法已经添加到 Collection 接口中。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public class CreateStreamDemo {
public static void main(String[] args) {
String[] arr = new String[]{"武汉加油", "中国加油", "世界加油"};
Stream<String> stream = Arrays.stream(arr);

stream = Stream.of("武汉加油", "中国加油", "世界加油");

List<String> list = new ArrayList<>();
list.add("武汉加油");
list.add("中国加油");
list.add("世界加油");
stream = list.stream();
}
}

查看 Stream 源码的话,你会发现of()方法内部其实调用了Arrays.stream()方法。

1
2
3
public static<T> Stream<T> of(T... values) {
return Arrays.stream(values);
}

另外,集合还可以调用parallelStream()方法创建并发流,默认使用的是ForkJoinPool.commonPool()线程池。

1
2
List<Long> aList = new ArrayList<>();
Stream<Long> parallelStream = aList.parallelStream();

三、使用

1. 遍历/匹配(foreach/find/match)

match:

  • anyMatch():只要有一个元素匹配传入的条件,就返回 true。
  • allMatch():只有有一个元素不匹配传入的条件,就返回 false;如果全部匹配,则返回 true。
  • noneMatch():只要有一个元素匹配传入的条件,就返回 false;如果全部匹配,则返回 true。

Stream 也是支持类似集合的遍历和匹配元素的,只是 Stream 中的元素是以Optional类型存在的。Stream 的遍历、匹配非常简单。
Stream流-遍历/匹配

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
List<Integer> list = Arrays.asList(7, 6, 9, 3, 8, 2, 1);

// 遍历输出符合条件的元素
list.stream().filter(x -> x > 6).forEach(System.out::println);

// 匹配第一个
Optional<Integer> findFirst = list.stream().filter(x -> x > 6).findFirst();

// 匹配任意(适用于并行流)
Optional<Integer> findAny = list.parallelStream().filter(x -> x > 6).findAny();

// 是否包含符合特定条件的元素
boolean anyMatch = list.stream().anyMatch(x -> x < 6);
System.out.println("匹配第一个值:" + findFirst.get());
System.out.println("匹配任意一个值:" + findAny.get());
System.out.println("是否存在大于6的值:" + anyMatch);

match匹配

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("周杰伦");
list.add("王力宏");
list.add("陶喆");
list.add("林俊杰");

boolean anyMatchFlag = list.stream().anyMatch(element -> element.contains("王"));
boolean allMatchFlag = list.stream().allMatch(element -> element.length() > 1);
boolean noneMatchFlag = list.stream().noneMatch(element -> element.endsWith("沉"));
System.out.println(anyMatchFlag);
System.out.println(allMatchFlag);
System.out.println(noneMatchFlag);
}

因为“王力宏”以“王”字开头,所以 anyMatchFlag 应该为 true;因为“周杰伦”、“王力宏”、“陶喆”、“林俊杰”的字符串长度都大于 1,所以 allMatchFlag 为 true;因为 4 个字符串结尾都不是“沉”,所以 noneMatchFlag 为 true。

2. 筛选(filter)

筛选,是按照一定的规则校验流中的元素,将符合条件的元素提取到新的流中的操作。

filter():方法接收的是一个 Predicate(Java 8 新增的一个函数式接口,接受一个输入参数返回一个布尔值结果)类型的参数,因此,我们可以直接将一个 Lambda 表达式传递给该方法,比如说 element -> element.contains(“王”) 就是筛选出带有“王”的字符串。
forEach():方法接收的是一个 Consumer(Java 8 新增的一个函数式接口,接受一个输入参数并且无返回的操作)类型的参数,类名 :: 方法名是 Java 8 引入的新语法,System.out 返回 PrintStream 类,println 方法是打印的。

Stream流-筛选

筛选Integer集合

1
list.stream.filter(x -> x > 7).forEach(System.out::println);

筛选对象集合

1
2
3
4
//筛选员工中工资高于8000的人姓名,并形成新的集合
List<String> fiterList = personList.stream().filter(x -> x.getSalary() > 8000)
.map(Person::getName)
.collect(Collectors.toList());

3. 聚合(max/min/count)

maxmincount这些字眼你一定不陌生,没错,在Mysql中我们常用它们进行数据统计。Java Stream中也引入了这些概念和用法,极大地方便了我们对集合、数组的数据统计工作。
Stream流-聚合

获取String集合中最长的元素

1
2
Optional<String> max = list.stream().max(Comparator.comparing(String::length));
System.out.println("最长的字符串:" + max.get());

获取Integer集合中的最大值

1
2
3
4
5
6
7
8
9
10
11
12
13
// 自然排序
Optional<Integer> max = list.stream().max(Integer::compareTo);

// 自定义排序
Optional<Integer> max2 = list.stream().max(new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o1.compareTo(o2);
}
});

System.out.println("自然排序的最大值:" + max.get());
System.out.println("自定义排序的最大值:" + max2.get());

获取员工工资最高的人

1
2
Optional<Person> max = personList.stream().max(Comparator.comparingInt(Person::getSalary));
System.out.println("员工工资最大值:" + max.get().getSalary());

计算Integer集合中大于6的元素的个数

1
2
// list中大于6的元素个数
Integer count = list.stream().filter(x -> x > 6).count();

4. 映射(map/flatMap)

映射,可以将一个流的元素按照一定的映射规则映射到另一个流中。
分为mapflatMap

  • map:接收的是一个 Function(Java 8 新增的一个函数式接口,接受一个输入参数 T,返回一个结果 R)类型的参数函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。
  • flatMap:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
    Stream流-映射

英文字符串改为大写;整数数组每个元素+3(map)

1
2
3
4
5
// 每个元素大写
List<String> strList = Arrays.stream(strArr).map(String::toUpperCase).collect(Collectors.toList());

// 每个元素+3
List<Integer> intListNew = intList.stream().map(x -> x + 3).collect(Collectors.toList());

将员工的薪资全部增加1000(map)

1
2
3
4
5
6
7
8
9
10
11
12
 // 不改变原来员工集合的方式
List<Person> personListNew = personList.stream().map(person -> {
Person personNew = new Person(person.getName(), 0, 0, null, null);
personNew.setSalary(person.getSalary() + 10000);
return personNew;
}).collect(Collectors.toList());

// 改变原来员工集合的方式
List<Person> personListNew2 = personList.stream().map(person -> {
person.setSalary(person.getSalary() + 10000);
return person;
}).collect(Collectors.toList());

将两个字符数组合并成一个新的字符数组(flatMap)

1
2
3
4
5
6
List<String> listNew = list.stream().flatMap(s -> {
// 将每个元素转换成一个stream
String[] split = s.split(",");
Stream<String> s2 = Arrays.stream(split);
return s2;
}).collect(Collectors.toList());

找出年龄为18的所有员工名称(flatMap)

1
2
//公司加入一个新人,找出公司所有员工中年龄为18的并打印出来
Stream.of(list, newList).flatMap(persons -> persons.stream().filter(person -> person.getAge() == 18)).forEach(person -> System.out.println(person.getName()));

5. 归约(reduce)

归约,也称缩减,顾名思义,是把一个流缩减成一个值,能实现对集合求和、求乘积和求最值操作。

它有两种用法:

  • Optional<T> reduce(BinaryOperator<T> accumulator)
    没有起始值,只有一个参数,就是运算规则,此时返回 Optional。
  • T reduce(T identity, BinaryOperator<T> accumulator)
    有起始值(此基础上的累加),有运算规则,两个参数,此时返回的类型和起始值类型一致。

运算规则可以是Lambda表达式(比如(a, b) -> a + b),也可以是类名::方法名(比如Integer::sum

Stream流-归约

求Integer集合的元素之和、乘积和最大值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
// 求和方式1
Optional<Integer> sum = list.stream().reduce((x, y) -> x + y);

// 求和方式2
Optional<Integer> sum2 = list.stream().reduce(Integer::sum);

// 求和方式3
Integer sum3 = list.stream().reduce(0, Integer::sum);

// 求乘积
Optional<Integer> product = list.stream().reduce((x, y) -> x * y);

// 求最大值方式1
Optional<Integer> max = list.stream().reduce((x, y) -> x > y ? x : y);

// 求最大值写法2
Integer max2 = list.stream().reduce(1, Integer::max);

求所有员工的工资之和和最高工资

1
2
3
4
5
6
7
8
9
10
11
12
13
14
// 求工资之和方式1:
Optional<Integer> sumSalary = personList.stream().map(Person::getSalary).reduce(Integer::sum);

// 求工资之和方式2:
Integer sumSalary2 = personList.stream().reduce(0, (sum, p) -> sum += p.getSalary(), (sum1, sum2) -> sum1 + sum2);

// 求工资之和方式3:
Integer sumSalary3 = personList.stream().reduce(0, (sum, p) -> sum += p.getSalary(), Integer::sum);

// 求最高工资方式1:
Integer maxSalary = personList.stream().reduce(0, (max, p) -> max > p.getSalary() ? max : p.getSalary(), Integer::max);

// 求最高工资方式2:
Integer maxSalary2 = personList.stream().reduce(0, (max, p) -> max > p.getSalary() ? max : p.getSalary(), (max1, max2) -> max1 > max2 ? max1 : max2);

6. 收集(collect)

collect,收集,可以说是内容最繁多、功能最丰富的部分了。从字面上去理解,就是把一个流收集起来,最终可以是收集成一个值也可以收集成一个新的集合。

collect主要依赖java.util.stream.Collectors类内置的静态方法。

归集(toList/toSet/toMap)

因为流不存储数据,那么在流中的数据完成处理后,需要将流中的数据重新归集到新的集合里。toListtoSettoMap比较常用,另外还有toCollectiontoConcurrentMap等复杂一些的用法。

1
2
3
4
5
6
7
8
// toList
List<Integer> listNew = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toList());

// toSet
Set<Integer> set = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toSet());

// toMap
Map<?, Person> map = personList.stream().filter(p -> p.getSalary() > 8000).collect(Collectors.toMap(Person::getName, p -> p));

统计(count/averaging)

Collectors提供了一系列用于数据统计的静态方法:

  • 计数:count
  • 平均值:averagingInt、averagingLong、averagingDouble
  • 最值:maxBy、minBy
  • 求和:summingInt、summingLong、summingDouble
  • 统计以上所有:summarizingInt、summarizingLong、summarizingDouble
1
2
3
4
5
6
7
8
9
10
11
12
13
14
// 求总数
Long count = personList.stream().collect(Collectors.counting());

// 求平均工资
Double average = personList.stream().collect(Collectors.averagingDouble(Person::getSalary));

// 求最高工资
Optional<Integer> max = personList.stream().map(Person::getSalary).collect(Collectors.maxBy(Integer::compare));

// 求工资之和
Integer sum = personList.stream().collect(Collectors.summingInt(Person::getSalary));

// 一次性统计所有信息
DoubleSummaryStatistics collect = personList.stream().collect(Collectors.summarizingDouble(Person::getSalary));

分组(partitioningBy/groupingBy)

分区:将Stream按条件分为两个Map,比如员工按薪资是否高于8000分为两部分。
分组:将集合分为多个Map,比如员工按性别分组。有单级分组和多级分组。
Stream流-收集-分组

1
2
3
4
5
6
7
8
9
10
11
12
13
14
// 将员工按薪资是否高于8000分组
Map<Boolean, List<Person>> part = personList.stream().collect(Collectors.partitioningBy(x -> x.getSalary() > 8000));

// 将员工按性别分组
Map<String, List<Person>> group = personList.stream().collect(Collectors.groupingBy(Person::getSex));

// 将员工先按性别分组,再按地区分组
Map<String, Map<String, List<Person>>> group2 = personList.stream().collect(Collectors.groupingBy(Person::getSex, Collectors.groupingBy(Person::getArea)));

// 按照年龄分组(无重复)
Map<Integer, Set<Person>> map1 = list.stream().collect(Collectors.groupingBy(Person::getAge, Collectors.toSet()));

// 按照年龄分组(无重复 + 保持插入顺序)
Map<Integer, Set<Person>> map2 = list.stream().collect(Collectors.groupingBy(Person::getAge, LinkedHashMap::new, Collectors.toSet()));

接合(joining)

joining可以将Stream中的元素用特定的连接符(没有的话,则直接连接)连接成一个字符串。

1
2
3
4
5
// 所有员工的姓名
String names = personList.stream().map(p -> p.getName()).collect(Collectors.joining(","));

// 拼接后的字符串
String string = list.stream().collect(Collectors.joining("-"));

归约(reducing)

Collectors类提供的reducing方法,相比于Stream本身的reduce方法,增加了对自定义归约的支持

1
2
3
4
5
6
// 每个员工减去起征点后的薪资之和(这个例子并不严谨,但一时没想到好的例子)
Integer sum = personList.stream().collect(Collectors.reducing(0, Person::getSalary, (i, j) -> (i + j - 5000)));
System.out.println("员工扣税薪资总和:" + sum);

// stream的reduce,员工薪资总和
Optional<Integer> sum2 = personList.stream().map(Person::getSalary).reduce(Integer::sum);

7. 排序(sorted)

sorted,中间操作。有两种排序:

  • sorted():自然排序,流中元素需实现Comparable接口
  • sorted(Comparator com):Comparator排序器自定义排序

将员工按工资由高到低(工资一样则按年龄由大到小)排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
// 按工资升序排序(自然排序)
List<String> newList = personList.stream().sorted(Comparator.comparing(Person::getSalary)).map(Person::getName)
.collect(Collectors.toList());

// 按工资倒序排序
List<String> newList2 = personList.stream().sorted(Comparator.comparing(Person::getSalary).reversed())
.map(Person::getName).collect(Collectors.toList());

// 先按工资再按年龄升序排序
List<String> newList3 = personList.stream()
.sorted(Comparator.comparing(Person::getSalary).thenComparing(Person::getAge)).map(Person::getName)
.collect(Collectors.toList());

// 先按工资再按年龄自定义排序(降序)
List<String> newList4 = personList.stream().sorted((p1, p2) -> {
if (p1.getSalary() == p2.getSalary()) {
return p2.getAge() - p1.getAge();
} else {
return p2.getSalary() - p1.getSalary();
}
}).map(Person::getName).collect(Collectors.toList());

8. 提取/组合

流也可以进行合并、去重、限制、跳过等操作。
其中,skiplimit相似,都是从1开始,传入负值会抛出异常。
Stream流-提取/组合

1
2
3
4
5
6
7
8
// concat:合并两个流 distinct:去重
List<String> newList = Stream.concat(stream1, stream2).distinct().collect(Collectors.toList());

// limit:限制从流中获得前n个数据
List<Integer> collect = Stream.iterate(1, x -> x + 2).limit(10).collect(Collectors.toList());

// skip:跳过前n个数据
List<Integer> collect2 = Stream.iterate(1, x -> x + 2).skip(1).limit(5).collect(Collectors.toList());

四、语句

1. 提取

1
2
//提取list集合中的对象某个字段然后生成对应的新集合
List<Integer> modelItemIds = casePo.getAssessment().getAssessmentItems().stream().map(AssessmentItemPo::getModelItemId).collect(Collectors.toList());

2. 求和

字段累加求和

1
2
字段累加求和
int total = list.stream().mapToInt(CaseInfoVO::getPersonValue).sum();

Bigdecimal 求和

1
2
3
4
//对YsHouseInfo.contractAmt求和
BigDecimal agreConAmt = houseInfos.stream()
.map(YsHouseInfo::getContractAmt)
.reduce(BigDecimal.ZERO, BigDecimal::add);

五、常见错误

1. stream()操作toMap()时Duplicate key

问题描述:

Java8Steam()流进行tomap转换编程时,遇到以下错误

1
2
3
4
5
6
7
8
9
10
11
java.lang.IllegalStateException: Duplicate key bbb
at java.util.stream.Collectors.lambda$throwingMerger$0(Collectors.java:133)
at java.util.HashMap.merge(HashMap.java:1253)
at java.util.stream.Collectors.lambda$toMap$58(Collectors.java:1320)
at java.util.stream.ReduceOps$3ReducingSink.accept(ReduceOps.java:169)
at java.util.ArrayList$ArrayListSpliterator.forEachRemaining(ArrayList.java:1374)
at java.util.stream.AbstractPipeline.copyInto(AbstractPipeline.java:481)
at java.util.stream.AbstractPipeline.wrapAndCopyInto(AbstractPipeline.java:471)
at java.util.stream.ReduceOps$ReduceOp.evaluateSequential(ReduceOps.java:708)
at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:234)
at java.util.stream.ReferencePipeline.collect(ReferencePipeline.java:499)

解决方案

解决方式就在Java8提供的Collectors.toMap()方法中,其第三个参数就是当出现duplicate key的时候的处理方案

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
方案一: 出现重复时,取前面value的值,或者取后面放入的value值,则覆盖先前的value值

// 取后面的值,舍弃前面的值
Map<Long, String> map = userList.stream()
.collect(Collectors.toMap(User::getId, User::getUsername, (v1, v2) -> v2));

// 取前面的值,舍弃后面的值
Map<Long, String> map = userList.stream()
.collect(Collectors.toMap(User::getId, User::getUsername, (v1, v2) -> v1));


方案二: Map的value可以储存一个list,把重复key的值放入list,再存到value中
userList.stream().collect(Collectors.toMap(User::getId,
e -> Arrays.asList(e.getUsername()),
(List<String> oldList, List<String> newList) -> {
oldList.addAll(newList);
return oldList;
}));

相关引用:

  1. CSDN - Stream流详解
  2. CSDN - 一文带你入门Java Stream流,太强了