还看不懂同事的代码?超强的 Stream 流操作姿势还不学习一下
java 8 新特性系列文章索引。
前言
我们都知道 lambda 和 stream 是 java 8 的两大亮点功能,在前面的文章里已经介绍过 lambda 相关知识,这次介绍下 java 8 的 stream 流操作。它完全不同于 java.io 包的 input/output stream ,也不是大数据实时处理的 stream 流。这个 stream 流操作是 java 8 对集合操作功能的增强,专注于对集合的各种高效、便利、优雅的聚合操作。借助于 lambda 表达式,显著的提高编程效率和可读性。且 stream 提供了并行计算模式,可以简洁的编写出并行代码,能充分发挥如今计算机的多核处理优势。
在使用 stream 流操作之前你应该先了解 lambda 相关知识,如果还不了解,可以参考之前文章:还看不懂同事的代码?lambda 表达式、函数接口了解一下 。
1. stream 流介绍
stream 不同于其他集合框架,它也不是某种数据结构,也不会保存数据,但是它负责相关计算,使用起来更像一个高级的迭代器。在之前的迭代器中,我们只能先遍历然后在执行业务操作,而现在只需要指定执行什么操作, stream 就会隐式的遍历然后做出想要的操作。另外 stream 和迭代器一样的只能单向处理,如同奔腾长江之水一去而不复返。
由于 stream 流提供了惰性计算和并行处理的能力,在使用并行计算方式时数据会被自动分解成多段然后并行处理,最后将结果汇总。所以 stream 操作可以让程序运行变得更加高效。
2. stream 流概念
stream 流的使用总是按照一定的步骤进行,可以抽象出下面的使用流程。
数据源(source) -> 数据处理/转换(intermedia) -> 结果处理(terminal )
2.1. 数据源
数据源(source)
也就是数据的来源,可以通过多种方式获得 stream 数据源,下面列举几种常见的获取方式。
- collection.stream(); 从集合获取流。
- collection.parallelstream(); 从集合获取并行流。
- arrays.stream(t array) or stream.of(); 从数组获取流。
- bufferedreader.lines(); 从输入流中获取流。
- intstream.of() ; 从静态方法中获取流。
- stream.generate(); 自己生成流
2.2. 数据处理
数据处理/转换(intermedia)
步骤可以有多个操作,这步也被称为intermedia
(中间操作)。在这个步骤中不管怎样操作,它返回的都是一个新的流对象,原始数据不会发生任何改变,而且这个步骤是惰性计算
处理的,也就是说只调用方法并不会开始处理,只有在真正的开始收集结果时,中间操作才会生效,而且如果遍历没有完成,想要的结果已经获取到了(比如获取第一个值),会停止遍历,然后返回结果。惰性计算
可以显著提高运行效率。
数据处理演示。
@test public void streamdemo(){ list<string> namelist = arrays.aslist("darcy", "chris", "linda", "sid", "kim", "jack", "poul", "peter"); // 1. 筛选出名字长度为4的 // 2. 名字前面拼接 this is // 3. 遍历输出 namelist.stream() .filter(name -> name.length() == 4) .map(name -> "this is "+name) .foreach(name -> system.out.println(name)); } // 输出结果 // this is jack // this is poul
数据处理/转换
操作自然不止是上面演示的过滤 filter
和 map
映射两种,另外还有 map (maptoint, flatmap 等)、 filter、 distinct、 sorted、 peek、 limit、 skip、 parallel、 sequential、 unordered 等。
2.3. 收集结果
结果处理(terminal )
是流处理的最后一步,执行完这一步之后流会被彻底用尽,流也不能继续操作了。也只有到了这个操作的时候,流的数据处理/转换
等中间过程才会开始计算,也就是上面所说的惰性计算
。结果处理
也必定是流操作的最后一步。
常见的结果处理
操作有 foreach、 foreachordered、 toarray、 reduce、 collect、 min、 max、 count、 anymatch、 allmatch、 nonematch、 findfirst、 findany、 iterator 等。
下面演示了简单的结果处理
的例子。
/** * 转换成为大写然后收集结果,遍历输出 */ @test public void touppercasedemo() { list<string> namelist = arrays.aslist("darcy", "chris", "linda", "sid", "kim", "jack", "poul", "peter"); list<string> uppercasenamelist = namelist.stream() .map(string::touppercase) .collect(collectors.tolist()); uppercasenamelist.foreach(name -> system.out.println(name + ",")); } // 输出结果 // darcy,chris,linda,sid,kim,jack,poul,peter,
2.4. short-circuiting
有一种 stream 操作被称作 short-circuiting
,它是指当 stream 流无限大但是需要返回的 stream 流是有限的时候,而又希望它能在有限的时间内计算出结果,那么这个操作就被称为short-circuiting
。例如 findfirst
操作。
3. stream 流使用
stream 流在使用时候总是借助于 lambda 表达式进行操作,stream 流的操作也有很多种方式,下面列举的是常用的 11 种操作。
3.1. stream 流获取
获取 stream 的几种方式在上面的 stream 数据源里已经介绍过了,下面是针对上面介绍的几种获取 stream 流的使用示例。
@test public void createstream() throws filenotfoundexception { list<string> namelist = arrays.aslist("darcy", "chris", "linda", "sid", "kim", "jack", "poul", "peter"); string[] namearr = {"darcy", "chris", "linda", "sid", "kim", "jack", "poul", "peter"}; // 集合获取 stream 流 stream<string> nameliststream = namelist.stream(); // 集合获取并行 stream 流 stream<string> nameliststream2 = namelist.parallelstream(); // 数组获取 stream 流 stream<string> namearrstream = stream.of(namearr); // 数组获取 stream 流 stream<string> namearrstream1 = arrays.stream(namearr); // 文件流获取 stream 流 bufferedreader bufferedreader = new bufferedreader(new filereader("readme.md")); stream<string> linesstream = bufferedreader.lines(); // 从静态方法获取流操作 intstream rangestream = intstream.range(1, 10); rangestream.limit(10).foreach(num -> system.out.print(num+",")); system.out.println(); intstream intstream = intstream.of(1, 2, 3, 3, 4); intstream.foreach(num -> system.out.print(num+",")); }
3.2. foreach
foreach
是 strean 流中的一个重要方法,用于遍历 stream 流,它支持传入一个标准的 lambda 表达式。但是它的遍历不能通过 return/break 进行终止。同时它也是一个 terminal
操作,执行之后 stream 流中的数据会被消费掉。
如输出对象。
list<integer> numberlist = arrays.aslist(1, 2, 3, 4, 5, 6, 7, 8, 9); numberlist.stream().foreach(number -> system.out.println(number+",")); // 输出结果 // 1,2,3,4,5,6,7,8,9,
3.3. map / flatmap
使用 map
把对象一对一映射成另一种对象或者形式。
/** * 把数字值乘以2 */ @test public void maptest() { list<integer> numberlist = arrays.aslist(1, 2, 3, 4, 5, 6, 7, 8, 9); // 映射成 2倍数字 list<integer> collect = numberlist.stream() .map(number -> number * 2) .collect(collectors.tolist()); collect.foreach(number -> system.out.print(number + ",")); system.out.println(); numberlist.stream() .map(number -> "数字 " + number + ",") .foreach(number -> system.out.println(number)); } // 输出结果 // 2,4,6,8,10,12,14,16,18, // 数字 1,数字 2,数字 3,数字 4,数字 5,数字 6,数字 7,数字 8,数字 9,
上面的 map
可以把数据进行一对一的映射,而有些时候关系可能不止 1对 1那么简单,可能会有1对多。这时可以使用 flatmap。下面演示
使用 flatmap
把对象扁平化展开。
/** * flatmap把对象扁平化 */ @test public void flatmaptest() { stream<list<integer>> inputstream = stream.of( arrays.aslist(1), arrays.aslist(2, 3), arrays.aslist(4, 5, 6) ); list<integer> collect = inputstream .flatmap((childlist) -> childlist.stream()) .collect(collectors.tolist()); collect.foreach(number -> system.out.print(number + ",")); } // 输出结果 // 1,2,3,4,5,6,
3.4. filter
使用 filter
进行数据筛选,挑选出想要的元素,下面的例子演示怎么挑选出偶数数字。
/** * filter 数据筛选 * 筛选出偶数数字 */ @test public void filtertest() { list<integer> numberlist = arrays.aslist(1, 2, 3, 4, 5, 6, 7, 8, 9); list<integer> collect = numberlist.stream() .filter(number -> number % 2 == 0) .collect(collectors.tolist()); collect.foreach(number -> system.out.print(number + ",")); }
得到如下结果。
2,4,6,8,
3.5. findfirst
findfirst
可以查找出 stream 流中的第一个元素,它返回的是一个 optional 类型,如果还不知道 optional 类的用处,可以参考之前文章 jdk14都要出了,还不能使用 optional优雅的处理空指针? 。
/** * 查找第一个数据 * 返回的是一个 optional 对象 */ @test public void findfirsttest(){ list<integer> numberlist = arrays.aslist(1, 2, 3, 4, 5, 6, 7, 8, 9); optional<integer> firstnumber = numberlist.stream() .findfirst(); system.out.println(firstnumber.orelse(-1)); } // 输出结果 // 1
findfirst
方法在查找到需要的数据之后就会返回不再遍历数据了,也因此 findfirst
方法可以对有无限数据的 stream 流进行操作,也可以说 findfirst
是一个 short-circuiting
操作。
3.6. collect / toarray
stream 流可以轻松的转换为其他结构,下面是几种常见的示例。
/** * stream 转换为其他数据结构 */ @test public void collecttest() { list<integer> numberlist = arrays.aslist(1, 1, 2, 2, 3, 3, 4, 4, 5); // to array integer[] toarray = numberlist.stream() .toarray(integer[]::new); // to list list<integer> integerlist = numberlist.stream() .collect(collectors.tolist()); // to set set<integer> integerset = numberlist.stream() .collect(collectors.toset()); system.out.println(integerset); // to string string tostring = numberlist.stream() .map(number -> string.valueof(number)) .collect(collectors.joining()).tostring(); system.out.println(tostring); // to string split by , string tostringbjoin = numberlist.stream() .map(number -> string.valueof(number)) .collect(collectors.joining(",")).tostring(); system.out.println(tostringbjoin); } // 输出结果 // [1, 2, 3, 4, 5] // 112233445 // 1,1,2,2,3,3,4,4,5
3.7. limit / skip
获取或者扔掉前 n 个元素
/** * 获取 / 扔掉前 n 个元素 */ @test public void limitorskiptest() { // 生成自己的随机数流 list<integer> agelist = arrays.aslist(11, 22, 13, 14, 25, 26); agelist.stream() .limit(3) .foreach(age -> system.out.print(age+",")); system.out.println(); agelist.stream() .skip(3) .foreach(age -> system.out.print(age+",")); } // 输出结果 // 11,22,13, // 14,25,26,
3.8. statistics
数学统计功能,求一组数组的最大值、最小值、个数、数据和、平均数等。
/** * 数学计算测试 */ @test public void mathtest() { list<integer> list = arrays.aslist(1, 2, 3, 4, 5, 6); intsummarystatistics stats = list.stream().maptoint(x -> x).summarystatistics(); system.out.println("最小值:" + stats.getmin()); system.out.println("最大值:" + stats.getmax()); system.out.println("个数:" + stats.getcount()); system.out.println("和:" + stats.getsum()); system.out.println("平均数:" + stats.getaverage()); } // 输出结果 // 最小值:1 // 最大值:6 // 个数:6 // 和:21 // 平均数:3.5
3.9. groupingby
分组聚合功能,和数据库的 group by 的功能一致。
/** * groupingby * 按年龄分组 */ @test public void groupbytest() { list<integer> agelist = arrays.aslist(11, 22, 13, 14, 25, 26); map<string, list<integer>> agegrouybymap = agelist.stream() .collect(collectors.groupingby(age -> string.valueof(age / 10))); agegrouybymap.foreach((k, v) -> { system.out.println("年龄" + k + "0多岁的有:" + v); }); } // 输出结果 // 年龄10多岁的有:[11, 13, 14] // 年龄20多岁的有:[22, 25, 26]
3.10. partitioningby
/** * partitioningby * 按某个条件分组 * 给一组年龄,分出成年人和未成年人 */ public void partitioningbytest() { list<integer> agelist = arrays.aslist(11, 22, 13, 14, 25, 26); map<boolean, list<integer>> agemap = agelist.stream() .collect(collectors.partitioningby(age -> age > 18)); system.out.println("未成年人:" + agemap.get(false)); system.out.println("成年人:" + agemap.get(true)); } // 输出结果 // 未成年人:[11, 13, 14] // 成年人:[22, 25, 26]
3.11. 进阶 - 自己生成 stream 流
/** * 生成自己的 stream 流 */ @test public void generatetest(){ // 生成自己的随机数流 random random = new random(); stream<integer> generaterandom = stream.generate(random::nextint); generaterandom.limit(5).foreach(system.out::println); // 生成自己的 uuid 流 stream<uuid> generate = stream.generate(uuid::randomuuid); generate.limit(5).foreach(system.out::println); } // 输出结果 // 793776932 // -2051545609 // -917435897 // 298077102 // -1626306315 // 31277974-841a-4ad0-a809-80ae105228bd // f14918aa-2f94-4774-afcf-fba08250674c // d86ccefe-1cd2-4eb4-bb0c-74858f2a7864 // 4905724b-1df5-48f4-9948-fa9c64c7e1c9 // 3af2a07f-0855-455f-a339-6e890e533ab3
上面的例子中 stream 流是无限的,但是获取到的结果是有限的,使用了 limit
限制获取的数量,所以这个操作也是 short-circuiting
操作。
4. stream 流优点
4.1. 简洁优雅
正确使用并且正确格式化的 stream 流操作代码不仅简洁优雅,更让人赏心悦目。下面对比下在使用 stream 流和不使用 stream 流时相同操作的编码风格。
/** * 使用流操作和不使用流操作的编码风格对比 */ @test public void difftest() { // 不使用流操作 list<string> names = arrays.aslist("jack", "jill", "nate", "kara", "kim", "jullie", "paul", "peter"); // 筛选出长度为4的名字 list<string> sublist = new arraylist<>(); for (string name : names) { if (name.length() == 4) { sublist.add(name); } } // 把值用逗号分隔 stringbuilder sbnames = new stringbuilder(); for (int i = 0; i < sublist.size() - 1; i++) { sbnames.append(sublist.get(i)); sbnames.append(", "); } // 去掉最后一个逗号 if (sublist.size() > 1) { sbnames.append(sublist.get(sublist.size() - 1)); } system.out.println(sbnames); } // 输出结果 // jack, jill, nate, kara, paul
如果是使用 stream 流操作。
// 使用 stream 流操作 string namestring = names.stream() .filter(num -> num.length() == 4) .collect(collectors.joining(", ")); system.out.println(namestring);
4.2. 惰性计算
上面有提到,数据处理/转换(intermedia)
操作 map (maptoint, flatmap 等)、 filter、 distinct、 sorted、 peek、 limit、 skip、 parallel、 sequential、 unordered 等这些操作,在调用方法时并不会立即调用,而是在真正使用的时候才会生效,这样可以让操作延迟到真正需要使用的时刻。
下面会举个例子演示这一点。
/** * 找出偶数 */ @test public void lazytest() { // 生成自己的随机数流 list<integer> numberlist = arrays.aslist(1, 2, 3, 4, 5, 6); // 找出偶数 stream<integer> integerstream = numberlist.stream() .filter(number -> { int temp = number % 2; if (temp == 0 ){ system.out.println(number); } return temp == 0; }); system.out.println("分割线"); list<integer> collect = integerstream.collect(collectors.tolist()); }
如果没有 惰性计算
,那么很明显会先输出偶数,然后输出 分割线
。而实际的效果是。
分割线 2 4 6
可见 惰性计算
把计算延迟到了真正需要的时候。
4.3. 并行计算
获取 stream 流时可以使用 parallelstream
方法代替 stream
方法以获取并行处理流,并行处理可以充分的发挥多核优势,而且不增加编码的复杂性。
下面的代码演示了生成一千万个随机数后,把每个随机数乘以2然后求和时,串行计算和并行计算的耗时差异。
/** * 并行计算 */ @test public void main() { // 生成自己的随机数流,取一千万个随机数 random random = new random(); stream<integer> generaterandom = stream.generate(random::nextint); list<integer> numberlist = generaterandom.limit(10000000).collect(collectors.tolist()); // 串行 - 把一千万个随机数,每个随机数 * 2 ,然后求和 long start = system.currenttimemillis(); int sum = numberlist.stream() .map(number -> number * 2) .maptoint(x -> x) .sum(); long end = system.currenttimemillis(); system.out.println("串行耗时:"+(end - start)+"ms,和是:"+sum); // 并行 - 把一千万个随机数,每个随机数 * 2 ,然后求和 start = system.currenttimemillis(); sum = numberlist.parallelstream() .map(number -> number * 2) .maptoint(x -> x) .sum(); end = system.currenttimemillis(); system.out.println("并行耗时:"+(end - start)+"ms,和是:"+sum); }
得到如下输出。
串行耗时:1005ms,和是:481385106 并行耗时:47ms,和是:481385106
效果显而易见,代码简洁优雅。
5. stream 流建议
5.1 保证正确排版
从上面的使用案例中,可以发现使用 stream 流操作的代码非常简洁,而且可读性更高。但是如果不正确的排版,那么看起来将会很糟糕,比如下面的同样功能的代码例子,多几层操作呢,是不是有些让人头大?
// 不排版 string string = names.stream().filter(num -> num.length() == 4).map(name -> name.touppercase()).collect(collectors.joining(",")); // 排版 string string = names.stream() .filter(num -> num.length() == 4) .map(name -> name.touppercase()) .collect(collectors.joining(","));
5.1 保证函数纯度
如果想要你的 stream 流对于每次的相同操作的结果都是相同的话,那么你必须保证 lambda 表达式的纯度,也就是下面亮点。
- lambda 中不会更改任何元素。
- lambda 中不依赖于任何可能更改的元素。
这两点对于保证函数的幂等非常重要,不然你程序执行结果可能会变得难以预测,就像下面的例子。
@test public void simpletest(){ list<integer> numbers = arrays.aslist(1, 2, 3); int[] factor = new int[] { 2 }; stream<integer> stream = numbers.stream() .map(e -> e * factor[0]); factor[0] = 0; stream.foreach(system.out::println); } // 输出结果 // 0 // 0 // 0
文中代码都已经上传到
个人网站:
如果你喜欢这篇文章,可以关注公众号,一起成长。
关注公众号回复资源可以没有套路的获取全网最火的的 java 核心知识整理&面试资料。