基础互联网科技程序员

Java流库详解(java.util.stream)

2018-05-24  本文已影响422人  thorhill

Java流库(java.util.stream)

流提供了一种让我们可以在比集合更高的概念级别上指定计算的数据视图。通过使用流,我们可以说明想要完成什么任务,而不是说明如何去实现它。(这一点受益于lambda表达式)我们将操作的调度留给具体的实现去解决。

流大量的用到了lambda表达式(同根生于Java8)之后的篇幅将会说到lambda表达式

一、 流的特点

流的特点

  1. 流并不储存元素。这些元素可能存储在底层的集合中,或这是按需生成。
  2. 流的操作不会修改其数据源。例如,filter方法不会从新的流中移除元素,而是会生成一个新的流,其中不包含被过滤掉的元素。
  3. 流的操作是尽可能惰性执行的。这意味着直至需要其结果时,操作才会执行。例如如果我们只想查找前5个长单词(长度大于x的String)而不是所有长单词,那么filter方法就会在匹配到第5个单词后停止过滤。因此,我们甚至可以创建无限流。

典型流程

  1. 创建一个流。
  2. 指定将初始流转换为其他流的中间操作,可能包含多个步骤。
  3. 应用终止操作,从而产生结果。这个操作会强制执行之前的惰性操作。从此之后,这个流就再也不能用了。

二、 流的创建

JavaAPI中有大量方法都可以产生流

API

  1. java.util.Stream<T> 8自身产生流的方法(需要通过现有流对象)

    • Stream<T> filter(Predicate<? super T> p)

      产生一个流,其中包含当前流中满足p的所有元素

      这里的Predicate<? super T> 非常灵性,保证了传入的p对象中的boolean test(T t);方法一定能接受流中的每个元素。因为保证了Predicate<T>中的T是Stream<T>的超类。

    • Long count()

      产生当前流中元素的数量。这是一个终止操作。(严格上不算创建)

      java.util.Collection 1.2default方法

    • default Stream<E> stream()

    • default Stream<E> parallelStream()

      产生当前集合中所有元素的顺序流或者并行流。

  2. java.util.Stream 8的一些静态方法

    • static <T> Stream<T> of(T... values)

      产生一个元素为给定值的流。

    • static <T> Stream<T> empty()

      产生一个不包含任何元素的流。

    • static <T> Stream<T> generate(Supplier<T> s)

      产生一个无限流,它的值是通过反复调用函数s而构建的。

    • static <T> Stream<T> iterate(T seed, UnaryOperator<T> f)

      产生一个无限流,他的元素包含种子、在种子上调用f产生的值、在前一个元素上调用f产生的值,等等。

  3. java.util.Arrays 1.2的静态方法

    • static <T> Stream<T> stream(T[] array, int startInclusive, int endExclusive) 8

      产生一个流,他的元素是由数组中指定范围内的元素构成的。

  4. java.util.regex.Pattern 1.4的静态方法

    • Stream<String> splitAsStream(CharSequence input) 8

      产生一个流,它的元素是输入中由该模式界定的部分。

  5. java.nio.file.Files 7

    • static Stream<String> lines(Path path) 8

    • static Stream<String> lines(Path path, Charset cs) 8

      产生一个流,它的元素是只定文件中的行,该文件的字符集为UTF-8,或者为指定的字符集。

  6. java.util.function.Supplier<T> 8

    • T get()

      提供一个值。

三、 filter、map和flatMap方法

流的转换会产生一个新的流,它的元素派生自另一个流中的元素。

filter:filter转换会产生一个流,它的元素与某种条件相匹配。filter的引元是Predicate<T> ,即从T到boolean的函数。

map:通常,我们想要按照某种方式来转换流中的值,此时,可以使用map方法并传递执行该转换的函数。

flatMap:见名之意,这是map方法的变种,可以将所有结果生成(摊平)在一个流里。即如果是在map方法中返回Stream<Stream<T>>,可以使用flatMap得到结果Stream<T>

APIjava.util.stream.Stream 8

四、 抽取子流和连接流

调用stream.limit(n)会返回一个新的流,它在n个元素之后结束。(如果原来的流更短,那么就会在流结束时结束)。这个方法对于裁剪无限流的尺寸会显得特别有用。

例如:

Stream<Double> stream = Stream.generate(Math::random).limit(100L);
stream.forEach(System.out::println);
调用stream.skip(n)正好相反:它会丢弃前n个元素。

例如:取前200自然数,然后去掉前100个

Stream<Integer> stream = Stream.iterate(1, (n)->n+1);
stream = stream.limit(200).skip(100);
stream.forEach(System.out::println);
我们可以用Stream类的静态方法concat方法将两个流连接起来

例如:

Stream<? extends Object> result = Stream.concat(stream, stream2);
result.forEach(System.out::println);

注意:第一个流不应该是无限的,否则第二个流永远都不会得到处理的机会。

API java.util.stream.Stream 8

五、 其他的流转换

一、 流的去重,distinct方法,它的元素是从原有流中产生的,即原来的元素按照同样的顺序剔除重复元素后产生的。这个流显然能够记住它已经看到的元素

二、 流的排序,有多种sorted方法的变体可用。其中一种用于操作Comparable元素的流,而另一种可以接受一个Comparator。

三、 peek方法,peek方法会产生一个流,它的元素与原来流中的元素相同,但是在每次获取一个元素时,都会调用一个函数(你传入peek的函数Consumer<T>类型)。

API java.util.stream.Stream 8

六、 简单约简(重要)

约简是一种终结操作(terminal operation),它们会将流约简为可以在程序中使用的非流值

API java.util.stream.Stream 8

七、 收集结果

API

  1. java.util.stream.BaseStream 8

    • Iterator<T> oteratpr()

      产生一个获取当前流中的各个元素的迭代器。这是一种终结操作。

  2. java.util.stream.Stream 8

    • void forEach(Consumer<? super T> action)

      在流的每个元素上调用action。这是一种终结操作。

    • Object[] toArray()

    • <A> A[] toArray(IntFunction<A[]> generator)

      产生一个对象数组,或者在将引用A[]::new传递给构造器时,返回一个A类型的数组。这些都是终结操作。

    • <R,A> R collect(Collector<? super T,A,R> collector)

      使用给定的收集器来收集当前流中的元素。Collectors类有用于多种收集齐的工厂方法。例如

      Set<Integer> set = stream.collect(Collectors.toSet());
      TreeSet<Integer> treeSet = stream.collect(Collectors.toCollection(TreeSet::new));
      // 第二种方法可以控制获得的集的种类
      
  3. java.util.stream.Collectors 8

    注:Collectors全部是static方法,建议使用静态导入

    • static <T> Collector<T,?,List<T>> toList()

    • static <T> Collector<T,?,Set<T>> toSet()

      产生一个将元素收集到列表或集中的收集器。

    • static <T,C extends Collection<T>> Collector<T,?,C> toCollection(Supplier<C> collectionFactory)

      产生一个将元素收集到任意集合中早的收集器。可以传递一个诸如TreeSet::new的构造引用。

    • static Collector<CharSequence,?,String> joining()

    • static Collector<CharSequence,?,String> joining(CharSequence delimiter)

    • static Collector<CharSequence,?,String> joining(CharSequence delimiter,CharSequence prefix,CharSequence suffix)

      产生一个连接字符串的收集齐。分隔符会置于字符串之间,而第一个字符串之前可以有前缀,最后一个字符串之后可以有后缀。如果没有指定,那么它们都为空。

    • static <T> Collector<T,?,IntSummaryStatistics> summarizingInt(ToIntFunction<? super T> mapper)

    • static <T> Collector<T,?,LongSummaryStatistics> summarizingInt(ToLongFunction<? super T> mapper)

    • static <T> Collector<T,?,DoubleSummaryStatistics> summarizingInt(ToDoubleFunction<? super T> mapper)

      产生能够生成(Int|Long|Double)SummaryStatistics对象的收集齐,通过它可以获得将mapper应用于每个元素后产生结果的个数、总和、平均值、最大值和最小值。例如:

      Stream<Double> stream = Stream.generate(Math::random).limit(100L);
      
      DoubleSummaryStatistics summary = stream.collect(Collectors.summarizingDouble((D)->D*10));
      summary.getAverage();
      summary.getCount();
      summary.getMax();
      summary.getMin();
      summary.getSum();
      
  4. IntSummaryStatistics 8

    LongSummaryStatistics 8

    DoubleSummaryStatistics 8

    • Long getCount()

      产生汇总后的元素个数。

    • (int|long|double) getSum()

    • double getAverage()

      产生汇总后元素的总和或平均值,或者在没有任何元素时返回0。

    • (int|long|double) getMax()

    • (int|long|double) getMin()

      产生汇总后的元素的最大值和最小值,或者在没有任何元素时,产生(Integer|Long|Double).(MAX|MIN)_VALUE。

八、 收集到映射表中(Map)

API java.util.stream.Collectors 8

九、 群组和分区

API java.util.stream.Collectors 8

十、 下游收集器

Collectors提供了很多强大的功能,其中下游收集器可以让我们轻松(可能吧)地处理下游数据(Map<K,V>中的V)

作为下游收集器,可以直接在groupingBy方法中使用,例如:

Stream<Double> stream = Stream.generate(Math::random).limit(10000L).map((k)->k*10);
Map<Integer, Long> collect = stream.collect(Collectors.groupingBy((k)->{return k.intValue();},Collectors.counting()));
collect.forEach((k,v)->System.out.println("K:"+k+"  V:"+v));

API java.util.stream.Collectors 8

十一、 约简操作

reduce方法是一种用于从流中计算某个值的通用机制,其最简单的形式将接受一个二元函数,并从前两个元素开始持续应用它。

注意:如果收集操作是并行的,reduce就不是线程安全的,小心使用。

API java.util.stream.Stream 8

上一篇下一篇

猜你喜欢

热点阅读