《Java 8实战》笔记

【Java 8实战笔记】引入流

2017-10-05  本文已影响90人  谢随安

引入流

集合是Java中使用最多的API。几乎每个Java应用程序都会制造和处理集合。但集合的操作却远远算不上完美。

流是Java API,它允许你以声明性方式处理数据集合。此外流还可以透明性地并行处理,无需写任何多线程代码。

下面是一个Java 7实现的 返回低热量的菜肴名称并按照卡路里排序:

List<Dish> lowCaloricDishes = new ArrayList<>();
for(Dish d: dishes){
    if(d.getCalories() < 400){
        lowCaloricDishes.add(d);
    }
}
Collections.sort(lowCaloricDishes, new Comparator<Dish>() {
    public int compare(Dish d1, Dish d2){
        return Integer.compare(d1.getCalories(), d2.getCalories());
    }
});
List<String> lowCaloricDishesName = new ArrayList<>();
for(Dish d: lowCaloricDishes){
    lowCaloricDishesName.add(d.getName());
}

变量lowCaloricDishes唯一的作用就是作为一次性的中间容器。

下面是Java 8实现:

import static java.util.Comparator.comparing;
import static java.util.stream.Collectors.toList;
List<String> lowCaloricDishesName = 
    menu.stream()
        .filter(d -> d.getCalories() < 400)
        .sorted(comparing(Dish::getCalories))
        .map(Dish::getName)
        .collect(toList());

为了利用多核架构并行执行这段代码,只需要把 stream() 换成 parallelStream()

import static java.util.Comparator.comparing;
import static java.util.stream.Collectors.toList;
List<String> lowCaloricDishesName = 
    menu.parallelStream()
        .filter(d -> d.getCalories() < 400)
        .sorted(comparing(Dish::getCalories))
        .map(Dish::getName)
        .collect(toList());

使用新的方法 有几个显而易见的好处:

使用Java 8 的Stream API的优点:

流简介

流是什么?简短的定义就是“从支持数据处理操作的源 生成的 元素序列”。

此外,流操作有两个重要的特点:

例如:

import static java.util.stream.Collectors.toList;
List<String> threeHighCaloricDishesName = 
    menu.stream()
        .filter(d -> d.getCalories() > 300)
        .map(Dish::getName)
        .limit(3)
        .collect(toList());
    System.out.println(threeHighCaloricDishNames);

在上面示例代码中,先是对menu调用stream方法,由菜单得到一个流。数据源是menu,它给流提供一个元素序列。接下来,对流应用一系列数据处理操作:filter、map、limit和collect。除了collect之外,所有这些操作都会返回一个流,这样就可以连接成一条流水线。最后,collect操作开始处理流水线,并返回结果(它和别的操作不一样,因为它返回的是一个List)。

在调用collect之前,没有任何结果产生,实际上根本就没有从menu里选择元素,可以理解为:链中的方法调用都在排队等待,直到调用collect。

这样做的好处在于,你并没有去实现筛选、提取或截断功能,Stream库已经自带了。

流与集合

粗略的说,集合与流之间的差异就在于什么时候进行计算。集合是一个内存中的数据结构,它包含数据结构中目前所有的值,集合中每个元素都得算出来来才能添加到集合中(不管往集合里加东西或者删东西,集合中的每个元素都是放在内存里的,元素都得先算出来才能成为集合的一部分)。
流则是概念上固定的数据结构,其元素是按需计算的。从另一个角度来说,流就像是一个延迟创建的集合:只有在消费者要求的时候才会计算值。而集合则是急切创建的。

只能遍历一次

和迭代器类似,流只能遍历一次。遍历完以后,这个流就已经被消费掉了。可以从原始数据源那里再获得一个新的流来重新遍历一遍。

以下代码会抛出一个异常,提示流已被消费掉了:

List<String> title = Arrays.asList("Java8","In","Action");
Stream<String> s = title.stream();
s.forEach(System.out::println);
s.forEach(System.out::println);
外部迭代和内部迭代

集合和流的另一个关键区别在于它们遍历数据的方式。

使用Collection接口需要用户去做迭代(比如用for-each),这称为外部迭代。而Stream库使用内部迭代 ----- 它帮你把迭代做了,还把得到的流值存在了某个地方,只要给出一个函数说要干什么就可以了。

用for-each循环外部迭代:

List<String> names = new ArrayList<>();
for(Dish d: menu){
    names.add(d.getName());
}

用背后的迭代器做外部迭代:

List<String> names = new ArrayList<>();
Iterator<String> iterator =menu.iterator();
while(iterator.hasNext()) {
    Dish d = iterator.next();
    names.add(d.getName());
}

流:内部迭代:

List <String> names = menu.stream()
           .map(Dish::getName)
           .collect(toList());

流操作

java.util.stream.Stream中的stream接口定义了许多操作。它们可以被分为两大类:中间操作终端操作。可以被连接起来的流操作称为中间操作,关闭流的操作称为终端操作

中间操作

中间操作会返回另一个流。这让多个操作可以连接起来形成一个查询。更重要的是,除非流水线上触发一个终端操作,否则中间操作不会执行任何处理。中间操作会合并起来在终端操作时一次性全部处理。

终端操作

终端操作会从流的流水线生成结果。其结果可以是任何不是流的值。

使用流

流的使用一般包括三件事:

流的流水线背后的理念类似于构建器模式。在构建器模式中有一个调用链用来设置一套配置(流的中间操作链),接着是调用built方法(流的终端操作)。

上一篇下一篇

猜你喜欢

热点阅读