StreamAPI的并行
2019-08-04 本文已影响24人
椰子奶糖
- 由于上次对于并行流与串行流的学习忘记记录,于是这篇补上
- 上一篇:https://www.jianshu.com/p/53fee8f9fb9f
并行流与串行流
- 并行流就是把一个内容分成多个数据块,并用不同的线程分 别处理每个数据块的流。
- Java 8 中将并行进行了优化,我们可以很容易的对数据进行行操作。Stream API 可以声明性地通过 parallel() 与 sequential() 在并行流与顺序流之间进行切换。
Fork/Join
- Fork/Join 框架:就是在必要的情况下,将一个大任务,进行拆分(fork)成若干个 小任务(拆到不可再拆时),再将一个个的小任务运算的结果进行 join 汇总.

Fork/Join 框架与传统线程池的区别
- 采用 “工作窃取”模式(work-stealing): 当执行新的任务时它可以将其拆分分成更小的任务执行,并将小任务加到线 程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。 相对于一般的线程池实现,fork/join框架的优势体现在对其中包含的任务的 处理方式上.在一般的线程池中,如果一个线程正在执行的任务由于某些原因 无法继续运行,那么该线程会处于等待状态.而在fork/join框架实现中,如果 某个子问题由于等待另外一个子问题的完成而无法继续运行.那么处理该子 问题的线程会主动寻找其他尚未运行的子问题来执行.这种方式减少了线程 的等待时间,提高了性能.

以加法为例:
import java.util.concurrent.RecursiveTask;
//继承RecursiveTask
public class ForkJoinCalculate extends RecursiveTask<Long>{
/**
*
*/
private static final long serialVersionUID = 1L;
private long start;
private long end;
//任务大小的临界值
private static final long THRESHOLD = 10000L;
public ForkJoinCalculate(long start, long end) {
this.start = start;
this.end = end;
}
@Override
protected Long compute() {
long length = end - start;
//如果任务大小小于这个临界值则开始计算
if(length <= THRESHOLD){
long sum = 0;
for (long i = start; i <= end; i++) {
sum += i;
}
return sum;
}else{
//如果大于临界值则继续递归拆分,这里采用对半分
long middle = (start + end) / 2;
//拆分,并将该子任务压入线程队列
ForkJoinCalculate left = new ForkJoinCalculate(start, middle);
left.fork();
ForkJoinCalculate right = new ForkJoinCalculate(middle+1, end);
right.fork();
//将左右结果相加并返回,合成总结果
return left.join() + right.join();
}
}
}
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.ForkJoinTask;
import java.util.stream.LongStream;
import org.junit.Test;
public class TestForkJoin {
@Test
public void test1(){
long start = System.currentTimeMillis();
ForkJoinPool pool = new ForkJoinPool();
ForkJoinTask<Long> task = new ForkJoinCalculate(0L, 100000000000L);
long sum = pool.invoke(task);
System.out.println(sum);
long end = System.currentTimeMillis();
System.out.println("耗费的时间为: " + (end - start)); //20464
}
@Test
public void test2(){
long start = System.currentTimeMillis();
long sum = 0L;
for (long i = 0L; i <= 100000000000L; i++) {
sum += i;
}
System.out.println(sum);
long end = System.currentTimeMillis();
System.out.println("耗费的时间为: " + (end - start)); //31006
}
}
- 这两个个方法中都标了消耗的时间,可以看到,在数据规模足够大的情况下ForkJoin相对于有一定的优势,
StreamAPI中的多线程parallel()
@Test
public void test3(){
long start = System.currentTimeMillis();
Long sum = LongStream.rangeClosed(0L, 100000000000L)
.parallel()
.sum();
System.out.println(sum);
long end = System.currentTimeMillis();
System.out.println("耗费的时间为: " + (end - start)); //12725
}
这段代码给我的第一感觉其实不是消耗时间只有12S,它对于单线程与多线程的切换只需要一行代码,至于效率,猜想是底层实现比较完善,并不一定说效率一定比ForkJoin来得高。