工作三年,小胖问我线程池是什么?真的离谱!

2021-03-11  本文已影响0人  JavaFish

线程池

欢迎来到狗哥多线程系列连载。本篇是线程相关的第六篇,前五篇分别是:

创建线程到底有几种方式?
线程有多少种状态?Runnable 一定在执行任务吗?
万字长文,Thread 类源码解析!
wait、notify/notifyAll 解析
线程之生产者消费者模式

什么是线程池?

线程池是一种池化技术,简单来说就是一个管理线程的池子。这个池子里面的线程数是固定的,当任务数量大于线程数量时,会对线程进行复用。一个线程执行完任务,就回到这等待下一个任务的招唤,也不要你销毁。类似的还有我们工作常接触的数据库连接池。java 中的线程池主要是 juc (java.util.concurrent)包来复制,主要是由 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 类来实现,后者在前者的基础上增加了定时执行的功能。

为什么使用线程池?

那为什么要使用线程池呢?手动创建不香吗?真的不香,手动创建的情景仅仅适合很少任务量的情况。比如:只有一个任务,这问题不大。

public class OneTask {

    public static void main(String[] args) {
        Thread thread0 = new Thread(new Task());
        thread0.start();
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }
    }
    
}

那如果我就是有 10000 个任务呢?要这样写吗?

public class OneTask {

    public static void main(String[] args) {
        for (int i = 0; i < 10000; i++) {
            Thread thread0 = new Thread(new Task());
            thread0.start();
        }
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }
    }

}

运行结果:

Thread Name: Thread-9977
Thread Name: Thread-9975
Thread Name: Thread-9973
Thread Name: Thread-9951
Thread Name: Thread-9999

Excuse me? 创建 10000 个线程?疯了吧?java 是一门高级语言,很多底层的工作对我们来说都是黑盒,比如垃圾自动回收。每一个线程从创建到销毁都要占用资源,用完需要回收的

10000 个线程造成的垃圾回收开销得有多大呀,如果还是需要耗费一定时间的任务呢?要是我的线程任务很简单就是打印个日志,使用线程的内存开销比任务执行本身的开销还要大,这时就会得不偿失。

简而言之,频繁创建线程带来两点很不友好的问题:

但我的任务确实多,咋办?这个时候线程池就出现了,它的出现解决了以上两点问题。

首先,针对反复创建线程开销大的问题,线程池用固定数量的线程保持工作状态并复用

其次,针对过多线程占用太多内存资源的问题,线程池根据需要创建线程,控制线程的总数量,避免占用过多内存资源

java 的线程池

线程池嘛,就是个池子。这里面的线程是固定的且可控的,java 提供了 Executor 接口方便我们实现线程池,它的继承关系是这样的:

Executor.png

其中 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 是实现线程池的两个类,区别上文说过了。

另外,还有个 JDK1.7 才出现的线程池:ForkJoinPool,它适合执行可产生子任务的任务,第一步是拆分也就是 Fork,第二步是汇总也就是 Join。继承关系是这样的(后面再单独出一期专门研究这个线程池)。

ForkJoinPool.png

线程池的执行流程

图源:拉勾教育-Java并发编程.png

1、首先提交任务,检查核心线程池是否已满?满了丢进队列。未满则创建线程执行任务。
2、队列是否已满?满了检查整个线程池是否已满?未满则是添加到队列中排队等待。
3、整个线程池都没可用线程了,直接根据拒绝策略处理新任务。

线程池的参数

找到 ThreadPoolExecutor 的构造方法:

public ThreadPoolExecutor(int corePoolSize,
    int maximumPoolSize,
    long keepAliveTime,
    TimeUnit unit,
    BlockingQueue < Runnable > workQueue,
    ThreadFactory threadFactory,
    RejectedExecutionHandler handler) {}

它一共有如下7 个参数:

图源:拉勾教育-Java并发编程

ThreadPoolExecutor 构造传入这 7 个参数,就可以创建一个线程池了,下面逐一解释:

1、corePoolSize 是核心线程数,就是指定线程池有多少始终活跃的线程,这个是根据业务需求定的,线程池执行过程的第一步就是检查核心线程数是不是都已经满了。

2、maximumPoolSize 是整个线程池的最大线程数,超出核心线程的部分有空闲,是可以进行回收的。所以正常情况下,线程池中的线程数量会处在 corePoolSize 与 maximumPoolSize 的闭区间内。

二者区别

maximumPoolSize 包含 corePoolSize 和 maximumPoolSize减corePoolSize。他两就像长工和临时工的区别。打个比方外包公司接到大项目,需要 100 个程序员才能搞定,可公司内部就只有 10 个猿。咋办?招 90 个临时的呗,干完活就开掉。原有的 10 个就是长工对应 corePoolSize ,即使没这项目他在公司还有活干。而剩下就 90 个就是临时的,对应 maximumPoolSize - corePoolSize,做完项目就不需要了。残酷吧?

所以,maximumPoolSize = corePoolSize + 临时工

3、keepAliveTime + 时间单位用于定义核心线程以外的线程(临时工,如果有的话)的存活时间,也就是说,这是定义临时工能活多久的参数。

4、ThreadFactory 是线程工厂,用于创建线程。有默认的,也可自定义实现。

5、workQueue 是阻塞队列,也就是暂时存任务的地方。

6、Handler 是拒绝策略,后面专门有一篇文章来探讨。

了解了这 7 个参数,现在我们设定 corePoolSize = 5,maximumPoolSize = 10,阻塞队列长度 = 100。再来看一个动图,你对上面的流程图的理解会更深

图源:拉勾教育 Java 并发编程

有哪 6 种线程池,如何使用?

除了自定义,良心的 java 给我们实现了 3 类,6 个线程池,分别是:

由 ThreadPoolExecutor 创建

由 ScheduledThreadPoolExecutor 创建

JDk 1.7 出现

FixedThreadPool(固定数目的线程池)

public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
}

线程数量固定,比较适用于耗时较长的任务。避免频繁回收和分配线程

执行过程:线程池有 t0 ~ t9 十个线程,他们不断执行任务,期间任务不会减少不会增加,因为核心线程数 = 最大线程数

FixedThreadPool 图源:拉勾教育 Java 并发编程

用法:用它生成 10 个线程,来执行 10000 个任务:

public class MyThreadPoolTest {

    public static void main(String[] args) {
        ExecutorService executorService = Executors.newFixedThreadPool(10);
        for (int i = 0; i < 10000; i++) {
            executorService.execute(new Thread(new Task()));
        }
        executorService.shutdown();
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }

    }
}

执行结果:可以看到来来去去都是 1~10 这几个线程在跑任务,并没有编号为 11 的线程。

Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-2
Thread Name: pool-1-thread-6
Thread Name: pool-1-thread-8
Thread Name: pool-1-thread-7
Thread Name: pool-1-thread-7
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-2
Thread Name: pool-1-thread-6
Thread Name: pool-1-thread-10
Thread Name: pool-1-thread-3

CachedThreadPool(可缓存线程的线程池)

上源码:

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }

适用于耗时较短的任务、任务处理速度 > 任务提交速度。就不会造成不断创建新线程

用法:用它提交 10000 个任务,并执行。

public class MyThreadPoolTest {

    public static void main(String[] args) {
        ExecutorService executorService = Executors.newCachedThreadPool();
        for (int i = 0; i < 10000; i++) {
            executorService.execute(new Thread(new Task()));
        }
        executorService.shutdown();
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }

    }
}

执行结果:只要有任务提交就新建线程执行

Thread Name: pool-1-thread-826
Thread Name: pool-1-thread-827
Thread Name: pool-1-thread-233
Thread Name: pool-1-thread-303
Thread Name: pool-1-thread-321
Thread Name: pool-1-thread-833
Thread Name: pool-1-thread-825
Thread Name: pool-1-thread-832
Thread Name: pool-1-thread-69
Thread Name: pool-1-thread-18
Thread Name: pool-1-thread-830
Thread Name: pool-1-thread-829

SingleThreadExecutor(单线程的线程池)

源码:

public static ExecutorService newSingleThreadExecutor() {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>()));
    }

这货有啥使用场景?还真有,比如:用于所有任务都需要按被提交的顺序依次执行的场景

用法:

public class MyThreadPoolTest {

    public static void main(String[] args) {
        ExecutorService executorService = Executors.newSingleThreadExecutor();
        for (int i = 0; i < 10000; i++) {
            executorService.execute(new Thread(new Task()));
        }
        executorService.shutdown();
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }

    }
}

结果:

Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
···

ScheduledThreadPool(定时或周期的线程池)

源码:

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
    return new ScheduledThreadPoolExecutor(corePoolSize);
}

public ScheduledThreadPoolExecutor(int corePoolSize) {
    super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS, new DelayedWorkQueue());
}

适用场景:定时或周期性执行任务,它有三个重要的方法:

ScheduledExecutorService service = Executors.newScheduledThreadPool(10);

// 延迟指定时间后执行一次任务(这里是 10s 后执行完任务,结束)
service.schedule(new Task(), 10, TimeUnit.SECONDS);

// 以固定的频率执行任务(表示第一次延时后每次延时多长时间执行一次),第二个参数是第一次延迟的时间,第三个参数是周期
service.scheduleAtFixedRate(new Task(), 10, 10, TimeUnit.SECONDS);

// 类似于第二个,区别在于周期的定义。第二个方法的周期是以任务开始时间为起始时间计时,而这个是以任务结束的时间为起始时间
service.scheduleWithFixedDelay(new Task(), 10, 10, TimeUnit.SECONDS);

用法:

public class MyThreadPoolTest {

    public static void main(String[] args) {
        ScheduledExecutorService executorService = Executors.newScheduledThreadPool(10);
        for (int i = 0; i < 10000; i++) {
            executorService.schedule(new Thread(new Task()), 10, TimeUnit.SECONDS);
        }
        executorService.shutdown();
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }

    }
}

SingleThreadScheduledExecutor(定时或周期的单线程线程池)

源码:

public static ScheduledExecutorService newSingleThreadScheduledExecutor() {
    return new DelegatedScheduledExecutorService
            (new ScheduledThreadPoolExecutor(1));
}

public ScheduledThreadPoolExecutor(int corePoolSize) {
    super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
              new DelayedWorkQueue());
}

SingleThreadScheduledExecutor 只有一个线程且支持定时、周期功能。很明显是 ScheduledThreadPool 和 SingleThreadExecutor 的结合体。适用于对执行顺序有要求,且需要定时或周期执行的任务

用法:

public class MyThreadPoolTest {

    public static void main(String[] args) {
        ScheduledExecutorService executorService = Executors.newSingleThreadScheduledExecutor();
        for (int i = 0; i < 10000; i++) {
            executorService.schedule(new Thread(new Task()), 10, TimeUnit.SECONDS);
        }
        executorService.shutdown();
    }

    static class Task implements Runnable {

        public void run() {
            System.out.println("Thread Name: " + Thread.currentThread().getName());
        }

    }
}

巨人的肩膀

总结

本文聊了聊线程池是什么?为什么?怎么用?以及分析了线程池的执行过程,各参数含义、Java 各线程池的使用以及使用场景。相信你看完会有所收获,当然,由于篇幅原因,阻塞队列、拒绝策略等参数后面再发文探讨。另外,如文章有错,请友善指正,感激不尽。

小福利

如果看到这里,喜欢这篇文章的话,请帮点个好看。微信搜索一个优秀的废人,关注后回复电子书送你 100+ 本编程电子书 ,不只 Java 哦,详情看下图。回复 1024送你一套完整的 java 视频教程。

资源 C语言 C++ Java Git Python GO Linux 经典必读 面试相关 前端 人工智能 设计模式 数据库 数据结构与算法 计算机基础
上一篇下一篇

猜你喜欢

热点阅读