Java 杂谈程序员多线程专家

(203)线程池原理

2018-10-08  本文已影响4人  林湾村龙猫

程序运行,其本质上,是对系统资源(CPU、内存、磁盘、网络等等)的使用。如何高效的使用这些资源是我们编程优化演进的一个方向。今天说的线程池是对CPU的利用的优化手段。

网上有不少介绍如何使用线程池的文章,那我想说点什么呢?我希望查看线程池原理,明白池化技术的基本设计思路。遇到其他相似问题可以解决。

池化技术

何为池化技术,简单点来说,就是提前保存大量的资源,以备不时之需。在资源有限的情况下,该技术可以大大提升资源的利用率,提升性能等。

目前比较典型的池化技术有:
线程池、连接池、内存池、对象池等。

本文主要来介绍一下其中比较简单的线程池的实现原理,希望读者们可以举一反三,通过对线程池的理解,学习并掌握所有的编程中池化技术的底层原理,一通百通。

创建一个线程

在java的并发编程中,线程是十分重要的,在Java中,创建一个线程比较简单:

public class App {
    public static void main(String[] args) throws Exception {
        new Thread(new Runnable() {
            @Override
            public void run() {
                System.out.println("线程运行中");
            }
        }).start();
    }
}

我们通过创建一个线程对象,并且实现Runnable接口就可以实现一个简单的线程。可以利用上多核CPU。当一个任务结束,当前线程就结束。

但很多时候,我们不止会执行一个任务。如果每次都是如此的创建线程->执行任务->销毁线程,会造成很大的性能开销的。

那能否一个线程创建后,执行完一个任务后,又去执行另一个任务,而不是销毁。这就是线程池。

这就是池化技术的思想,通过预先创建好多个线程,放在池中,这样可以在需要使用线程的时候直接获取,避免多次重复创建、销毁代理的开销。

线程池的简单使用

以下代码,就是在java中创建线程池:

import java.util.concurrent.*;

public class App {
    public static void main(String[] args) throws Exception {
        ExecutorService executorService = new ThreadPoolExecutor(1, 1,
                60L, TimeUnit.SECONDS,
                new ArrayBlockingQueue<>(10));

        executorService.execute(new Runnable() {
            @Override
            public void run() {
                System.out.println("abcdefg");
            }
        });

        executorService.shutdown();
    }
}

JDK提供给外部的接口也很简单。直接调用ThreadPoolExecutor构造一个就可以了,也可以通过Executors静态工厂构建,但一般不建议。

可以看到,开发者想要在代码中使用线程池还是比较简单的,这得益于Java给我们封装好了一系列的API。很多时候,我们需要知道这些API后面干了些啥,以便于我们更好的设计与实现我们的代码。

线程池构造函数

通常,一般构造函数会反映出这个工具或这个对象的数据存储结构。


构造函数

如果把线程池比作一个公司。公司会有正式员工处理正常业务,如果工作量大的话,会雇佣外包人员来工作。闲时就可以释放外包人员以减少公司管理开销。一个公司因为成本关系,雇佣的人员始终是有最大数。如果这时候还有任务处理不过来,就走需求池排任务。

添加一个任务

源码

核心模块用红框标记了。

这里逻辑稍微有点复杂,画了个流程图仅供参考


添加任务流程.png

接下来,我们看看如何添加一个工作线程的? addWork

添加worker线程

添加work1

这里代码有点长,没关系,也是分块的,总共有5个关键的代码块。

有人或许会疑问 retry 是什么?这个是java中的goto语法。只能运用在break和continue后面。

接下来,我们看看works是什么。


works

一个hashSet。
到这来就完成了一个任务的提交。当一个线程完成了首次任务的执行,后续如何处理其他的请求的呢?

worker线程处理队列任务

任务的执行

这两个钩子(beforeExecute,afterExecute)允许我们自己继承线程池,做任务执行前后处理。有意思。
到这里,源代码分析到此为止。接下来做一下简单的总结。

总结

  1. 所谓线程池本质是一个hashSet。多余的任务会放在阻塞队列中。
  2. 只有当阻塞队列满了后,才会触发非核心线程的创建。所以非核心线程只是临时过来打杂的。直到空闲了,然后自己关闭了。
  3. 线程池提供了两个钩子(beforeExecute,afterExecute)给我们,我们继承线程池,在执行任务前后做一些事情。
  4. 线程池原理关键技术:锁(lock,cas)、阻塞队列、hashSet(资源池)
线程池原理.png

最后希望对你理解线程池有帮助。

都看到这里了,成神之路上,要不要一起?

微信公众号rudy_tan_home
上一篇下一篇

猜你喜欢

热点阅读