OS内核

Java 多线程详解

2019-11-12  本文已影响0人  小道萧兮

一、线程与进程

在讲多线程之前,我们得先分清楚线程与进程的区别,当然这也是面试中常遇到的问题。

进程是资源(CPU、内存等)分配的基本单位,它是程序执行时的实例。程序运行时系统就会创建一个进程,并为它分配资源,然后把该进程放入进程就绪队列,进程调度器选中它的时候就会为它分配 CPU 时间,程序开始真正运行。

线程是程序执行时的最小单位,它是进程的一个执行流,是 CPU 调度和分派的基本单位,进程由线程组成,线程间共享进程的所有资源,每个线程有自己的堆栈和局部变量。

线程与进程区别:

二、线程的状态

线程不是一丝不变的,它是有状态,一个线程从出生到死亡,可能历经多种状态。

阻塞和等待的区别在于,阻塞是被动的,它是在等待获取一个排它锁。而等待是主动的。

sleep()wait() 的区别:
1、sleep() 是 Thread 的方法,wait() 是 Object 的方法;
2、sleep() 可以在任意地方调用,wait() 必须在同步方法或者同步代码块中调用;
3、sleep() 只会让出 CPU,不会导致锁的改变;
4、wait() 不仅会让出 CPU,还会释放锁。

线程状态转换

三、线程的创建

上面说了线程的基本概念,下面我们来具体实操一下,首先得创建一条线程,有三种使用线程的方法:

  1. 继承 Thread 类。
  2. 实现 Runnable 接口;
  3. 实现 Callable 接口;

1、继承 Thread 类

需要实现 run() 方法,因为 Thread 类也实现了 Runable 接口。

当调用 start() 方法启动一个线程时,虚拟机会将该线程放入就绪队列中等待被调度,当一个线程被调度时会执行该线程的 run() 方法。

public static void main(String[] args) {
      Thread thread = new Thread(){
          @Override
          public void run() {
              System.out.println("do something");
          }
      };
      thread.start();
}

2、实现 Runnable 接口

实现 Runnable 接口中的 run() 方法,通过 Thread 调用 start() 方法来启动线程。

public class MyRunnable implements Runnable {
      public void run() {
          System.out.println("do something");
      }
}
public static void main(String[] args) {
      MyRunnable instance = new MyRunnable();
      Thread thread = new Thread(instance);
      thread.start();
}

3、实现 Callable 接口

与 Runnable 相比,Callable 可以有返回值,返回值通过 FutureTask 进行封装。

public class MyCallable implements Callable<Integer> {
      public Integer call() {
          return 123;
      }
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
      MyCallable mc = new MyCallable();
      FutureTask<Integer> ft = new FutureTask<>(mc);
      Thread thread = new Thread(ft);
      thread.start();
      System.out.println(ft.get()); // 获取返回值
}

四、线程的使用

现在我们已经创建好线程了,该用线程干点活儿了。

假设我们有两条线程,每条线程的任务是给服务器上的金额数据 +1,模拟两个人同时存钱,每条线程各加 100 次,那么结果应该是多少呢?200 吗?

static int count = 0;

public static void main(String[] args) {

    new Thread(new Runnable() { // 创建线程
        public void run() {
            for (int i = 0; i < 100; i++) {
                Thread.sleep(30); // 模拟网络延时,省略了 try catch
                count++; // 金额 +1
            }
        }
    }).start();

    new Thread(new Runnable() { // 创建线程
        public void run() {
            for (int i = 0; i < 100; i++) {
                Thread.sleep(10); // 模拟网络延时,省略了 try catch
                count++; // 金额 +1
            }
        }
    }).start();

    Thread.sleep(4000);
    System.out.println(count);  // 197
}

注意,上述为了让代码看起来简洁,省去了异常处理。

从运行结果来看,在没有加锁的情况下,结果会比预期值 200 小,并且循环次数越多越明显。这是由于自增操作 count++ 不是原子性的,若要解决这个问题,可以使用加锁的方法,关于加锁具体可看《Java 锁机制》这篇文章。

五、线程池

多线程的异步执行方式,虽然能够最大限度发挥多核计算机的计算能力,但是如果不加控制,反而会对系统造成负担。线程本身也要占用内存空间,大量的线程会占用内存资源并且可能会导致 Out of Memory。即便没有这样的情况,大量的线程回收也会给 GC 带来很大的压力。

为了避免重复的创建线程,线程池可以让线程进行复用。通俗点讲,当有工作来,就会向线程池拿一个线程,当工作完成后,并不是直接关闭线程,而是将这个线程归还给线程池供其他任务使用。

先看一下 ThreadPoolExecutor,它是线程池中最核心的类,这里着重说一下这个类的各个构造参数:

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)
线程池任务处理策略

ThreadPoolExecutor 的使用:

public class PollTest {

    private static final int CPU_COUNT = Runtime.getRuntime().availableProcessors();
    private static final int CORE_POOL_SIZE = CPU_COUNT + 1;
    private static final int MAXIMUM_POOL_SIZE = CPU_COUNT * 2;
    private static final BlockingQueue<Runnable> workQueue = new LinkedBlockingQueue<>(20);

    public static void main(String[] args) {

        System.out.println("核心线程数=" + CORE_POOL_SIZE);
        System.out.println("最大线程数=" + MAXIMUM_POOL_SIZE);

        ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(CORE_POOL_SIZE, MAXIMUM_POOL_SIZE, 10, TimeUnit.SECONDS, workQueue, r -> {
            Thread thread = new Thread(r);
            thread.setDaemon(false);
            return thread;
        });

        for (int i = 0; i < 20; i++) {
            Runnable runnable = () -> {
                System.out.println("doing..." + Thread.currentThread().getName());
                Thread.sleep(800);
                System.out.println("执行完毕" + Thread.currentThread().getName());
            };
            threadPoolExecutor.execute(runnable);
        }
    }
}

corePoolSize 的值应该如何设置?这个应该是最重要的参数了,所以如何合理的设置它十分重要。因此我们要清楚的知道执行的任务是 CPU密集型还是 IO密集型

CPU 密集型:也叫计算密集型,特点是要进行大量的计算,消耗 CPU资源,比如计算圆周率、对视频进行高清解码等等,全靠 CPU 的运算能力。任务越多,任务切换花费的时间就越多,CPU 执行任务的效率就越低,所以,要最高效地利用 CPU,计算密集型任务同时进行的数量应当等于 CPU 的核心数。

IO 密集型:涉及网络、磁盘 IO 的任务都是 IO 密集型任务,这类任务的特点是 CPU 消耗少,任务的大部分时间都在等待 IO 操作完成(因为 IO 的速度远远低于 CPU 和内存的速度)。对于 IO 密集型任务,任务越多,CPU 效率越高,但也有一个限度。

所以,建议
CPU密集型:corePoolSize = CPU核数 + 1
IO密集型:corePoolSize = CPU核数 * 2
当然这不是绝对的,可以根据实际情况进行调整。

五、几种常见的线程池

1、newFixedThreadPool (固定数量线程池)

public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
}

corePoolSize = maximumPoolSize = 初始化的参数

workQueue:使用无界队列 LinkedBlockingQueue 链表阻塞队列。

keepAliveTime = 0,由于使用无界队列 LinkedBlockingQueue 作为缓存队列,所以当 corePoolSize 满后,后面添加的线程任务都会添加到 LinkedBlockingQueue 中去,所以 maximumPoolSize 就失去了意义,这样也就没有必要设置空闲时间。

public static void main(String[] args) {
        ExecutorService executorService = Executors.newFixedThreadPool(5);
        for (int i = 0; i < 10; i++) {
            executorService.execute(new Runnable() {
                @Override
                public void run() {
                    System.out.println(Thread.currentThread());
                }
            });
        }
        executorService.shutdown();
}

2、newSingleThreadExecutor (单例线程池)

public static ExecutorService newSingleThreadExecutor() {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>()));
}

corePoolSize = maximumPoolSize =1 由于是单例线程池,所以线程池中是有一个重用的线程

workQueue:使用无界队列LinkedBlockingQueue链表阻塞队列

3、newCachedThreadPool (缓存线程池)

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
}

corePoolSize = 0 表示线程池中没有核心线程,都是非核心线程

maximumPoolSize = Integer.最大值

keepAliveTime:60秒,线程池中创建的线程都是非核心线程,所以设置空闲时间 60 秒,当非核心线程60秒后没有被重用,将会被销毁,如果没有线程提交给该线程池,超过空闲时间,该线程池就没有非空闲线程,那么该线程池也就不会消耗过多的资源。

workQueue = SynchronousQueue 是一个不存储元素的阻塞队列。每一个put操作必须等待一个take操作,否则不能继续添加元素。

4、newScheduledThreadPool (定时线程池)

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
        return new ScheduledThreadPoolExecutor(corePoolSize);
}
public ScheduledThreadPoolExecutor(int corePoolSize) {
        super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
              new DelayedWorkQueue());
}

定时线程池,该线程池可用于周期性地去执行任务,通常用于周期性的同步数据。

scheduleAtFixedRate:是以固定的频率去执行任务,周期是指每次执行任务成功执行之间的间隔。

schedultWithFixedDelay:是以固定的延时去执行任务,延时是指上一次执行成功之后和下一次开始执行的之前的时间。

上一篇 下一篇

猜你喜欢

热点阅读