Java 并发、多线程、锁
JMM(Java 内存模型)
主内存与工作内存
JMM规定JVM有主内存(Main Memory)和工作内存(Working Memory),主内存其实就是我们平常所说的Java堆内存,存放所有类实例变量等,这部分内存是多个线程共享的;工作内存里存放的则是线程从主内存拷贝过来的变量以及访问方法得到的临时变量,这部分内存为线程私有,其他的线程不能访问。
注:上面所说的拷贝并不是拷贝整个对象实例到工作内存,虚拟机可能拷贝对象引用或者对象字段,而不是整个对象。
主内存与工作内存间的交互操作
主内存与工作内存之间具体的交互协议,被定义了以下8种操作来完成,虚拟机实现时必须保证每一种操作都是原子的、不可再分的。
1. lock,锁定,所用于主内存变量,它把一个变量标识为一条线程独占的状态。
2. unlock,解锁,解锁后的变量才能被其他线程锁定。
3. read,读取,所用于主内存变量,它把一个主内存变量的值,读取到工作内存中。
4. load,载入,所用于工作内存变量,它把read读取的值,放到工作内存的变量副本中。load,载入,所用于工作内存变量,它把read读取的值,放到工作内存的变量副本中。
5. use,使用,作用于工作内存变量,它把工作内存变量的值传递给执行引擎,当JVM遇到一个变量读取指令就会执行这个操作。use,使用,作用于工作内存变量,它把工作内存变量的值传递给执行引擎,当JVM遇到一个变量读取指令就会执行这个操作。
6. assign,赋值,作用于工作内存变量,它把一个从执行引擎接收到的值赋值给工作内存变量。assign,赋值,作用于工作内存变量,它把一个从执行引擎接收到的值赋值给工作内存变量。
7. store,存储,作用域工作内存变量,它把工作内存变量值传送到主内存中。store,存储,作用域工作内存变量,它把工作内存变量值传送到主内存中。
8. write,写入,作用于主内存变量,它把store从工作内存中得到的变量值写入到主内存变量中。write,写入,作用于主内存变量,它把store从工作内存中得到的变量值写入到主内存变量中。
8种操作的实现规则:
- 不允许read和load、store和write操作之一单独出现,即不允许加载或同步工作到一半。
- 不允许一个线程丢弃它最近的assign操作,即变量在工作内存中改变了之后,必须吧改变化同步回主内存。 不允许一个线程丢弃它最近的assign操作,即变量在工作内存中改变了之后,必须吧改变化同步回主内存。
- 不允许一个线程无原因地(无assign操作)把数据从工作内存同步到主内存中。 一个新的变量只能在主内存中诞生。
- 不允许一个线程无原因地(无assign操作)把数据从工作内存同步到主内存中。 一个新的变量只能在主内存中诞生。不允许一个线程无原因地(无assign操作)把数据从工作内存同步到主内存中。 一个新的变量只能在主内存中诞生。
- 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,,多次lock之后必须要执行相同次数的unlock操作,变量才会解锁。一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,,多次lock之后必须要执行相同次数的unlock操作,变量才会解锁。
- 如果对一个对象进行lock操作,那会清空工作内存变量中的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。如果对一个对象进行lock操作,那会清空工作内存变量中的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
- 如果一个变量事先没有被lock,就不允许对它进行unlock操作,也不允许去unlock一个被其他线程锁住的变量。如果一个变量事先没有被lock,就不允许对它进行unlock操作,也不允许去unlock一个被其他线程锁住的变量。
- 对一个变量执行unlock操作之前,必须将此变量同步回主内存中(执行store、write)。 对一个变量执行unlock操作之前,必须将此变量同步回主内存中(执行store、write)。
并发编程中的根本问题以及JMM提供的解决方案
整个并发编程所遇到的问题可以说是以下三个问题的变种。
原子性问题
由Java内存模型提供的8个原子性操作所支持,Long和Double的读写大部分商业虚拟机上已实现为原子性操作,更大范围的原子性操作,Java内存模型还提供了lock和unlock操作来支持,在字节码层次提供了monitorenter和monitorexit来隐式的使用这两个操作,反映到java代码中就是同步代码块了 synchronize。
可见性问题
由上图主内存与工作内存的关系图可知,线程不与主内存进行直接交互,而是把主内存的实例变量拷贝一份到线程的工作内存中进行操作,然后再同步给主内存。之所以这样做,是因为工作内存大都由高速缓存、寄存器这类比主内存存取速度更快的内存担当,以便弥补CPU速度与主内存存取速度不在一个数量级的差距。
注:当线程操作某个对象时,执行顺序如下:
- 从主存复制变量到当前工作内存(read -> load)
- 执行代码改变共享变量的值(use -> assign)
- 用工作内存的数据刷新主存相关内容(store -> write) 所以单个线程与线程的工作内存之间就有了相互的隔离效果,专业术语称之为“可见性问题”
可见性是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改,可见性由volatile支持,除了volatile以外,synchronize和final关键字,synchronize的可见性是由”对一个变量执行unlock操作之前,必须先把此变量同步回主内存中“这条规则保证的,而final关键字是指当final修饰的字段在构造函数中一旦初始化完成,并且构造器没有把this的引用传递出去,那在其他线程中就能看见final字段的值,无须同步就能被其他线程正确访问
时序性问题
线程在引用变量时不能直接从主内存引用,如果工作内存中内有该变量,则会从主内存拷贝一个副本到工作内 存中,即read -> load ,完成后线程会引用该副本。当同一个线程再度引用该字段时,有可能重新从主内存获取变量副本(read -> load -> use),也有可能直接引用原来的副本(use),也就是说read、load、use 顺序可以有JVM实现系统决定。这个时候线程与线程之间操作的先后顺序,就会决定你程序对主内存最后的修改是不是正确的,专业术语称之为“时序性问题”。
Java提供了volatile和synchronize两个关键字来保证线程之间操作的有序性,synchronize是由“一个变量在同一时刻只允许一条线成对其进行lock操作”。
HP(happens-before)
在JMM中,如果一个操作执行的结果需要对另一个操作可见,那么这两个操作之间必须要存在happens-before关
系。这里提到的两个操作既可以是在一个线程之内,也可以是在不同线程之间。
与程序员密切相关的happens-before规则如下。
程序顺序规则:一个线程中的每个操作,happens-before于该线程中的任意后续操作。
监视器锁规则:对一个锁的解锁,happens-before于随后对这个锁的加锁。
volatile变量规则:对一个volatile域的写,happens-before于任意后续对这个volatile域的读。
传递性:如果A happens-before B,且B happens-before C,那么A happens-before C。
start()规则:如果线程A执行操作ThreadB.start()(启动线程B),那么A线程的ThreadB.start()操作happens-before于线程B中的任意操作。
join()规则:如果线程A执行操作ThreadB.join()并成功返回,那么线程B中的任意操作happens-before于线程A从ThreadB.join()操作成功返回。
注意
两个操作之间具有happens-before关系,并不意味着前一个操作必须要在后一个操作之前执行!happens-before仅仅要求前一个操作(执行的结果)对后一个操作可见,且前一个操作按顺序排在第二个操作之前(the
first is visible to and ordered before the second).