Java并发之二:JVM视角下的volatile
了解volatile语义对了解多线程的其他特性很有意义,所以把它放在前面讨论。
volatile是JVM提供的最轻量级的同步机制。volatile提供单个field的内存同步控制,synchronized则提供整个临界区(代码块/方法)的同步控制。
2个基本特性
当一个变量定义为volatile之后,它将具备两种特性,第一是确保了此变量对所有线程的(实时)可见性¹。普通变量做不到这一点,普通变量的值在线程间传递是异步的,需要通过主内存来完成,例如,线程A修改一个普通变量值,然后向主内存进行回写,另外一条线程B在线程A回写完成之后再从主内存进行读取操作,新变量值才会对线程B可见。虽然volatile变量在各个线程的工作内存中不存在一致性问题,但是Java里的运算并非全是原子操作,例如复合操作int++,导致volatile变量的运算在并发下一样是不安全的。
《深入理解Java虚拟机》p366 中举了一个例子:代码发起20个新线程,每个线程对volatile变量(race,初始值=0)进行10000次自增,如果代码能正确并发的话,正确结果应该是200000,但实际并非如此,误差极大(15W+ ~ 18W+)。问题出在race++自增运算中。当指令把race值取到操作栈顶时,volatile关键字保证了race的值在此时是正确的,但是在执行iconst_1,iadd这些指令时,其他线程可能已经把race的值加大了,而在操作栈顶的值就变成了过期的数据,所以putstatic指令执行后就可能把较小的race值同步回主内存之中。即使编译出来的只有一条字节码指令,也不意味着它是一个原子操作。一条字节码指令也可能转化成若干条本地机器码指令。
由于volatile变量只能保证可见性,在不符合以下两条规则的运算场景中,仍然要通过加锁来保证原子性,如synchronized或juc原子类。
1、运算结果并不依赖变量的当前值,或者能够确保只有单一线程修改变量的值。
2、变量不需要与其他的状态变量共同参与不变约束。
volatile的第二个语义是禁止指令重排序优化。普通变量仅仅会保证在该方法的执行过程中所有依赖赋值结果的地方都能获取到正确的结果,而不能保证变量赋值操作的顺序与程序代码中的执行顺序一致。就是说JVM会保证有赋值依赖关系的操作顺序,但如果只有业务依赖关系的话,JVM是无法识别,也就无法保证了。
《深》p369中举的例子,线程A读取配置文件,然后将initialized置为true,线程B会一直检查initialized,如为true则开始其他操作。这个逻辑关系JVM是无法感知的,因为读取配置文件与initialized赋值之间并无赋值依赖关系。如果initialized变量没有使用volatile修饰,就可能由于指令重排序的优化,导致线程A最后一句initialized=true对应的指令被提前执行,这样线程线程B中使用配置信息的代码就可能出现错误,而volatile关键字则可以避免此类情况。
对于一段DCL实现单例的代码,通过对比加入volatile和未加入volatile时的汇编代码的差别,发现关键变化在于有volatile修饰的变量,赋值后多了一个“lock addl $0x0, (%esp)”操作,这个操作相当于一个内存屏障(指重排序时不能把后面的指令重排序到内存屏障之前的位置)。“lock addl”指令的作用是使得本CPU的Cache写入内存,该写入动作也会引起其他CPU无效化其Cache,相当于对Cache变量做了一次store+write操作,让前面volatile变量的操作对其他CPU立即可见。
JMM对volatile变量定义的特殊规则
假定T表示一个线程,V和W分别表示两个volatile变量,那么在进行read、load、use、assign、store、write操作时需要满足以下规则:
1、load + use 必须成对出现。这条规则要求在工作内存中,每次使用V前都必须先从主内存中刷新最新的值,用于保证能看见其他线程对变量V所做的修改后的值。
2、assign + store 必须成对出现。这条规则要求在工作内存中,每次修改V后都必须立刻同步回主内存中,用于保证其他线程可以看到自己对变量V的修改。
3、这条规则要求volatile修饰的变量不会被指令重排序优化,保证代码的执行顺序与程序的顺序相同。
假定动作A是线程T对变量V实施的use/assign,相同,动作B是线程T对变量W实施的use/assign动作;
假定动作F是和动作A相关联的load/store动作,相同,动作G是和动作B相关联的load/store动作;
假定动作P是和动作F相应的对变量V的read/write动作,相同,动作Q是和动作G相应的对变量W的read/write动作;
如果A先于B,那么P先于Q。
注1:JVM对“实时可见性”的实现,并非是绝对的。在各个线程的工作内存中,volatile变量可以存在不一致,但每次使用前都要先刷新,执行引擎看不到不一致的情况,因此可以认为不存在一致性问题。
注2:volatile屏蔽指令重排序的语义在JDK1.5中才被完全修复,此前的JDK无法保证volatile变量完成避免重排序导致的问题,这点也是在JDK1.5之前无法安全使用DCL(双锁检测)来实现单例模式的原因。
参考资料
《深入理解Java虚拟机》第二版 12.3.3小节