深入解读synchronized和ReentrantLock
故事起源于上次阿里电面的3个问题。问题1,jvm中线程分为哪些状态。问题2,在执行Thread.start()方法后,线程是不是马上运行。问题3,java中的synchronized和ReentrantLock有什么不同。当时我的回答不是很好,就不说了,面试之后,在网上搜了很多文章,对照着jdk源码(1.8),发现这3个问题存在着一些联系,接下来,就从这3个问题入手,仔细解读一下线程,synchronized和ReentrantLock。
问题1 jvm中的线程分为哪些状态
这个可以看一下jdk中的Thread的State,里面有详细的注释,大概含义如下所示
public enum State {
NEW, // 初始化,还没开始执行
RUNNABLE, // 执行中
BLOCKED, // 阻塞
WAITING, // 等待
TIMED_WAITING, // 超时等待
TERMINATED; // 执行完成
}
需要注意的是,这个只是jvm中的线程状态,并不是操作系统中的线程状态。操作系统的线程状态中还有一个就绪状态(ready)
关于线程状态的转换,盗用了这张图。来源
线程(英语:thread)是操作系统能够进行运算调度的最小单位。
问题2 在执行Thread.start()方法后,线程是不是马上运行。
先说答案,不是。
在调用Thread的start方法后,Thread的状态变为RUNNABLE
。那么现在这个线程到底有没有运行呢?查看jdk源码可知,start方法中调用的是start0的native方法,由他调用底层真正地在操作系统创建一个线程。
操作系统创建的线程马上就会运行吗?答案是否定的。线程需要被cpu调度,分配了时间片之后才会真正的运行。因此jvm中的RUNNABLE
状态其实对应了两个状态,ready
和runnable
。创建的新线程是ready
状态,被cpu调度后成为runnale
状态,这时候才是真正的运行状态。
问题3 java中的synchronized和ReentrantLock有什么不同。
这个问题比较庞大,我们先从线程的状态入手,来看一下这两个锁的区别。
线程状态
首先,我们来思考一下,这两个锁都会阻止线程的运行,因此肯定会修改线程的状态,那么他们阻止之后的线程状态是否一致呢?我们带着这个疑问通过代码来看一看。
创建一个使用ReentrantLock锁的线程
public class ThreadStatusTest {
static final ReentrantLock lock = new ReentrantLock();
public static void main(String[] args) {
Thread thread1 = new Thread(new Work("thread1"));
Thread thread2 = new Thread(new Work("thread2"));
thread1.start();
thread2.start();
try {
// @1
Thread.sleep(1);
}catch(Exception ex){
}
System.out.println("thread1状态" + thread1.getState().toString());
System.out.println("thread2状态" + thread2.getState().toString());
}
static class Work implements Runnable{
private String name;
public Work(String name){
this.name = name;
}
@Override
public void run(){
try {
lock.lock();
// @2
Thread.sleep(1 * 1000);
System.out.println(name+"执行完成");
}
catch(Exception ex){
}
finally {
lock.unlock();
}
}
}
}
保留@1 @2
的sleep,我们测试一下,看看打印的情况,可以看到先执行的线程1因为执行了内部的sleep后为TIMED_WATTING
状态,后执行的线程2为WAITING
状态。
我们注释掉@1 @2
的sleep,经过多次测试,我们发现thread2有时会出现BLOCKED
和WAITTING
状态(这里忽略掉RUNNANLE和TERMINATED状态)。我们带着疑问继续测试synchronized。
和上面方法相同,我们创建一个使用synchronized锁的线程
public class ThreadStatusTest {
public static void main(String[] args) {
Thread thread1 = new Thread(new SyncWork("thread1"));
Thread thread2 = new Thread(new SyncWork("thread2"));
thread1.start();
thread2.start();
try {
// @1
Thread.sleep(1);
}catch(Exception ex){
}
System.out.println("thread1状态" + thread1.getState().toString());
System.out.println("thread2状态" + thread2.getState().toString());
}
static class SyncWork implements Runnable{
private String name;
public SyncWork(String name){
this.name = name;
}
@Override
public void run(){
synchronized (SyncWork.class){
try {
// @2
Thread.sleep(1 * 1000);
System.out.println(name+"执行完成");
}catch(Exception ex){
}
}
}
}
}
和上面相同,先保留@1 @2
的sleep,我们测试一下,看看打印的情况,可以看到线程1因为执行了内部的sleep后为TIMED_WATTING
状态,但是和ReentrantLock不同的是,线程2为BLOCKED
状态。
我们注释掉@1 @2
的sleep,经过多次测试,我们发现thread2只有BLOCKED
状态(这里忽略掉RUNNANLE
和TERMINATED
状态)。
因此我们在不看源码的情况下,可以大概得到结论:
- synchronized阻塞的线程状态为
BLOCKED
- ReentrantLock阻塞的线程状态为
BLOCKED
或者WAITTING
为什么两个锁阻止的线程状态是不同的呢?我们仔细看一下Thread.State的注释,主要是BLOCKED
,WAITING
,TIMED_WATTING
这三个
/**
* Thread state for a thread blocked waiting for a monitor lock.
* A thread in the blocked state is waiting for a monitor lock
* to enter a synchronized block/method or
* reenter a synchronized block/method after calling
* {@link Object#wait() Object.wait}.
*/
BLOCKED,
/**
* Thread state for a waiting thread.
* A thread is in the waiting state due to calling one of the
* following methods:
* <ul>
* <li>{@link Object#wait() Object.wait} with no timeout</li>
* <li>{@link #join() Thread.join} with no timeout</li>
* <li>{@link LockSupport#park() LockSupport.park}</li>
* </ul>
*
* <p>A thread in the waiting state is waiting for another thread to
* perform a particular action.
*
* For example, a thread that has called <tt>Object.wait()</tt>
* on an object is waiting for another thread to call
* <tt>Object.notify()</tt> or <tt>Object.notifyAll()</tt> on
* that object. A thread that has called <tt>Thread.join()</tt>
* is waiting for a specified thread to terminate.
*/
WAITING,
/**
* Thread state for a waiting thread with a specified waiting time.
* A thread is in the timed waiting state due to calling one of
* the following methods with a specified positive waiting time:
* <ul>
* <li>{@link #sleep Thread.sleep}</li>
* <li>{@link Object#wait(long) Object.wait} with timeout</li>
* <li>{@link #join(long) Thread.join} with timeout</li>
* <li>{@link LockSupport#parkNanos LockSupport.parkNanos}</li>
* <li>{@link LockSupport#parkUntil LockSupport.parkUntil}</li>
* </ul>
*/
TIMED_WAITING,
对照着上面线程状态转换的图就大概了解了。但是其中一些细节,例如什么是monitor,哪里有调用wait(),LockSupport.park()
等方法。
这些细节问题就需要看synchronized对应的字节码和jdk中的ReentrantLock源码。
源码实现
synchronized
synchronized是java中的关键字,它是在jvm层面实现的,所以我们可以查看一下字节码看看它是如何实现的。
我们使用javap
将上面SyncWork的字节码显示出来,如下所示
public void run();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=3, locals=4, args_size=1
0: ldc #3 // class design/demo/ThreadStatusTest$SyncWork
2: dup
3: astore_1
4: monitorenter
5: ldc2_w #4 // long 1000l
8: invokestatic #6 // Method java/lang/Thread.sleep:(J)V
11: getstatic #7 // Field java/lang/System.out:Ljava/io/PrintStream;
14: new #8 // class java/lang/StringBuilder
17: dup
18: invokespecial #9 // Method java/lang/StringBuilder."<init>":()V
21: aload_0
22: getfield #2 // Field name:Ljava/lang/String;
25: invokevirtual #10 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
28: ldc #11 // String 执行完成
30: invokevirtual #10 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
33: invokevirtual #12 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
36: invokevirtual #13 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
39: goto 43
42: astore_2
43: aload_1
44: monitorexit
45: goto 53
48: astore_3
49: aload_1
50: monitorexit
51: aload_3
52: athrow
53: return
我们仔细观察生成的字节码会发现synchronized包裹的代码块在jvm中生成了monitorenter
和monitorenter
这两个命令。若想了解这两个命令的实现需要一定的c知识,这篇文章讲的很详细,可以看一下。
synchronized关键字经过编译之后,会在同步块的前后分别形成monitorenter和monitorexit这两个字节码指令。当我们的JVM把字节码加载到内存的时候,会对这两个指令进行解析。这两个字节码都需要一个Object类型的参数来指明要锁定和解锁的对象。如果Java程序中的synchronized明确指定了对象参数,那么这个对象就是加锁和解锁的对象;如果没有明确指定,那就根据synchronized修饰的是实例方法还是类方法,获取对应的对象实例或Class对象来作为锁对象
说的简单点就是synchronized会对一个对象的监视器(monitor)进行获取,而这个获取的过程是排他的,同一时刻只有一个线程能获取到此监视器。
而这个对象是什么呢?这就要看我们是如何使用的synchronized。
- 普通同步方法的synchronized。此对象代表当前的实例对象
- 静态同步方法。此对象代表当前的类。即xx.class。
- 同步方法快。此对象代表你指定的对象。
那么这个监视器存放在哪里呢?存放在该对象的对象头中。对象头中有一个名为MarkWord的部分,该部分记录了对象和锁有关的信息。具体的可以看看这个文章。
由于synchronized是在jvm层的实现,因此阅读它的源码需要c的知识,这个理解起来还是有些难度的。但是ReentrantLock就不同了,这个锁是在jdk中的实现,因此可以很方便的查看源码。
ReentrantLock
还是使用上面的例子,ReentrantLock的使用很简单,使用new ReentrantLock(boolean isFair)
来创建一个公平或者非公平锁,使用.lock()
方法加锁。使用.unlock()
方法,因此我们就从这三个方法入手,来简单的看一下它是如何实现锁的。
它的构造方法有两个,默认是构造一个非公平锁,这个也是我们经常用的,如下所示
public ReentrantLock() {
sync = new NonfairSync();
}
/**
* Creates an instance of {@code ReentrantLock} with the
* given fairness policy.
*
* @param fair {@code true} if this lock should use a fair ordering policy
*/
public ReentrantLock(boolean fair) {
sync = fair ? new FairSync() : new NonfairSync();
}
无论是NonfairSync还是FairSync他们都是继承了Sync,并且最终继承了AbstractQueuedSynchronizer,这就是传说中的AQS。
AQS中的同步等待队列提供了线程状态管理的基本组件,他提供了一些钩子函数供子类继承时扩展。而这个同步队列主要是由一个带头尾指针的双向链表组成,jdk中有详细的注释。
static final class Node {
// 等待状态,主要有3个值。0初始化。-1(SIGNAL)需要唤醒后续节点线程。1(CANCELLED)取消等待。
volatile int waitStatus;
volatile Node prev;
volatile Node next;
// 当前节点对应的线程
volatile Thread thread;
...
private transient volatile Node head;
private transient volatile Node tail;
先大体说一下同步等待队列的特点:先进先出。获取锁失败的线程构造节点加入队列尾部,阻塞自己,等待唤醒。执行完成的线程从头部移出队列,并唤醒后续节点的线程。头结点是当前获取到锁的线程。
还有两个较为重要的参数
// 位于AbstractOwnableSynchronizer类(AQS的父类),只有独占锁使用,代表当前获取锁的线程
private transient Thread exclusiveOwnerThread;
// 线程被重入的次数,可能大于0,由于可见性问题使用volatile修饰
private volatile int state;
构造方法先看到这里,我们继续解析下一步,.lock()
查看代码可知真正的lock实现在NonfairSync中,如下所示
final void lock() {
if (compareAndSetState(0, 1))
setExclusiveOwnerThread(Thread.currentThread());
else
acquire(1);
}
if代码块的上面部分很简单,使用CAS判断该锁有没有占用,没有占用的话将state置为1,并修改锁的当前线程。重点看看acquire(1)
方法,这个方法在AQS类中
public final void acquire(int arg) {
if (!tryAcquire(arg) &&
acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
selfInterrupt();
}
主要是三个方法,tryAcquire(arg)
方法是在Sync类中实现的,非公平锁为nonfairTryAcquire
final boolean nonfairTryAcquire(int acquires) {
final Thread current = Thread.currentThread();
int c = getState();
if (c == 0) {
if (compareAndSetState(0, acquires)) {
setExclusiveOwnerThread(current);
return true;
}
}
else if (current == getExclusiveOwnerThread()) {
// 当前线程重入
int nextc = c + acquires;
if (nextc < 0) // overflow
throw new Error("Maximum lock count exceeded");
setState(nextc);
return true;
}
return false;
}
可以看到这个方法中有部分代码是和上面重复的,这也是出于性能考虑,特殊情况早点返回而不再向下执行。
若是返回true表示获取到锁,若是返回false表示为获取到锁,继续向下执行。接下来先看addWaiter(Node.EXCLUSIVE)
方法,这个方法在AQS类中
/**
* Creates and enqueues node for current thread and given mode.
*
* @param mode Node.EXCLUSIVE for exclusive, Node.SHARED for shared
* @return the new node
*/
private Node addWaiter(Node mode) {
Node node = new Node(Thread.currentThread(), mode); // 创建一个当前线程的节点
// Try the fast path of enq; backup to full enq on failure
Node pred = tail;
if (pred != null) {
// 尾节点不为空,将该节点添加到队尾
node.prev = pred; // 这里先确定次序,再使用原子操作更新尾节点
if (compareAndSetTail(pred, node)) {
pred.next = node;
return node;
}
}
enq(node);
return node;
}
若队列为空,将进入enq(node)
方法,这个方法在AQS类中,如下所示
private Node enq(final Node node) {
for (;;) {
Node t = tail;
if (t == null) { // Must initialize
// 队列为空时,原子操作构造头结点
if (compareAndSetHead(new Node()))
tail = head;
} else {
// 和上层相同代码,添加到队尾
node.prev = t;
if (compareAndSetTail(t, node)) {
t.next = node;
return t;
}
}
}
}
这是一个死循环,保证节点添加到队列中,和上面类似,包含了和上层方法重复的代码。注意一下,当前的头结点是new Node()
,里面的线程是空的。
现在节点已经添加到队列中了,接下来怎么做,
我们继续看下一个方法acquireQueued(final Node node, int arg)
,这个方法在AQS中,如下所示
final boolean acquireQueued(final Node node, int arg) {
boolean failed = true;
try {
boolean interrupted = false;
for (;;) {
final Node p = node.predecessor();
if (p == head && tryAcquire(arg)) {
setHead(node); // 当前正在执行的节点置为头结点,这里没有使用原子操作。
p.next = null; // help GC
failed = false;
return interrupted; // 唯一出口
}
if (shouldParkAfterFailedAcquire(p, node) &&
parkAndCheckInterrupt()) // 这里会阻塞,直到前面的节点线程执行完成
interrupted = true;
}
} finally {
if (failed)
cancelAcquire(node);
}
}
看到这里发现头结点有点类似哨兵节点。头结点为正在执行的节点,头结点执行完成后通知后续节点解除阻塞,后续节点置为头结点,开始执行。有一种特殊的情况,看一下上面代码的第二个if代码段,主要是shouldParkAfterFailedAcquire
方法,如下所示
/**
* Checks and updates status for a node that failed to acquire.
* Returns true if thread should block. This is the main signal
* control in all acquire loops. Requires that pred == node.prev.
*
* @param pred node's predecessor holding status
* @param node the node
* @return {@code true} if thread should block
*/
private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
int ws = pred.waitStatus;
if (ws == Node.SIGNAL)
/*
* This node has already set status asking a release
* to signal it, so it can safely park.
*/
return true;
if (ws > 0) {
/*
* Predecessor was cancelled. Skip over predecessors and
* indicate retry.
*/
do {
node.prev = pred = pred.prev;
} while (pred.waitStatus > 0);
pred.next = node;
} else {
/*
* waitStatus must be 0 or PROPAGATE. Indicate that we
* need a signal, but don't park yet. Caller will need to
* retry to make sure it cannot acquire before parking.
*/
compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
}
return false;
}
Node.SIGNAL的定义如下
waitStatus value to indicate successor's thread needs unparking
即只有当前节点的状态为SIGNAL时才会唤醒后续节点,因此节点若想唤醒,必须保证前驱节点状态为SIGNAL。但是有些节点可能取消了等待,因此需要从后向前遍历,直到确定前驱节点为SIGNAL状态,然后就可以安心阻塞了。阻塞使用的是LockSupport,一种类似wait,notify的方法。
private final boolean parkAndCheckInterrupt() {
LockSupport.park(this);
return Thread.interrupted();
}
执行了该方法后,线程就持续阻塞直到被唤醒。lock()
方法到此就结束了,我们接下来看unlock()
。
因为已经进行了加锁,阻塞了其他线程,所以解锁时相对简单。
public void unlock() {
sync.release(1);
}
方法很简单,直接看release方法,该方法在AQS中实现
public final boolean release(int arg) {
if (tryRelease(arg)) {
Node h = head;
if (h != null && h.waitStatus != 0)
unparkSuccessor(h);
return true;
}
return false;
}
我们先看tryRelease方法,使用的是Sync子类中的实现
protected final boolean tryRelease(int releases) {
int c = getState() - releases;
if (Thread.currentThread() != getExclusiveOwnerThread())
throw new IllegalMonitorStateException();
boolean free = false;
if (c == 0) {
free = true;
setExclusiveOwnerThread(null);
}
setState(c);
return free;
}
考虑线程重入的情况,当state为0时,说明当前没有线程占用锁,可以进行下一步操作。回到上一层的release方法。操作队列头结点,通知后继节点。
重点看一下通知的方法,即unparkSuccessor
private void unparkSuccessor(Node node) {
/*
* If status is negative (i.e., possibly needing signal) try
* to clear in anticipation of signalling. It is OK if this
* fails or if status is changed by waiting thread.
*/
int ws = node.waitStatus;
if (ws < 0)
compareAndSetWaitStatus(node, ws, 0);
/*
* Thread to unpark is held in successor, which is normally
* just the next node. But if cancelled or apparently null,
* traverse backwards from tail to find the actual
* non-cancelled successor.
*/
Node s = node.next;
// 后继节点为空或者为取消状态,从队尾向前遍历,找到相邻的“正常”节点
if (s == null || s.waitStatus > 0) {
s = null;
for (Node t = tail; t != null && t != node; t = t.prev)
if (t.waitStatus <= 0)
s = t;
}
if (s != null)
// 唤醒后继节点的线程
LockSupport.unpark(s.thread);
}
解锁到这里也就结束了。总结一下:ReentrantLock主要是用了一个巧妙的数据结构(带头尾指针的双链表)和CAS加自旋以及使用LockSupport的park,unpark(类似wait,notify)来实现加锁和解锁。
遗留问题
我们上面的测试代码中,使用ReentrantLock时,被阻塞的线程出现了BLOCKED
状态,但是如果按照ReentrantLock的源码,出现WAITTING
状态是正常的,但并不应该出现BLOCKED
状态,若是有读者明白原因,请在评论中告知,谢谢了。
写在后面
对照着源码看,其实流程很清晰。查看源码的过程中也会发现,源码中有很详细的注释,我们一定要仔细的看注释,这样才能理解的更透彻。
到这里全文就结束了,文中一些内容参考了大佬的这篇文章,大佬写的比我详细,但是自己还想结合碰到的问题梳理一遍,自认为能加强理解,若是感觉作者写的不好可以去看一下原文,相信一定能帮助到您。