深度解析Java 8：AbstractQueuedSynchronizer的实现分析（下）-InfoQ

前言

经过本系列的上半部分 JDK1.8 AbstractQueuedSynchronizer 的实现分析（上）的解读，相信很多读者已经对 AbstractQueuedSynchronizer(下文简称 AQS) 的独占功能了然于胸, 那么这次我们通过对另一个工具类:CountDownLatch 的分析来解读 AQS 的另外一个功能：共享功能。

AQS 共享功能的实现

在开始解读 AQS 的共享功能前，我们再重温一下 CountDownLatch，CountDownLatch 为 java.util.concurrent 包下的计数器工具类，常被用在多线程环境下，它在初始时需要指定一个计数器的大小，然后可被多个线程并发的实现减 1 操作，并在计数器为 0 后调用 await 方法的线程被唤醒，从而实现多线程间的协作。它在多线程环境下的基本使用方式为：

复制代码

  
//main thread
     // 新建一个 CountDownLatch，并指制定一个初始大小
     CountDownLatch countDownLatch = new CountDownLatch(3);
     // 调用 await 方法后，main 线程将阻塞在这里，直到 countDownLatch 中的计数为 0 
     countDownLatch.await();
     System.out.println("over");
 
    //thread1
    // do something 
    //...........
    // 调用 countDown 方法，将计数减 1
     countDownLatch.countDown();
 
 
    //thread2
    // do something 
    //...........
    // 调用 countDown 方法，将计数减 1
     countDownLatch.countDown();
 
      //thread3
    // do something 
    //...........
    // 调用 countDown 方法，将计数减 1
     countDownLatch.countDown();

注意，线程 thread 1,2,3 各自调用 countDown 后，countDownLatch 的计数为 0，await 方法返回，控制台输入“over”, 在此之前 main thread 会一直沉睡。

可以看到 CountDownLatch 的作用类似于一个“栏栅”，在 CountDownLatch 的计数为 0 前，调用 await 方法的线程将一直阻塞，直到 CountDownLatch 计数为 0，await 方法才会返回，

而 CountDownLatch 的 countDown() 方法则一般由各个线程调用，实现 CountDownLatch 计数的减 1。

知道了 CountDownLatch 的基本使用方式，我们就从上述 DEMO 的第一行 new CountDownLatch（3）开始，看看 CountDownLatch 是怎么实现的。

首先，看下 CountDownLatch 的构造方法：

和 ReentrantLock 类似，CountDownLatch 内部也有一个叫做 Sync 的内部类，同样也是用它继承了 AQS。

再看下 Sync：

如果你看过本系列的上半部分，你对 setState 方法一定不会陌生，它是 AQS 的一个“状态位”，在不同的场景下，代表不同的含义，比如在 ReentrantLock 中，表示加锁的次数，在 CountDownLatch 中，则表示 CountDownLatch 的计数器的初始大小。

设置完计数器大小后 CountDownLatch 的构造方法返回，下面我们再看下 CountDownLatch 的 await() 方法：

调用了 Sync 的 acquireSharedInterruptibly 方法，因为 Sync 是 AQS 子类的原因，这里其实是直接调用了 AQS 的 acquireSharedInterruptibly 方法：

从方法名上看，这个方法的调用是响应线程的打断的，所以在前两行会检查下线程是否被打断。接着，尝试着获取共享锁，小于 0，表示获取失败，通过本系列的上半部分的解读，我们知道 AQS 在获取锁的思路是，先尝试直接获取锁，如果失败会将当前线程放在队列中，按照 FIFO 的原则等待锁。而对于共享锁也是这个思路，如果和独占锁一致，这里的 tryAcquireShared 应该是个空方法，留给子类去判断:

再看看 CountDownLatch：

如果 state 变成 0 了，则返回 1，表示获取成功，否则返回 -1 则表示获取失败。

看到这里，读者可能会发现， await 方法的获取方式更像是在获取一个独占锁，那为什么这里还会用 tryAcquireShared 呢？

回想下 CountDownLatch 的 await 方法是不是只能在主线程中调用？答案是否定的，CountDownLatch 的 await 方法可以在多个线程中调用，当 CountDownLatch 的计数器为 0 后，调用 await 的方法都会依次返回。也就是说可以多个线程同时在等待 await 方法返回，所以它被设计成了实现 tryAcquireShared 方法，获取的是一个共享锁，锁在所有调用 await 方法的线程间共享，所以叫共享锁。

回到 acquireSharedInterruptibly 方法：

如果获取共享锁失败（返回了 -1，说明 state 不为 0，也就是 CountDownLatch 的计数器还不为 0），进入调用 doAcquireSharedInterruptibly 方法中，按照我们上述的猜想，应该是要将当前线程放入到队列中去。

在这之前，我们再回顾一下 AQS 队列的数据结构：AQS 是一个双向链表，通过节点中的 next，pre 变量分别指向当前节点后一个节点和前一个节点。其中，每个节点中都包含了一个线程和一个类型变量：表示当前节点是独占节点还是共享节点，头节点中的线程为正在占有锁的线程，而后的所有节点的线程表示为正在等待获取锁的线程。如下图所示：

黄色节点为头节点，表示正在获取锁的节点，剩下的蓝色节点（Node1、Node2、Node3）为正在等待锁的节点，他们通过各自的 next、pre 变量分别指向前后节点，形成了 AQS 中的双向链表。每个线程被加上类型（共享还是独占）后便是一个 Node，也就是本文中说的节点。

再看看 doAcquireSharedInterruptibly 方法：

复制代码

  
private void doAcquireSharedInterruptibly(int arg)
       throws InterruptedException {
       final Node node = addWaiter(Node.SHARED); 
// 将当前线程包装为类型为 Node.SHARED 的节点，标示这是一个共享节点。
       boolean failed = true;
       try {
           for (;;) {
               final Node p = node.predecessor();
               if (p == head) {
// 如果新建节点的前一个节点，就是 Head，说明当前节点是 AQS 队列中等待获取锁的第一个节点，
// 按照 FIFO 的原则，可以直接尝试获取锁。
                   int r = tryAcquireShared(arg);
                   if (r >= 0) {
                       setHeadAndPropagate(node, r); 
// 获取成功，需要将当前节点设置为 AQS 队列中的第一个节点，这是 AQS 的规则 // 队列的头节点表示正在获取锁的节点
                       p.next = null; // help GC
                       failed = false;
                       return;
                   }
               }
               if (shouldParkAfterFailedAcquire(p, node) && // 检查下是否需要将当前节点挂起
                   parkAndCheckInterrupt()) 
                   throw new InterruptedException();
           }
       } finally {
           if (failed)
               cancelAcquire(node);
       }
   }

这里有几点需要说明的：

1. setHeadAndPropagate 方法：

首先，使用了 CAS 更换了头节点，然后，将当前节点的下一个节点取出来，如果同样是“shared”类型的，再做一个"releaseShared"操作。

看下 doReleaseShared 方法：

复制代码

  
for (;;) {
           Node h = head;
           if (h != null && h != tail) {
               int ws = h.waitStatus;
               if (ws == Node.SIGNAL) { 
                   if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0)) 
// 如果当前节点是 SIGNAL 意味着，它正在等待一个信号，  
// 或者说，它在等待被唤醒，因此做两件事，1 是重置 waitStatus 标志位，2 是重置成功后, 唤醒下一个节点。
                       continue;            // loop to recheck cases
                   unparkSuccessor(h);
               }
               else if (ws == 0 &&
                        !compareAndSetWaitStatus(h, 0, Node.PROPAGATE))  
// 如果本身头节点的 waitStatus 是出于重置状态（waitStatus==0）的，将其设置为“传播”状态。
// 意味着需要将状态向后一个节点传播。
                   continue;                // loop on failed CAS
           }
           if (h == head)                   // loop if head changed
               break;
       }

为什么要这么做呢？这就是共享功能和独占功能最不一样的地方，对于独占功能来说，有且只有一个线程（通常只对应一个节点，拿 ReentantLock 举例，如果当前持有锁的线程重复调用 lock() 方法，那根据本系列上半部分我们的介绍，我们知道，会被包装成多个节点在 AQS 的队列中，所以用一个线程来描述更准确），能够获取锁，但是对于共享功能来说。

共享的状态是可以被共享的，也就是意味着其他 AQS 队列中的其他节点也应能第一时间知道状态的变化。因此，一个节点获取到共享状态流程图是这样的：

比如现在有如下队列：

当 Node1 调用 tryAcquireShared 成功后，更换了头节点：

Node1 变成了头节点然后调用 unparkSuccessor() 方法唤醒了 Node2、Node2 中持有的线程 A 出于上面流程图的 park node 的位置，

线程 A 被唤醒后，重复黄色线条的流程，重新检查调用 tryAcquireShared 方法，看能否成功，如果成功，则又更改头节点，重复以上步骤，以实现节点自身获取共享锁成功后，唤醒下一个共享类型节点的操作，实现共享状态的向后传递。

2. 其实对于 doAcquireShared 方法，AQS 还提供了集中类似的实现：

分别对应了：

带参数请求共享锁。（忽略中断）
带参数请求共享锁，且响应中断。（每次循环时，会检查当前线程的中断状态，以实现对线程中断的响应）
带参数请求共享锁但是限制等待时间。（第二个参数设置超时时间，超出时间后，方法返回。）

比较特别的为最后一个 doAcquireSharedNanos 方法，我们一起看下它怎么实现超时时间的控制的。

因为该方法和其余获取共享锁的方法逻辑是类似的，我用红色框圈出了它所不一样的地方，也就是实现超时时间控制的地方。

可以看到，其实就是在进入方法时，计算出了一个“deadline”，每次循环的时候用当前时间和“deadline”比较，大于“dealine”说明超时时间已到，直接返回方法。

注意，最后一个红框中的这行代码：

复制代码

  
nanosTimeout > spinForTimeoutThreshold

从变量的字面意思可知，这是拿超时时间和超时自旋的最小作比较，在这里 Doug Lea 把超时自旋的阈值设置成了 1000ns, 即只有超时时间大于 1000ns 才会去挂起线程，否则，再次循环，以实现“自旋”操作。这是“自旋”在 AQS 中的应用之处。

看完 await 方法，我们再来看下 countDown() 方法：

调用了 AQS 的 releaseShared 方法, 并传入了参数 1:

同样先尝试去释放锁，tryReleaseShared 同样为空方法，留给子类自己去实现，以下是 CountDownLatch 的内部类 Sync 的实现：

死循环更新 state 的值，实现 state 的减 1 操作，之所以用死循环是为了确保 state 值的更新成功。

从上文的分析中可知，如果 state 的值为 0，在 CountDownLatch 中意味：所有的子线程已经执行完毕，这个时候可以唤醒调用 await() 方法的线程了，而这些线程正在 AQS 的队列中，并被挂起的，

所以下一步应该去唤醒 AQS 队列中的头节点了（AQS 的队列为 FIFO 队列），然后由头节点去依次唤醒 AQS 队列中的其他共享节点。

如果 tryReleaseShared 返回 true, 进入 doReleaseShared() 方法：

复制代码

  
private void doReleaseShared() {
       for (;;) {
           Node h = head;
           if (h != null && h != tail) {
               int ws = h.waitStatus;
               if (ws == Node.SIGNAL) { 
                   if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0)) 
// 如果当前节点是 SIGNAL 意味着，它正在等待一个信号，
// 或者说，它在等待被唤醒，因此做两件事，1 是重置 waitStatus 标志位，2 是重置成功后, 唤醒下一个节点。
                       continue;            // loop to recheck cases
                   unparkSuccessor(h);
               }
               else if (ws == 0 &&
                        !compareAndSetWaitStatus(h, 0, Node.PROPAGATE))  
// 如果本身头节点的 waitStatus 是出于重置状态（waitStatus==0）的，将其设置为“传播”状态。
// 意味着需要将状态向后一个节点传播。
                   continue;                // loop on failed CAS
           }
           if (h == head)                   // loop if head changed
               break;
       }
 }

当线程被唤醒后，会重新尝试获取共享锁，而对于 CountDownLatch 线程获取共享锁判断依据是 state 是否为 0，而这个时候显然 state 已经变成了 0，因此可以顺利获取共享锁并且依次唤醒 AQS 队里中后面的节点及对应的线程。

总结

本文从 CountDownLatch 入手，深入分析了 AQS 关于共享锁方面的实现方式：

如果获取共享锁失败后，将请求共享锁的线程封装成 Node 对象放入 AQS 的队列中，并挂起 Node 对象对应的线程，实现请求锁线程的等待操作。待共享锁可以被获取后，从头节点开始，依次唤醒头节点及其以后的所有共享类型的节点。实现共享状态的传播。

这里有几点值得注意：

与 AQS 的独占功能一样，共享锁是否可以被获取的判断为空方法，交由子类去实现。
与 AQS 的独占功能不同，当锁被头节点获取后，独占功能是只有头节点获取锁，其余节点的线程继续沉睡，等待锁被释放后，才会唤醒下一个节点的线程，而共享功能是只要头节点获取锁成功，就在唤醒自身节点对应的线程的同时，继续唤醒 AQS 队列中的下一个节点的线程，每个节点在唤醒自身的同时还会唤醒下一个节点对应的线程，以实现共享状态的“向后传播”，从而实现共享功能。

以上的分析都是从 AQS 子类的角度去看待 AQS 的部分功能的，而如果直接看待 AQS，或许可以这么去解读：

首先，AQS 并不关心“是什么锁”，对于 AQS 来说它只是实现了一系列的用于判断“资源”是否可以访问的 API, 并且封装了在“访问资源”受限时将请求访问的线程的加入队列、挂起、唤醒等操作， AQS 只关心“资源不可以访问时，怎么处理？”、“资源是可以被同时访问，还是在同一时间只能被一个线程访问？”、“如果有线程等不及资源了，怎么从 AQS 的队列中退出？”等一系列围绕资源访问的问题，而至于“资源是否可以被访问？”这个问题则交给 AQS 的子类去实现。

当 AQS 的子类是实现独占功能时，例如 ReentrantLock，“资源是否可以被访问”被定义为只要 AQS 的 state 变量不为 0，并且持有锁的线程不是当前线程，则代表资源不能访问。

当 AQS 的子类是实现共享功能时，例如：CountDownLatch，“资源是否可以被访问”被定义为只要 AQS 的 state 变量不为 0，说明资源不能访问。

这是典型的将规则和操作分开的设计思路：规则子类定义，操作逻辑因为具有公用性，放在父类中去封装。

当然，正式因为 AQS 只是关心“资源在什么条件下可被访问”，所以子类还可以同时使用 AQS 的共享功能和独占功能的 API 以实现更为复杂的功能。

比如：ReentrantReadWriteLock，我们知道 ReentrantReadWriteLock 的中也有一个叫 Sync 的内部类继承了 AQS，而 AQS 的队列可以同时存放共享锁和独占锁，对于 ReentrantReadWriteLock 来说分别代表读锁和写锁，当队列中的头节点为读锁时，代表读操作可以执行，而写操作不能执行，因此请求写操作的线程会被挂起，当读操作依次推出后，写锁成为头节点，请求写操作的线程被唤醒，可以执行写操作，而此时的读请求将被封装成 Node 放入 AQS 的队列中。如此往复，实现读写锁的读写交替进行。

而本系列文章上半部分提到的 FutureTask，其实思路也是：封装一个存放线程执行结果的变量 A, 使用 AQS 的独占 API 实现线程对变量 A 的独占访问，判断规则是，线程没有执行完毕：call() 方法没有返回前，不能访问变量 A，或者是超时时间没到前不能访问变量 A(这就是 FutureTask 的 get 方法可以实现获取线程执行结果时，设置超时时间的原因)。

综上所述，本系列文章从 AQS 独占锁和共享锁两个方面深入分析了 AQS 的实现方式和独特的设计思路，希望对读者有启发，下一篇文章，我们将继续 JDK 1.8 下 J.U.C (java.util.concurrent) 包中的其他工具类，敬请期待。

感谢郭蕾对本文的策划和审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ）或者腾讯微博（ @InfoQ ）关注我们，并与我们的编辑和其他读者朋友交流。

评论 2 条评论

发布

非喻

setHeadAndPropagate中没有使用CAS更新头节点吧

2020 年 11 月 21 日 09:47

 0 回复

答案在风中

waiter中被挂起的节点被依次唤醒后，就会执行await函数，头结点自然会一次修改

2020 年 12 月 24 日 03:06

 0 回复

没有更多了

创作场景

深度解析 Java 8：AbstractQueuedSynchronizer 的实现分析（下）

前言

AQS 共享功能的实现

总结

评论 2 条评论

第七周总结

Python 实现 RabbitMQ 的六种工作模式（附 Python 代码）

RabbitMQ 的监控（附 Python 监控源码）

架构师培训 -07 总结性能测试与性能优化

w7-分布式系统中性能的影响因素

第七周学习总结

第七周总结

ARTS打卡Week 08

关于性能压测

【架构师训练营 - week7 -1】总结

性能压测

架构师训练营 No.7 周总结

架构师训练营 - 作业 7

架构师训练营 week7 - 学习总结

第7周性能优化：性能优化是架构师展现自己技术全面性的时刻

架构师训练营 week7

第07周优化系统性能-01 学习总结

Mac 环境下 RabbitMQ 的安装

Week 07 总结

Python Elasticsearch DSL 查询、过滤、聚合操作实例

架构师训练营第七周总结

第07周优化系统性能-01 命题作业

【架构师训练营 - week7 -1】作业

使用 Redis 有序集合实现 IP 归属地查询

性能测试并发压力变大，系统如何变化

第7周

第七周作业

操作系统、性能优化

学习总结 - 架构师训练营 - 第七周

架构师训练营 No.7 周作业

架构师训练营第七章作业


	//main thread
	// 新建一个 CountDownLatch，并指制定一个初始大小
	CountDownLatch countDownLatch = new CountDownLatch(3);
	// 调用 await 方法后，main 线程将阻塞在这里，直到 countDownLatch 中的计数为 0
	countDownLatch.await();
	System.out.println("over");

	//thread1
	// do something
	//...........
	// 调用 countDown 方法，将计数减 1
	countDownLatch.countDown();


	//thread2
	// do something
	//...........
	// 调用 countDown 方法，将计数减 1
	countDownLatch.countDown();

	//thread3
	// do something
	//...........
	// 调用 countDown 方法，将计数减 1
	countDownLatch.countDown();


	private void doAcquireSharedInterruptibly(int arg)
	throws InterruptedException {
	final Node node = addWaiter(Node.SHARED);
	// 将当前线程包装为类型为 Node.SHARED 的节点，标示这是一个共享节点。
	boolean failed = true;
	try {
	for (;;) {
	final Node p = node.predecessor();
	if (p == head) {
	// 如果新建节点的前一个节点，就是 Head，说明当前节点是 AQS 队列中等待获取锁的第一个节点，
	// 按照 FIFO 的原则，可以直接尝试获取锁。
	int r = tryAcquireShared(arg);
	if (r >= 0) {
	setHeadAndPropagate(node, r);
	// 获取成功，需要将当前节点设置为 AQS 队列中的第一个节点，这是 AQS 的规则 // 队列的头节点表示正在获取锁的节点
	p.next = null; // help GC
	failed = false;
	return;
	}
	}
	if (shouldParkAfterFailedAcquire(p, node) && // 检查下是否需要将当前节点挂起
	parkAndCheckInterrupt())
	throw new InterruptedException();
	}
	} finally {
	if (failed)
	cancelAcquire(node);
	}
	}


	for (;;) {
	Node h = head;
	if (h != null && h != tail) {
	int ws = h.waitStatus;
	if (ws == Node.SIGNAL) {
	if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0))
	// 如果当前节点是 SIGNAL 意味着，它正在等待一个信号，
	// 或者说，它在等待被唤醒，因此做两件事，1 是重置 waitStatus 标志位，2 是重置成功后, 唤醒下一个节点。
	continue; // loop to recheck cases
	unparkSuccessor(h);
	}
	else if (ws == 0 &&
	!compareAndSetWaitStatus(h, 0, Node.PROPAGATE))
	// 如果本身头节点的 waitStatus 是出于重置状态（waitStatus==0）的，将其设置为“传播”状态。
	// 意味着需要将状态向后一个节点传播。
	continue; // loop on failed CAS
	}
	if (h == head) // loop if head changed
	break;
	}


	private void doReleaseShared() {
	for (;;) {
	Node h = head;
	if (h != null && h != tail) {
	int ws = h.waitStatus;
	if (ws == Node.SIGNAL) {
	if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0))
	// 如果当前节点是 SIGNAL 意味着，它正在等待一个信号，
	// 或者说，它在等待被唤醒，因此做两件事，1 是重置 waitStatus 标志位，2 是重置成功后, 唤醒下一个节点。
	continue; // loop to recheck cases
	unparkSuccessor(h);
	}
	else if (ws == 0 &&
	!compareAndSetWaitStatus(h, 0, Node.PROPAGATE))
	// 如果本身头节点的 waitStatus 是出于重置状态（waitStatus==0）的，将其设置为“传播”状态。
	// 意味着需要将状态向后一个节点传播。
	continue; // loop on failed CAS
	}
	if (h == head) // loop if head changed
	break;
	}
	}

创作场景

深度解析 Java 8：AbstractQueuedSynchronizer 的实现分析（下）

前言

AQS 共享功能的实现

总结

评论 2 条评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载