欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Java队列同步器(AQS)到底是怎么一回事

程序员文章站 2022-07-14 12:20:03
...

0 简介

队列同步器AbstractQueuedSynchronizer(后面简称AQS)是实现锁和有关同步器的一个基础框架。

在JDK5中,Doug Lea在并发包中加入了大量的同步工具,例如重入锁(ReentrantLock)、读写锁(ReentrantReadWriteLock)、信号量(Semaphore)、CountDownLatch等,都是基于AQS的。

其内部通过一个被标识为volatile的名为state的变量来控制多个线程之间的同步状态。多个线程之间可以通过AQS来独占式或共享式的抢占资源。

基于AQS,可以很方便的实现Java中不具备的功能。

例如,在锁这个问题上,Java中提供的是synchronized关键字,用这个关键字可以很方便的实现多个线程之间的同步。但这个关键字也有很多缺陷,比如:

  • 他不支持超时的获取锁,一个线程一旦没有从synchronized上获取锁,就会卡在这里,没有机会逃脱。所以通常由synchronized造成的死锁是无解的。
  • 不可响应中断。
  • 不能尝试获取锁。如果尝试获取时没获取到,立刻返回,synchronized不具备这一特性。

而ReentrantLock基于AQS将上述几点都做到了。

1 核心结构

从AbstractQueuedSynchronizer的名字可以看出,AQS中一定是基于队列实现的(Queue)。在AQS内部,是通过链表实现的队列。链表的每个元素是其内部类Node的一个实现。然后AQS通过实例变量head指向队列的头,通过实例变量tail指向队列的尾。

其源码定义如下:

/**
 * Head of the wait queue, lazily initialized.  Except for
 * initialization, it is modified only via method setHead.  Note:
 * If head exists, its waitStatus is guaranteed not to be
 * CANCELLED.
 */
private transient volatile Node head;

/**
 * Tail of the wait queue, lazily initialized.  Modified only via
 * method enq to add new wait node.
 */
private transient volatile Node tail;

/**
 * The synchronization state.
 */
private volatile int state;


static final class Node {

	/** 标识为共享式 */
    static final Node SHARED = new Node();
    /** 标识为独占式 */
    static final Node EXCLUSIVE = null;

	/** 同步队列中等待的线程等待超时或被中断,需要从等待队列中取消等待,进入该状态的节点状态将不再变化 */
    static final int CANCELLED =  1;

    /** 当前节点的后继节点处于等待状态,且当前节点释放了同步状态,需要通过unpark唤醒后继节点,让其继续运行 */
    static final int SIGNAL    = -1;

    /** 当前节点等待在某一Condition上,当其他线程调用这个Conditino的signal方法后,该节点将从等待队列恢复到同步队列中,使其有机会获取同步状态 */
    static final int CONDITION = -2;

    /** 表示下一次共享式同步状态获取状态将无条件的传播下去 */
    static final int PROPAGATE = -3;

	/* 当前节点的等待状态,取值为上述几个常量之一,另外,值为0表示初始状态 */
    volatile int waitStatus;

    /* 前驱节点 */
    volatile Node prev;

    /* 后继节点 */
    volatile Node next;

    /* 等待获取同步状态的线程 */
    volatile Thread thread;

    /* 等待队列中的后继节点 */
    Node nextWaiter;
    
    // ...
}
复制代码

当线程通过AQS获取同步状态时,AQS会将当前线程封装到Node内部,并入队。所以在多个线程并发获取同步状态时,AQS内部会持有如下结构的队列:

下文会基于这个队列模型,说明一下线程在AQS中获取同步状态时的原理。

2 实现原理

从AQS的名字可以看出来,作者是希望AQS作为一个基类来向外提供服务的(以Abstract标识)。所以通常AQS是以继承的方式使用的。

AQS提供了几个模板方法供实现类自己实现定制功能。

这几个方法是:

  • boolean tryAcquire(int arg):独占式的获取同步状态,通常通过以CAS的方式修改state的值来实现特定功能。
  • boolean tryRelease(int arg):独占式的释放同步状态,通常也是修改state的值。
  • int tryAcquireShared(int arg):共享式的获取同步状态,返回值>=0表示成功,否则失败。
  • boolean tryReleaseShared(int arg):共享式的释放同步状态,同样通过修改state值来实现。
  • boolean isHeldExclusively():表示AQS是否被当前线程独占。

这几个方法的默认实现都会抛出UnsupportedOperationException异常。

目前我们不用关心这几个方法,只要明白其内部是通过控制state的值来管理同步状态即可。

2.1 同步状态的获取

通常,实现类会优先尝试修改state的值,来获取同步状态。例如,如果某个线程成功的将state的值从0修改为1,表示成功的获取了同步状态。 这个修改的过程是通过CAS完成的,所以可以保证线程安全。

反之,如果修改state失败,则会将当前线程加入到AQS的队列中,并阻塞线程。

AQS内部提供了三个方法来修改state的状态,其源码如下:

/**
 * Returns the current value of synchronization state.
 * This operation has memory semantics of a {@code volatile} read.
 * @return current state value
 */
protected final int getState() {
    return state;
}

/**
 * Sets the value of synchronization state.
 * This operation has memory semantics of a {@code volatile} write.
 * @param newState the new state value
 */
protected final void setState(int newState) {
    state = newState;
}

/**
 * Atomically sets synchronization state to the given updated
 * value if the current state value equals the expected value.
 * This operation has memory semantics of a {@code volatile} read
 * and write.
 *
 * @param expect the expected value
 * @param update the new value
 * @return {@code true} if successful. False return indicates that the actual
 *         value was not equal to the expected value.
 */
protected final boolean compareAndSetState(int expect, int update) {
    // See below for intrinsics setup to support this
    return unsafe.compareAndSwapInt(this, stateOffset, expect, update);
}
复制代码

2.2同步队列

如上文所述,AQS内部实际上是一个FIFO的双端队列,当线程获取同步状态失败时,就会构建一个Node并添加到队列尾部(此过程是线程安全的,CAS实现),并阻塞当前线程(通过LockSupport.park()方法); 当释放同步状态时,AQS会先判断head节点是否为null,如果不是null,说明有等待同步状态的线程,就会尝试唤醒head节点,使其重新竞争同步状态。

2.3 独占式同步状态的获取

独占式的意思就是说同一时间只能有一个线程获得同步状态。

AQS会先尝试调用实现类的tryAcquire方法获取同步状态,如果获取失败,会尝试将其封装为Node节点添加到同步队列尾部。

独占式同步状态的获取通过AQS的acquire方法实现。其源码如下:

public final void acquire(int arg) {
    if (!tryAcquire(arg) &&
        acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
        selfInterrupt();
}
复制代码

这个方法会先尝试获取一次同步状态(tryAcquire),如果获取失败,会通过addWaiter方法将当前线程加入到同步队列。 并在acquireQueued方法中将当前线程阻塞(LockSupport.park()),并进入自旋状态,以获取同步状态。

下面具体看一下他是如何构建Node并将其添加到队尾的。 首先是addWaiter:

/**
 * Creates and enqueues node for current thread and given mode.
 *
 * @param mode Node.EXCLUSIVE for exclusive, Node.SHARED for shared
 * @return the new node
 */
private Node addWaiter(Node mode) {
    // mode = Node.EXCLUSIVE,表示是独占模式
    Node node = new Node(Thread.currentThread(), mode);
    // 先快速的通过CAS的方式将Node添加到队尾,如果失败,再进入enq方法通过无限循环添加
    Node pred = tail;
    if (pred != null) {
        node.prev = pred;
        if (compareAndSetTail(pred, node)) {
            pred.next = node;
            return node;
        }
    }
    enq(node);
    return node;
}

/**
 * Inserts node into queue, initializing if necessary. See picture above.
 * @param node the node to insert
 * @return node's predecessor
 */
private Node enq(final Node node) {
    // 无限循环的将node添加到队尾,保证能添加成功
    /*
    注意:如果是首次向队列中添加Node,那么调addWaiter方法时,tail还是null,所以addWaiter方法不会设置成功,会直接进入这个方法
    进入这个方法后,由于tail仍然是null,所以会走到第一个if里面,这是会创建一个空的Node出来作为头结点
    然后再次循环,此时tail不是null了,会进入else的代码中,这时,才会将需要add的Node添加到队列尾部。
    也就是说,首次创建队列时,会默认加一个空的头结点。
     */
    for (;;) {
        Node t = tail;
        if (t == null) { // Must initialize
            if (compareAndSetHead(new Node()))
                tail = head;
        } else {
            node.prev = t;
            if (compareAndSetTail(t, node)) {
                t.next = node;
                return t;
            }
        }
    }
}
复制代码

再看下acquireQueued方法:

final boolean acquireQueued(final Node node, int arg) {
    boolean failed = true;
    try {
        boolean interrupted = false;
        // 进入自旋,不断的获取同步状态
        for (;;) {
            // 获取node在队列中的前驱节点
            final Node p = node.predecessor();
            if (p == head && tryAcquire(arg)) {
                // 如果成功进入到这块代码,说明成功的获取了同步状态
                setHead(node);
                p.next = null; // help GC
                failed = false;
                return interrupted;
            }
            // 获取不成功,调用LockSupport.park()方法将当前线程阻塞
            if (shouldParkAfterFailedAcquire(p, node) &&
                parkAndCheckInterrupt())
                interrupted = true;
        }
    } finally {
        if (failed)
            cancelAcquire(node);
    }
}
复制代码

shouldParkAfterFailedAcquire方法用户判断是否需要阻塞当前线程,方法内会操作当前队尾节点的前驱节点的waitStatus,并依据waitStatus判断是否需要park。

private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
    int ws = pred.waitStatus;
    if (ws == Node.SIGNAL) // Node.SIGNAL == -1
        /*
         * 表明当前节点需要其他线程的唤醒才能继续执行,此时可以安全的park。
         */
        return true;
    if (ws > 0) {
        /*
         * Predecessor was cancelled. Skip over predecessors and
         * indicate retry.
         */
        do {
            node.prev = pred = pred.prev;
        } while (pred.waitStatus > 0);
        pred.next = node;
    } else {
        /*
         * 如果一个节点是初始状态,即waitStatus=0时,
         * 将前驱节点的waitStatus设置为-1,表明其需要别的线程唤醒才能继续执行
         */
        compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
    }
    return false;
}
复制代码

当shouldParkAfterFailedAcquire方法判断当前节点需要被park时,会调用parkAndCheckInterrupt将其阻塞:

private final boolean parkAndCheckInterrupt() {
    LockSupport.park(this);
    return Thread.interrupted();
}
复制代码

2.4 独占式同步状态的释放

独占式的同步状态释放,在AQS中是通过release()方法实现的。此方法源码如下:

public final boolean release(int arg) {
    // 尝试调用实现类的tryRelease方法来修改同步状态(state)
    if (tryRelease(arg)) {
        Node h = head;
        /*
        1.如果head节点是null,表示没有其他线程竞争同步状态,直接返回释放成功
        2.如果head节点不是null,表明有竞争。通过unparkSuccessor方法,通过unpark方法唤醒head节点的next节点。使其重新尝试竞争同步状态。
         */
        if (h != null && h.waitStatus != 0)
            unparkSuccessor(h);
        return true;
    }
    return false;
}
复制代码

unparkSuccessor方法会唤醒head节点的next节点,使其可以重新竞争同步状态:

private void unparkSuccessor(Node node) {
    /*
     * 如果waitStatus的值是负数,例如:-1(等待signal)
     * 则将其值还原为0
     */
    int ws = node.waitStatus;
    if (ws < 0)
        compareAndSetWaitStatus(node, ws, 0);

    /*
     * 获取头结点的next节点,如果非空,则unpark他
     */
    Node s = node.next;
    if (s == null || s.waitStatus > 0) {
        s = null;
        for (Node t = tail; t != null && t != node; t = t.prev)
            if (t.waitStatus <= 0)
                s = t;
    }
    if (s != null)
        LockSupport.unpark(s.thread);
}
复制代码

2.5 独占式同步状态获取与释放-图示

下面会通过画图方式展示一下源码中的过程,首先我们假设tryAcquire的实现如下:

boolean tryAcquire(int acquires) {
    return compareAndSetState(0, acquires);
}
复制代码

参数acquires固定传1,意为:通过CAS,如果成功将state的值从0修改为1,表示获取同步状态成功,否则失败,需要加入同步队列。

假设tryRelease的实现如下:

boolean tryRelease(int releases) {
    int c = getState() - releases;
    if (c == 0) {
        setState(c);
        return true;
    }
    return false;
}
复制代码

参数releases固定传1,意为:如果当前state-1=0,视为释放成功,其他线程可竞争同步状态。

假设有三个线程并发获取同步状态,标识为t1、t2、t3,三个线程同时通过acquire方法修改state值。

假设t1修改成功,t2和t3修改失败。

t1修改成功之后,将state值变为1,并直接返回。此时head和tail都是空,所以同步队列也是空的。此时同步队列状态如下:

t2线程竞争同步状态失败,加入到同步队列中:

t3线程竞争同步状态失败,加入到同步队列中:

t1线程执行完毕,释放资源。 先将state还原为0,再unpark头结点的next节点(t2节点),使之重获同步状态的竞争资格。

假设t2被唤醒后成功的获取到了同步状态(即调用tryAcquire方法并成功将state设置为1),t2会将自己所在的Node设置为head节点,并将原head节点的next设置为null(有助于GC)

t2执行完成,释放同步状态,将state设置为0,同时唤醒t3,使之再次具备竞争资格

假设t3成功获取同步状态,此时t3将自己所在的Node设置为head节点,并将之前的head节点的next设置为null(即将t2的next设置为null)

t3执行完毕,释放同步状态,将state设置为0。由于此时其waitStatus等于0,表示已经没有后继节点需要unpark,直接返回释放成功

最后的t3节点并没有被清空,因为他可以用作下一次同步状态竞争的head节点。

2.6 超时获取同步状态

tryAcquireNanos方法实现了这个功能。他与上面描述的获取同步状态的过程大致相同,只不过是加上了时间的判断。 也就是说,每次自旋获取同步状态时,先判断当前时间是否超过了指定的超时时间,如果超时直接返回获取失败。

下面来看下源码,tryAcquireNanos方法源码如下:

public final boolean tryAcquireNanos(int arg, long nanosTimeout)
        throws InterruptedException {
    if (Thread.interrupted())
        throw new InterruptedException();

    // 先尝试获取同步状态,如果失败,尝试超时获取
    return tryAcquire(arg) ||
        doAcquireNanos(arg, nanosTimeout);
}
复制代码

可以发现,最终是doAcquireNanos方法实现的超时功能,这个方法中,大部分逻辑与上面的过程是一直的。 注释中说明了有区别的地方。

private boolean doAcquireNanos(int arg, long nanosTimeout)
        throws InterruptedException {
    if (nanosTimeout <= 0L)
        return false;

    // 计算出超时那个时间点的时间戳
    final long deadline = System.nanoTime() + nanosTimeout;
    final Node node = addWaiter(Node.EXCLUSIVE);
    boolean failed = true;
    try {
        for (;;) {
            final Node p = node.predecessor();
            if (p == head && tryAcquire(arg)) {
                setHead(node);
                p.next = null; // help GC
                failed = false;
                return true;
            }
            // 判断,如果超时,直接返回获取失败
            nanosTimeout = deadline - System.nanoTime();
            if (nanosTimeout <= 0L)
                return false;
            // 没超时的话,判断剩余时间是否大于1000纳秒,如果大于才park当前线程
            // 否则,不park,直接进入下一次自旋获取,因为这个时间足够小了,可能已经超出了一次系统调用的时间
            if (shouldParkAfterFailedAcquire(p, node) &&
                nanosTimeout > spinForTimeoutThreshold) // spinForTimeoutThreshold = 1000
                LockSupport.parkNanos(this, nanosTimeout);
            if (Thread.interrupted())
                throw new InterruptedException();
        }
    } finally {
        if (failed)
            cancelAcquire(node);
    }
}
复制代码

3 参考

  • Java并发编程的艺术 方腾飞,魏鹏,程晓明

欢迎关注我的微信公众号

转载于:https://juejin.im/post/5cd83b276fb9a0322564dd5d