欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

深入理解Java并发编程(四):CAS操作以及jdk1.8后的优化

程序员文章站 2022-03-04 11:12:44
...

一、前言

说到CAS之前,先来看看乐观锁与悲观锁:

悲观锁认为:每个线程在对一数据进行操作时,都会有其他线程来并发修改,所以在获取数据的时候就上锁来进行操作,synchronized和lock就是一种悲观锁的策略。也就是先上锁再操作。

乐观锁认为:每个线程在对以数据进行操作时,没有其他线程来并发修改,这样就其实是所有线程都去读取共享区的数据,然后在本地工作内存操作,最后看共享区的数据有无被其他线程更新。如果没有则将修改后的数据写入,如果有的话就根据具体实现具体分析(报错或者自动重试)。即直接操作

我们不难得出:
悲观锁适合大量写操作的场景,先加锁可以保证写操作时数据的正确。
乐观锁适合大量读操作的场景,不加锁的特点能够使其读操作的性能大大提升。

二、什么是CAS操作

CAS操作,全称Compare and Swap,比较并交换。

CAS操作就是一个虚拟机实现的原子操作(一条硬件操作指令,不可被中断的一个或一系列操作),功能是将旧值替换为新值,如果旧值没有改变则替换成功,否则替换失败。

一般使用锁的时候,线程获取锁是一种悲观锁策略。即假设每一次在访问共享资源都会产生冲突,所以当前线程获取到锁的同时就会阻塞其他线程获取该锁。

CAS操作是一种乐观锁策略。它假设每一次在访问共享资源时都不会产生冲突,那不冲突就不会阻塞其他线程获取该锁,这样线程就不会出现阻塞停顿状态。Java使用CAS来鉴别线程是否出现冲突,出现冲突就重试当前操作直到没有冲突为止。线程只会收到操作失败的信号并进行原地自旋,并不会阻塞。

三、CAS操作的过程

CAS操作离不开这三个值(V, O, N):

  • V:内存地址存放的实际值
  • O:旧值
  • N:即将更新的新值

当且仅当VO相同时,即旧值和内存中实际存放的值相同,这表明该值没有被其他线程更改过,此时CAS通过原子的方式将N赋给V,并返回true。这是一个比较+更新操作,是原子操作。如果VO不相同,则该值已经被其他线程修改,不能把N赋给V,此时不进行操作,返回false。多个线程使用CAS操作一个变量时,只有一个线程会成功,并且成功更新,其余会失败(并不会阻塞其他线程)。失败的线程会重新尝试,也可以选择挂起线程。

synchronized存在线程竞争的情况下会出现线程阻塞和唤醒锁带来的性能问题,因为这是一种互斥同步(阻塞同步)。而CAS在竞争时如果失败,会进行一定的尝试,而并不是单纯的进行挂起唤醒操作,因此也叫非阻塞同步。

四、CAS的问题

CAS主要有以下三个问题:

1.ABA问题

CAS会检查共享内存的值有无变化,如果我们的共享内存值由A变成了B,可是又由B变回来了,此时CAS检查的时候发现共享内存的值并没有变化依然为A,但是实际上却是发生了变化。如果基本类型倒无所谓,引用类型就会有一些问题。

解决方案:对其进行版本控制,这样A-B-A就变成1A-2B-3A了。Java1.5后atomic包提供的AromicStampedReference来解决ABA问题,具体封装在compareAndSet()中。compareAndSet()首先检查当前引用和当前标志与预期引用和预期标志是否相等,如果都相等,则以原子方式将引用值和标志的值设置为给定的更新值。

2.自旋时间过长

CAS是一种非阻塞同步,线程不会自己被挂起,而是不停的尝试而产生自旋现象(会死循环),自旋时间过长就会造成CPU很大的性能消耗。
解决方案请看夏庆文

3.只能保证一个共享变量的原子操作

如果对多个共享变量进行操作,CAS不能保证其原子性。
解决方案:利用对象整合多个变量,即一个类中的成员就是这几个变量,然后对这个对象进行CAS操作,这么做就能保证其原子性。atomic提供了AtomicReference来保证引用对象的原子性

五、jdk1.8对于CAS的优化

jdk1.8提供了一个LongAdder类,尝试使用分段CAS以及自动分段迁移的方式来大幅度替身多线程高并发执行CAS的性能。

1.分段CAS:

public class LongAdder extends Striped64 implements Serializable 

其继承的Striped64里面有两个重要变量:

/**
 * Table of cells. When non-null, size is a power of 2.
 * cell数组,大小总是2的幂次方
 */
transient volatile Cell[] cells;
/**
 * Base value, used mainly when there is no contention, but also as
 * a fallback during table initialization races. Updated via CAS.
 * 基本值,主要在没有争用的情况下使用,在表的初始化的时候也作为一个基础值。通过CAS更新。
 */
transient volatile long base;

如果发现并发更新的线程数量不是很多,就直接给base值进行累加。如果发现并发更新的数量过多,就开始实行分段CAS机制,系统把这些线程分配到不同的cell数组元素中。

public void add(long x) {
    Cell[] cs; long b, v; int m; Cell c;
    if ((cs = cells) != null || !casBase(b = base, b + x)) {
        boolean uncontended = true;
        if (cs == null || (m = cs.length - 1) < 0 ||
            (c = cs[getProbe() & m]) == null ||
            !(uncontended = c.cas(v = c.value, v + x)))
            longAccumulate(x, null, uncontended);
    }
}

源码大概流程就是首先通过CAS进行对base值的更新,此时只有一个线程会成功,然后保存进sum。其余的线程进行cell数组计算下标并分配,每个线程依次的对cell的元素进行累加,最后将base + sum[i] 求出最后的总和。

看一下LongAdder中的求cell数组总和的源码:

public long sum() {
    Cell[] cs = cells;
    long sum = base;
    if (cs != null) {
        for (Cell c : cs)
            if (c != null)
                sum += c.value;
    }
    return sum;
}

假设当前有80个线程进行一变量的自增操作,cell数组长度为8,则每一组都有10个线程,每一组对cell数组的其中一个元素做自增,最后cell数组8个元素的值都为10,累加得到80。这就等于80个线程对i进行了80次自增操作。

2.自动迁移机制

随着线程增多,每个cell中分配的线程数也会增多,当其中一个线程操作失败的时候,它会自动迁移到下一个cell中进行操作,这也就解决了CAS空旋转,自旋不停等待的问题。

相关标签: Java并发与多线程