欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

深入理解Java内存模型的语义

程序员文章站 2022-06-21 09:06:30
...
深入理解Java内存模型的语义
            
    
    博客分类: JAVA java多线程内存模型 
### 前言
Java内存模型(JMM)给我们介绍了在当代不同的硬件架构情况下,多线程程序需要关注什么问题以及如何利用JMM来正确的处理这些问题。

### 多线程带来的问题

多线程程序主要关注两个问题:

(1)共享变量可见性问题

(2)代码重排序一致性问题


### Java内存模型的关键点
JMM已经保证了as-if-serial原则,也就是Java的程序在单线程情况下,不管JIT做不做重排序,也不管代码指令在几个CPU上执行,看到的最终结果必须和代码顺序执行的结果保持一致。

但是在多线程的情况下,如何才能正确的处理的变量可见性问题和重排序的一致性问题?

关键在于理解和运用下面的两块内容:

(1)happens-before相关

(2)data race相关

### 关于Memory Consistency Errors
Memory Consistency Errors中文含义是:**内存一致性错误**,指的的是多线程环境下,对于同一个共享变量的值在不同的线程看到的视图不一致。

伪代码如下:

```
int counter = 0;
```

此时A线程正在执行:

```
counter++;
```

然后过了几秒后,B线程打印这个值:

```
System.out.println(counter);
```


此时B线程的打印结果很大可能是0,但A线程里面其实这个值已经是1了,这就是典型的内存一致性错误。这情况种只能通过happens-before规则来避免。



### 关于happens-before
happens-before是JMM里面保证在一个线程里面执行的action(读或者写)的结果,可以在随后的其他线程里面立马可见的一系列规则。比如 x happens-before y ,那么不管x和y是不是在同一个线程里面,JMM都会保证对于x的update都会立马里面对y线程可见,也就是x总会先于y执行,前提是两者必须有happens-before关系,否则就会出现上面的内存一致性错误的问题。

如何建立happens-before关系? 这里面有几条规则:

(1) 单线程中的程序执行结果与代码的顺序执行结果保持一致。

你能会好奇,难道单线程不是顺序执行的吗? 答案是的确不一定按照顺序执行,这个跟硬件的指令重排序有关,目的是为了优化性能让cpu更快的执行指令,但有happens-before保证,所以结果跟代码顺序执行的结果保持一致,这是最基础的保证,也是最重要的保证。

(2)同一个锁的unlock操作,在其他线程lock后,变量是可见的。

```
class LockRule {
    private int value = 0;
    
    public synchronized void setValue(int value) {
        this.value = value;
    }
    
    public synchronized int getValue() {
        return value;
    }
}
```

也就是在A线程中执行setValue操作,在B线程中执行getValue方法是可以看到变化的,注意这里一定是同一个监视器才可以,比如上面这段代码就是用对象做为监视器。此外ReentrantLock锁也具有相同的语义。

(3)volatile修饰的变量,在一个线程update后,立刻对其他的线程可见。这个不多说,前面的文章介绍过。

(4)关于Thread的start方法,是指在一个线程A中启动另外另外一个线程B时,A里面所有的变量对B是可见的,最常见的就是我们在java的main线程中启动的线程是可以看到启动之前所有的main线程的变量的。底层是启动前把所有内容都同步到主内存里面了,然后新的线程会从主内存里面拷贝一份数据到自己的cache,所以是可见的。

(5)关于Thread的join方法,同样道理,比如我在java的main线程里面声明了一个线程B,然后调用
B.start() //启动B线程
B.join() //main线程等待B线程结束
此时在B线程里面修改了成员变量,在B线程结束的时候,main线程是可以直接看到最终变化的。这是一个线程结束的时候会把自己缓存的值给刷新到主内存,所以感知了B线程结束的主线程是可以看到所有变化的。

(6)关于Thread的interrupt方法,同样道理,在java的main线程中,比如我在java的main线程里面声明了一个线程B,然后调用
B.start() //启动B线程
B.interrupt() //打断B线程,此时B线程的是可以看到主线程的修改的状态

(7)对于实例的finalize()方法,当实例的构造方法执行完毕之后,如果再执行finalize()方法,此时实例里面的所有变量不管有多少线程修改过对finalize()方法都是可见的。

(8)传递性规则: 如果 A happens-before B 并且 B happens-before C, 那么 A happens-before C




### 关于data race

data race又叫数据竞争,在这里指的多个线程之间没有符合的happens-before规则,但是它们又需要修改同一个共享变量,比如上面的counter的例子,最终会造成内存一致性的问题,这种情况下可以通过Java自带的一些锁机制来避免。

### 关于上篇文章遗留问题

在上篇文章中,我遗留了一个问题,那就在下面的代码中:

```
    private  static boolean  keepRunning=true;

    public static void main(String[] args)  throws Exception {

        new Thread(
                ()->{

                    while (keepRunning){
                        //System.out.println();
                    }
                }

        ).start();

        Thread.sleep(1000);
        keepRunning=false;

    }
```

如果我把while循环里面的打印语句去掉,那么即使没有volatile关键字,程序也可以结束循环,为什么? 其实答案就在今天的知识里面,因为打印语句会锁住当前的实例,源码如下:

```
    public void println(boolean x) {
        synchronized (this) {
            print(x);
            newLine();
        }
    }
```

对应到上面的happens-before的第二条规则就很容易的解释通了。



### 总结

本篇文章主要介绍了Java内存模型主要描述的问题以及解决多线程环境下的问题思路,我们了解和学习了什么是内存一致性错误,happens-before的规则,数据竞争的内容,掌握了这些知识将非常有助于我们深入到Java并发编程的世界,希望大家可以有所收获。