JVM笔记:happens-before原则

如果Java内存模型中,所有的有序性都仅仅靠volite和synchronized来完成,那么有一些操作将会变的非常烦琐,但是我们在编写Java并发代码的时候并没有感觉到这一点,这是因为Java语言中有一个“happens-before”的原则。

这个原则非常重要,它是判断数据是否存在竞争、线程是否安全的主要依据,依靠这个原则,我们可以通过几条规则一揽子地解决并发环境下,两个操作之间是否可能存在冲突的所有问题。

定义

Happens-before原则是Java内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其实就是说在发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等。

这个定义不难理解,但它意味着什么呢,可以举个例子来说明,如下代码清单:

// 以下操作在线程A中执行
i  1;
// 以下操作在线程B中执行
j  i;
// 以下操作在线程C中执行
i = 2;

假设线程A中的操作“i=1”先行发生于线程B中的操作“j=i”,那么可以确定在线程B的操作执行后,变量j的值一定等于1,得出这个结论的依据有两个:

  1. 根据先行发生原则,“i=1的结果可以被观察到”;
  2. 线程C还没登场,线程A操作结束之后没有其他线程会修改变量i的值。

现在再考虑线程C,我们依然保持线程A和线程B之间的先行发生关系,而线程C出现在线程A和线程B的操作之间,但是线程C与线程B没有先行发生关系,那么j的值会是多少呢?

答案是不确定!

1和2都有可能,因为线程C对变量i的影响可能会被线程B观察到,也可能不会,这时候线程B就存在读取到过期数据的风险,不具备多线程安全性。

规则

下面是Java内存模型下一些“天然的”先行发生关系,这是先行发生关系无须任何同步器协助就已经存在,可以在编码中直接使用。如果两个操作之间的关系不在此列,并且无法从下列规则中推导出来的话,它们就没有顺序性保障,虚拟机可以对它们随意的进行重排序。

Java语言无须任何同步手段保障就能成立的先行发生规则就只有上面这些了。

以下示例将会演示如何使用这些规则去判定操作间是否具有顺序性,对于读写共享变量的操作来说,就是线程是否安全,读者还可以从下面这个例子感受一下“时间上的先后顺序”与“先行发生”之间有什么不同。演示例子如下代码清单:

private int value = 0;

public void setValue(int value){
    this.value = value;
}

public int getValue(){
    return value;
}

代码清单演示的是一组再普通不过的getter/setter方法,假设存在线程A和B,线程A先(时间上的先后)调用了setValue(1),然后线程B调用了同一个对象的getValue(),那么线程B收到的返回值是什么?

依次分析一下先生发生原则中的各项规则:

因此我们可以判定尽管线程A在操作时间上先于线程B,但是无法确定线程B中的getValue()方法的返回结果,换句话说,这里面的操作不是线程安全的。

至少有两种比较简单的方案可以修复这个问题:

通过上面的例子,我们可以得出结论:

一个操作“时间上的先发生”不代表这个操作会是“先行发生”,同样一个操作“先行发生”也不能推导出这个操作必定是“时间上的先发生”,一个典型的例子就是指令重排序。

// 以下操作在同一个线程中执行
i  1;
j  2;

如上代码清单所示,两条赋值语句在同一个线程中执行,根据次序规则,“int i = 1”的操作先行发生于“int j = 2”,但是“int j = 2”的代码完成可能先被处理器执行,这并不影响先行发生规则的正确性,因为我们在这条线程之中没有办法感知到这点。

综上所述:

时间先后顺序与先行发生原则之间基本没有太大的关系,所以我们衡量并发安全问题的时候不要受到时间顺序的干扰,一切必须以先行发生原则为准。