【JVM入门系列】一、虚拟机栈
虚拟机栈 Virtual Machine Stack
概述
由于跨平台性的设计,Java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的。
优点是跨平台,指令集小,编译器容易实现。
缺点是性能下降,实现同样的功能需要更过的指令。
1、内存中的栈与堆
栈是运行
时的单位,而堆是存储
的单位。即所谓的栈管运行,堆管存储。
栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。堆解决的是数据储存的问题,即数据怎么放、放在哪儿。
2、虚拟机栈的基本内容
-
Java虚拟机栈是什么?
Java虚拟机栈(Java Virtual Machine Stack),早期也叫Java栈。是线程私有的,每个线程在创建时都会创建一个虚拟机栈,其内部保存一个个的栈帧(Stack Frame)
,对应着一次次的Java方法调用。
-
生命周期
生命周期和线程一致 -
作用
主管Java程序的运行,它保存方法的局部变量(8种基本数据类型、对象的引用地址)、部分结果,并参与方法的调用和返回。 -
栈的特点(优点)
栈是一种快速有效的分配存储方式,访问速度仅次于程序计数器;
JVM直接对Java栈的操作只有两个:
①、每个方法执行,伴随着进栈(入栈、压栈)
②、执行结束后的出栈工作
对于栈来说不存在垃圾回收问题。
-
栈中可能出现的异常
Java虚拟机规范允许Java栈的大小是动态的或者是固定不变的
。
如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,Java虚拟机将会抛出一个*Error
异常。
如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到最够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那Java虚拟机将会抛出一个OutOfMemoryError
异常。 -
设置栈内存大小
我们可以使用参数-Xss
选项来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度。
栈的存储单位
1、栈中存储什么?
每个线程都有自己的栈,栈中的数据都是以栈帧(Stack Frame)的格式存在;
在这个线程上正在执行的每个方法都各自对应一个栈帧;
栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各种数据信息;
2、栈运行原理
JVM直接对Java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循“先进后出”/“后进先出”原则;
在一条活动线程中,一个时间点上,只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,这个栈帧被称为当前栈帧(Current Frame),与当前栈帧相对应的方法就是当前方法(Current Method),定义这个方法的类就是当前类(Current Class);
执行引擎运行的所有字节码指令只针对当前栈帧进行操作;
如果在该方法中调用了其它方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的前栈。
不同线程中包含的栈帧是不允许存在相互引用的,即不可能在一个栈帧之中引用另外一个线程的栈帧。
如果当前方法调用了其它方法,方法返回之际,当前栈帧会传回此方法的执行结果给前一个栈帧,接着,虚拟机会丢弃当前栈帧,使得前一个栈帧重新成为当前栈帧。
Java方法有两种返回函数的方式,一种是正常运行的函数返回,使用return指令
;另外一种是抛出异常(即方法执行中出现未捕获的异常)。不管使用哪种方式,都会导致栈帧被弹出。
栈帧的内部结构
1、栈帧内存储的内容
- 局部变量表(Local Variables)
- 操作数栈(Operand Stack)或表达式栈
- 动态链接(Dynamic Linking)或指向运行时常量池的方法引用
- 方法返回地址(Return Address)或方法正常退出或者异常退出的定义 一些附加信息
2、局部变量表(Local Variables)
通过数组实现
局部变量表也称之为局部变量数组或本地变量表;
定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量,这些数据类型包括基本数据类型、对象引用(reference),以及returnAddress类型;
局部变量表是建立在线程的栈上,是线程的私有数据,因此不存在数据安全问题;
局部变量表所需要的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum local variables
数据项中。在方法运行期间是不会改变局部变量表的大小的。
方法嵌套调用的次数由栈的大小决定。一般来说,栈越大,方法嵌套调用次数越多。对一个函数而言,它的参数和局部变量越多,使得局部变量表膨胀,它的栈帧就越大,以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间,导致其嵌套调用次数就会减少。
局部变量表中的变量只在当前方法调用中有效。在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。
从上图中可以看到,在Class文件的局部变量表中,显示了每个局部变量的作用范围(Start PC Length列)、所在槽位的索引(index列)、变量名(name列)和数据类型(Descriptor列)。
-
关于Slot的理解
参数值的存放总是在局部变量表数组的index0开始,到数组长度-1的索引结束。
局部变量表,最基本的存储单元是Slot(变量槽)。
局部变量表中存放编译期可知的各种基本数据类型(8种),引用类型(reference)
returnAddress类型的变量。
在局部变量表里,32位以内的类型只占用一个slot(包括returnAddress类型),64位的类型(long和double)占用两个slot。
byte、short、char在存储前被转换为int,boolean也被转换为int,0表示false,非0表示true。long和double则占据两个slot。
JVM会为局部变量表中的每一个slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值。
当一个实例方法被调用的时候,它的方法参数和方法体内部定义的局部变量将会按照顺序被复制到局部变量表中的每一个slot上。
如果需要访问局部变量中一个64bit的局部变量值时,只需要使用一个索引即可。对于两个相邻的共同存放一个64bit数据的两个Slot,不允许采用任何方式单独访问其中的某一个,Java虚拟机规范中明确要求了如果遇到进行在这种操作的字节码序列,虚拟机应该在类加载的校验阶段抛出异常。
如果当前栈帧是由构造方法或者实例方法创建的,那么该对象引用this将会存放在index为0的slot处,其余的参数按照参数表顺序继续排列。
-
Slot的重复利用
栈帧中的局部变量表中的槽位是可以重复用的,如果一个局部变量过了其作用域,那么在其作用域之后申明的新的局部变量就很有可能复用过期局部变量的槽位,从而达到节省资源的目的。不过,这样的设计伴随着少量额外的副作用,例如在某些情况下变量槽复用会直接影响到系统的垃圾收集行为。
//slot重复利用,可能会影响到垃圾收集行为
public void test5(){
/**
* VM options:-verbose:gc 查看垃圾收集过程
*
* 不加上下面注释的任何一行代码,gc后,placeholder变量不会回收
*
* placeholder不能被回收的根本原因:局部变量表中的变量槽还存有关于placeholder数组对象的引用。
* 代码虽然已经离开了placeholder的作用域,但在此之后,再没有发生任何对局部变量表的读写操作,
* placeholder原本所占有的变量槽还没有被其它变量所复用,所以作为GC Roots一部分的局部变量表仍然保持着对它的关联。
* 这种关联没有被及时打断,绝大部分情况下影响都很轻微。但如果遇到一个方法,其后面的代码有一些耗时很长的操作,
* 而前面又定义了占用了大量内存但实际上已经不会再使用的变量,便不见得是一个绝对无意义的操作,这种操作可以作为一种
* 在极特殊情形(对象占用内存大、此方法的栈帧长时间不能被回收、方法调用次数达不到即时编译器的编译条件)
* 下的“奇技”来使用。
* 但是,当虚拟机使用解释器执行时,通常与概念模型还会比较接近,但经过即时编译器施加了各种编译优化措施以后,
* 两者的差异就会非常大,只保证程序执行的结果与概念一致。 在实际情况中,即时编译才是虚拟机执行代码的主要方式,
* 赋null值的操作在经过即时编译优化后几乎是一定会被当作无效操作消除掉的,这时候将变量设置为null就是毫无意义的行为。
* 字节码被即时编译为本地代码后,对GC Roots的枚举也与解释执行时期有显著差别,以下面的例子来看,把变量控制在适当的
* 作用域中就可以了,不加注释代码System.gc()执行时就可以正确地回收内存, 根本无须赋null值或加上额外变量复用slot。
*
*/
{
byte[] placeholder = new byte[10 * 1024 * 1024];
// placeholder =null;
}
// int a =0;
System.gc();
}
-
静态变量与局部变量的对比
参数表分配完毕之后,再根据方法体内定义的变量的顺序和作用域分配。
我们知道类变量表有两次初始化的机会,第一次是在“准备阶段”,执行系统初始化,对类变量设置零值,另一次则是在“初始化”阶段,赋予代码中定义的初始值。
和类变量初始化不同的是,局部变量表不存在系统初始化的过程,这意味着一旦定义了局部变量则必须人为的初始化,否则无法使用。
-
补充说明
在栈帧中,与性能调优关系最为密切的部分就是局部变量表。在方法执行时,虚拟机使用局部变量表完成方法的传递。
局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。
3、操作数栈(Operand Stack)
通过数组实现