JVM之内存结构详解
对于开发人员来说,如果不了解java的jvm,那真的是很难写得一手好代码,很难查得一手好bug。同时,jvm也是面试环节的中重灾区。今天开始,《jvm详解》系列开启,带大家深入了解jvm相关知识。
我们不能为了面试而面试,但是学习会这些核心知识你必定会成为面试与工作中“最亮的一颗星”。本系列首发于微信公众号“程序新视界”。下面,开启我们的第一篇文章《jvm之内存结构详解》。
学习也是要讲究方式方法的,本系列学习过程中会引导大家通过《》来学习,同时尽量采用图文方式来进行讲解。正所谓一图胜千言。
思考一下
学习一项知识总该知道为什么学习吧。有人会说,这些写代码好像又用不上,貌似所有的事情jvm都替我们做好了。那就,思考一下为什么要学习jvm虚拟机结构。
那你是否遇到这样的困惑:堆内存该设置多大?outofmemoryerror异常到底是怎么引起的?如何进行jvm调优?jvm的垃圾回收是如何?甚至创建一个string对象,jvm都做了些什么?
这些疑问随着学习的深入都会慢慢得到解答,而要解决这些问题的第一步,就是先了解jvm的构成。
jvm内存结构
java虚拟机在执行程序的过程中会将内存划分为不同的数据区域,看一下下图。
如果理解了上图,jvm的内存结构基本上掌握了一半。通过上图我们可以看到什么?外行看热闹,内行看门道。从图中可以得到如下信息。
第一,jvm分为五个区域:虚拟机栈、本地方法栈、方法区、堆、程序计数器。ps:大家不要排斥英语,此处用英文记忆反而更容易理解。
第二,jvm五个区中虚拟机栈、本地方法栈、程序计数器为线程私有,方法区和堆为线程共享区。图中已经用颜色区分,绿色表示“通行”,橘黄色表示停一停(需等待)。
第三,jvm不同区域的占用内存大小不同,一般情况下堆最大,程序计数器较小。那么最大的区域会放什么?当然就是java中最多的“对象”了。
学习延伸:如果你记住了这张图,是不是就可以说出关于jvm的内存结构了呢?可以尝试一下,切记不用死记硬背,发挥你的想象。
堆(heap)
上面已经得出结论,堆内存最大,堆是被线程共享,堆的目的就是存放对象。几乎所有的对象实例都在此分配。当然,随着优化技术的更新,某些数据也会被放在栈上等。
枪打出头鸟,树大招风。因为堆占用内存空间最大,堆也是java垃圾回收的主要区域(重点对象),因此也称作“gc堆”(garbage collected heap)。
关于gc的操作,我们后面章节会详细讲,但正因为gc的存在,而现代收集器基本都采用分代收集算法,堆又被细化了。
同样,对上图呈现内容汇总分析。
第一,堆的gc操作采用分代收集算法。
第二,堆区分了新生代和老年代;
第三,新生代又分为:eden空间、from survivor(s0)空间、to survivor(s1)空间。
java虚拟机规范规定,java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。也就是说堆的内存是一块块拼凑起来的。要增加堆空间时,往上“拼凑”(可扩展性)即可,但当堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出outofmemoryerror异常。
方法区(method area)
方法区与堆有很多共性:线程共享、内存不连续、可扩展、可垃圾回收,同样当无法再扩展时会抛出outofmemoryerror异常。
正因为如此相像,java虚拟机规范把方法区描述为堆的一个逻辑部分,但目前实际上是与java堆分开的(non-heap)。
方法区个性化的是,它存储的是已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
方法区的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是回收确实是有必要的。
程序计数器(program counter register)
关于程序计数器我们已经得知:占用内存较小,现成私有。它是唯一没有outofmemoryerror异常的区域。
程序计数器的作用可以看做是当前线程所执行的字节码的行号指示器,字节码解释器工作时就是通过改变计数器的值来选取下一条字节码指令。其中,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖计数器来完成。
java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。
因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是一个java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是natvie方法,这个计数器值则为空(undefined)。
虚拟机栈(jvm stacks)
虚拟机栈线程私有,生命周期与线程相同。
栈帧(stack frame)是用于支持虚拟机进行方法调用和方法执行的数据结构。栈帧存储了方法的局部变量表、操作数栈、动态连接和方法返回地址等信息。每一个方法从调用至执行完成的过程,都对应着一个栈帧在虚拟机栈里从入栈到出栈的过程。
局部变量表(local variable table)是一组变量值存储空间,用于存放方法参数和方法内定义的局部变量。包括8种基本数据类型、对象引用(reference类型)和returnaddress类型(指向一条字节码指令的地址)。
其中64位长度的long和double类型的数据会占用2个局部变量空间(slot),其余的数据类型只占用1个。
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出*error异常;如果虚拟机栈动态扩展时无法申请到足够的内存时会抛出outofmemoryerror异常。
操作数栈(operand stack)也称作操作栈,是一个后入先出栈(lifo)。随着方法执行和字节码指令的执行,会从局部变量表或对象实例的字段中复制常量或变量写入到操作数栈,再随着计算的进行将栈中元素出栈到局部变量表或者返回给方法调用者,也就是出栈/入栈操作。
动态链接:java虚拟机栈中,每个栈帧都包含一个指向运行时常量池中该栈所属方法的符号引用,持有这个引用的目的是为了支持方法调用过程中的动态链接(dynamic linking)。
方法返回:无论方法是否正常完成,都需要返回到方法被调用的位置,程序才能继续进行。
本地方法栈(native method stacks)
本地方法栈(native method stacks)与虚拟机栈作用相似,也会抛出*error和outofmemoryerror异常。
区别在于虚拟机栈为虚拟机执行java方法(字节码)服务,而本地方法栈是为虚拟机使用到的native方法服务。
小结
经过上面的讲解,想必大家已经了解到jvm内存结构的基本情况。下面对照脑图,归纳总结一下,看你能说出来多少。
后续更多《jvm详解》系列内容及其他面试题系列内容请关注微信公众号“程序新视界”,持续更新中。
原文链接:《jvm之内存结构详解》