【Java】JMM内存模型和JVM内存结构
jmm内存模型和jvm内存结构
java内存模型(java memory model)
java内存模型,一般指的是jdk 5 开始使用的新的内存模型,主要由jsr-133: javatm memory model and thread specification 描述。
jmm
就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了java
程序在各种平台下对内存的访问都能保证效果一致的机制及规范。
内存模型可以理解为在特定的操作协议下,对特定的内存或者高速缓存进行读写访问的过程抽象,不同架构下的物理机拥有不一样的内存模型,java虚拟机也有自己的内存模型,即java内存模型(java memory model, jmm)。在c/c++语言中直接使用物理硬件和操作系统内存模型,导致不同平台下并发访问出错。而jmm的出现,能够屏蔽掉各种硬件和操作系统的内存访问差异,实现平台一致性,是的java程序能够“一次编写,到处运行”。
jmm主要解决的问题: 解决由于多线程通过共享内存进行通信时,存在的本地内存数据不一致、编译器会对代码指令重排序、处理器会对代码乱序执行等带来的问题
- 缓存一致性问题其实就是可见性问题。
- 处理器优化是可以导致原子性问题
- 指令重排即会导致有序性问题
内存模型解决并发问题主要采用两种方式:限制处理器优化和使用内存屏障
参考:
jvm内存结构
传送门:java 虚拟机规范
hotspot 白皮书: memory management in the java hotspot virtual machine 它描述了垃圾回收(gc)触发的内存自动管理
其实 java 虚拟机的内存结构并不是官方的说法,在《java 虚拟机规范》中用的是「运行时数据区(run-time data areas)」这个术语
下图能很清晰的说明jvm内存结构布局:
jvm内存结构主要有三大块:
- 堆内存(heap)
- 方法区/永久代(method area/permgen) 或者别名non-heap(非堆)
- 栈(thraed...)
在《深入理解java虚拟机(第二版)》中的描述是下面这个样子的:
按照《java 虚拟机规范》的中所述,可以分为公有和私有两部分
公有部分: 堆[heap]、方法区[method area]、常量池[constant pool]
私有部分: pc寄存器、vm虚拟机栈、本地方法栈
各个区域的内存大小
通过一张图了解如何通过参数来控制各个区域的内存大小
参数说明:
-xms:设置堆的最小空间大小。 -xmx:设置堆的最大空间大小。 -xx:newsize设置新生代最小空间大小。 -xx:maxnewsize设置新生代最大空间大小。 -xx:permsize设置永久代最小空间大小。 -xx:maxpermsize设置永久代最大空间大小。 -xss:设置每个线程的堆栈大小。
没有直接设置老年代的参数,但是可以设置堆空间大小和新生代空间大小两个参数来间接控制。
老年代空间大小=堆空间大小-年轻代大空间大小
java堆(heap)
java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建.
这块区域专门用于 java 实例对象和数组的内存分配,几乎所有实例对象都在会这里进行内存的分配
之所以说几乎是因为有特殊情况,有些时候小对象会直接在栈上进行分配,这种现象我们称之为「栈上分配」
java堆的内存划分
java堆是垃圾收集器管理的主要区域,因此很多时候也被称做“gc堆”。
如果从内存回收的角度看,由于现在收集器基本都是采用的分代收集算法
,所以java堆中还可以细分
主要被划分为: 新生代「young generation
」和老年代「old generation
」
新生代「young generation
」又可分为:eden
、from survivor 0
、to survivor 1
根据《java 虚拟机规范》的规定,java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-xmx
和-xms
控制)。
堆可以具有固定大小,或者可以根据计算的需要进行扩展,并且如果不需要更大的堆,则可以收缩。
如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出outofmemoryerror异常。
不同区域的生命周期
- 新建(new)或者短期对象会存放在
eden
区域 - 幸存或者中期的对象会从eden拷贝到
survivor
区域 - 始终存在的或者长期存在的对象将会从
survivor
拷贝到old generation
当有对象需要分配时,一个对象永远优先被分配在年轻代的 eden
区,等到 eden
区域内存不够时,java 虚拟机
会启动垃圾回收。此时 eden
区中没有被引用的对象的内存就会被回收,而一些存活时间较长的对象则会进入到老年代。
在 jvm 中有一个名为 -xx:maxtenuringthreshold
的参数(默认为7)专门用来设置晋升到老年代所需要经历的 gc 次数,即在年轻代的对象经过了指定次数的 gc 后,将在下次 gc 时进入老年代
为什么 java 堆要进行这样一个区域划分呢
虚拟机中的对象必然有存活时间长的对象,也有存活时间短的对象,这是一个普遍存在的正态分布规律。如果我们将其混在一起,那么因为存活时间短的对象有很多,那么势必导致较为频繁的垃圾回收。而垃圾回收时不得不对所有内存都进行扫描,但其实有一部分对象,它们存活时间很长,对他们进行扫描完全是浪费时间。因此为了提高垃圾回收效率
,分区就理所当然了
虚拟机heap space
的默认配置为: eden:from :to = 8:1:1
其实这是 ibm 公司根据大量统计得出的结果。根据 ibm 公司对对象存活时间的统计,他们发现 80% 的对象存活时间都很短。于是他们将 eden 区设置为年轻代的 80%,这样可以减少内存空间的浪费,提高内存空间利用率
方法区(method area)
方法区(method area)与java堆一样,是各个线程共享的内存区域,在虚拟机启动时创建。
它用于存储已被虚拟机加载的类结构,如:运行时常量池、静态变量、字段、和方法数据,即时编译器编译后的代码等数据,以及方法和构造函数的代码
java虚拟机规范对这个区域的限制非常宽松,除了和java堆一样不需要连续的内存和可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样“永久”存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域的回收确实是有必要的。
根据《java虚拟机规范的规定》,当方法区无法满足内存分配需求时,将抛出outofmemoryerror异常。
方法区在不同版本的虚拟机有不同的表现形式
例如在 1.7
版本的 hotspot 虚拟机
中,方法区被称为永久代(permanent space)
,而在 jdk 1.8
中则被称之为 metaspace
拓展点
可以看到常量池其实是存放在方法区中的,但《java 虚拟机规范》将常量池和方法区放在同一个等级上
虽然《java虚拟机规范》把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做non-heap(非堆),目的应该是与java堆区分开来。
对于习惯在hotspot虚拟机上开发和部署程序的开发者来说,很多人愿意把方法区称为“永久代”(permanent generation),本质上两者并不等价,仅仅是因为hotspot虚拟机的设计团队选择把gc分代收集扩展至方法区,或者说使用永久代来实现方法区而已。
程序计数器(program counter register)
每个java虚拟机线程都有自己私有独立
的 pc(程序计数器)寄存器。
它的作用可以看做是当前线程所执行的字节码的行号指示器。
在任何时候,每个java虚拟机线程都在执行单个方法的代码
,即该线程的当前方法。如果不是该方法 native,则pc寄存器包含当前正在执行的java虚拟机指令的地址。如果线程当前正在执行native
方法,则java虚拟机pc 寄存器的值为undefined
。
此内存区域是唯一一个在java虚拟机规范中没有规定任何outofmemoryerror情况的区域
jvm栈(java virtual machine stacks)
与程序计数器一样,java虚拟机栈(java virtual machine stack
)也是线程私有的,它的生命周期与线程相同,与线程同时创建。
jvm stack
存储帧(stack frame
) [a java virtual machine stack stores frames]
jvm stack
类似于传统语言的stack
,例如c语言:它保存局部变量和部分结果,并在方法调用和返回中起作用。由于除了推送和弹出帧(frames
)之外,永远不会直接操作java虚拟机堆栈(java virtual machine stack),因此帧(frames)
可以是堆(heap)
分配的。java虚拟机堆栈的内存不需要是连续的。
虚拟机栈(jvm stacks)
描述的是java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(stack frame)
用于存储局部变量表、操作数栈、动态链接、方法出口以及一些过程结果等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)
、对象引用(reference类型
,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)和returnaddress类型
(指向了一条字节码指令的地址)。
其中64位长度的long和double类型的数据会占用2个局部变量空间(slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
在java虚拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出*error
异常;如果虚拟机栈可以动态扩展(当前大部分的java虚拟机都可动态扩展,只不过java虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时会抛出outofmemoryerror
异常。
本地方法栈(native method stacks)
本地方法栈(native method stacks)与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的native方法服务。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以*实现它。甚至有的虚拟机(譬如sun hotspot虚拟机
)直接就把本地方法栈和虚拟机栈合二为一。与虚拟机栈一样,本地方法栈区域也会抛出*error和outofmemoryerror
异常。
参考文档
上一篇: 高精---大整数加法
下一篇: PHP 是如何做垃圾回收的