欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

《深入理解java虚拟机》一 java内存区域与内存溢出异常

程序员文章站 2022-07-12 20:09:25
...

一、概述

对于java程序员来说,在虚拟机自动内存管理机制的帮助下,不再需要为每一个new操作去写配对的delete/free代码,不容易出现内存泄露和内存溢出问题,由虚拟机管理内存这一切看起来都很美好,不过,也正是因为java程序员把内存控制的权利交给了java虚拟机,一旦出现内存泄露和溢出方面的问题,如果不了解虚拟机是怎么使用内存的,那么排查错误将会成为一项异常艰难的工作。

二、运行时数据区域

根据《java虚拟机规范》的规定,java虚拟机所管理的内存将会包括以下几个运行时数据区域:
《深入理解java虚拟机》一 java内存区域与内存溢出异常
(1)程序计数器

程序计数器是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器只会执行一条线程中的指令,因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是一个java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址,如果正在执行的是native方法, 这个计数器值则为空。此内存区域是唯一一个在java虚拟机规范中没有规定任何outOfMemoryError情况的区域。

(2)java虚拟机栈

与程序计数器一样,java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引和returnAddress类型。
其中64位长度的long和double类型的数据会占用2个局部变量空间,其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完全分配。
在java虚拟机规范中,对这个区域规定了两种异常状况:
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出*Error异常;
如果虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。

(3)本地方法栈

本地方法栈与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则是为虚拟机使用到的native方法服务。

(4)Java堆

Java堆是java虚拟机所管理的内存中最大的一块。java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。
java堆是垃圾收集器管理的主要区域,因此很多时候也被称做”GC堆“。如果从内存回收的角度看,由于现在收集器基本都是采用的分代收集算法,所以java堆中还可以细分为新生代和老年代。再细致一点有Eden区空间、From Survivor空间、To Survivor空间等。
根据Java虚拟机规范的规定,java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。

(5)方法区

方法区和java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量
静态变量、即时编译器编译后的代码等数据。
相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样”永久“存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。
根据java虚拟机规范的规定,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

(6)运行时常量池

运行时常量池是方法区的一部分,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
java虚拟机对Class文件的每一部分的格式都有严格的规定,每一个字节用于存储哪种数据都必须符合规范上的要求,但对于运行时常量池,java虚拟机规范没有做任何细节的要求,运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,java语言并不要求常量一定只能在编译期产生,也就是并非预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中。

三、对象访问

在java语言中,对象访问是如何进行的?
对象访问在java语言中是无处不在的,是最普通的程序行为,但即使是最简单的访问,也会涉及java栈、java堆、方法区这三个最重要内存区域之间的关联关系。
如下面的这句代码:

Object obj  = new Object();

假如这句代码出现在方法体中,那"Object obj"这部分的语义将会反映到java栈的本地变量表中,作为一个引用类型数据出现。而"new Object()"这部分的语义将会反映到java堆中,形成一块存储了Object类型所有实例数据值得结构化内存,另外,在java堆中还必须包含能查找到此对象类型数据(如对象类型、父类、实现的接口、方法等)的地址信息,这些类型数据则存储在方法区中。
主流的访问引用类型的方式有两种:使用句柄和指针。
如果使用句柄访问方式,java堆中将会划分出一块内存来作为句柄池,引用中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自的具体地址信息。如下图所示:
《深入理解java虚拟机》一 java内存区域与内存溢出异常
如果使用直接指针访问方式,引用中直接存储的就是对象地址。如下图所示:
《深入理解java虚拟机》一 java内存区域与内存溢出异常
这两种对象的访问方式各有优势,使用句柄访问方式的最大好处是引用中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中实例数据指针,而引用本身不需要被修改。
使用直接指针访问方式的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象的访问在java中非常频繁,因此这类开销积少成多后也是一项非常可观的执行成本。

四、OutOfMemoryError异常

(1)java堆溢出

java堆用于储存对象实例,我们只要不断地创建对象,并且保证GC Roots到对象之间有可达路径来避免垃圾回收机制清除这些对象,就会在对象数量到达最大堆的容量限制后产生内存溢出异常。

package jvm.chp1;

import java.util.ArrayList;
import java.util.List;

/**
 * @author chengzhengda
 * @version 1.0
 * @date 2019-12-25 20:06
 * @desc java堆溢出
 */
public class HeapOOM {
    static class OOMbject {
    }

    public static void main(String[] args) {
        List<OOMbject> list = new ArrayList<OOMbject>();
        while (true) {
            list.add(new OOMbject());
        }
    }
}

《深入理解java虚拟机》一 java内存区域与内存溢出异常
要解决这个区域的异常,一般的手段是首先通过内存映像分析工具对dump出来的堆转储快照进行分析,重点是确认内存中的对象是否是必要的,也就是要先分清楚到底是出现了内存泄漏还是内存溢出。
如果是内存泄漏,可进一步通过工具查看泄漏对象到GC Roots的引用链,于是就能找到泄漏对象是通过怎样的路径与GC Roots相关联并导致垃圾收集器无法自动回收它们的。
如果不存在泄漏,那就是内存中的对象确实都必须存活着,那就应该检查虚拟机的堆参数,与机器物理内存对比看是否还可以调大,从代码上检查是否存在某些对象生命周期过长,持有状态时间过长的情况,尝试减少程序运行期的内存消耗。

(2)虚拟机栈和本地方法栈溢出

关于虚拟机栈和本地方法栈,在Java虚拟机规范中描述了两种异常:
如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出*Error异常。
如果虚拟机在扩展栈时无法申请到足够的内存空间,则抛出OutOfMemoryError异常。
package jvm.chp1;

/**
 * @author chengzhengda
 * @version 1.0
 * @date 2019-12-26 10:49
 * @desc 栈溢出
 */
public class JavaVMStackSOF {
    private int stackLength = 1;

    public void stackLeak() {
        stackLength++;
        stackLeak();
    }

    public static void main(String[] args) {
        JavaVMStackSOF oom = new JavaVMStackSOF();
        try {
            oom.stackLeak();
        } catch (Throwable e) {
            System.out.println("stack length:" + oom.stackLength);
            throw e;
        }
    }
}

《深入理解java虚拟机》一 java内存区域与内存溢出异常
实验结果表明:在单个线程下,无论是由于栈帧太大,还是虚拟机栈容量大小,当内存无法分配的时候,虚拟机抛出的都是*Error异常。
如果测试时不限于单线程,通过不断地建立线程的方式倒是可以产生内存溢出异常,但是这样产生的内存溢出异常与栈空间是否足够大并不存在任何联系,或者准确地说,在这种情况下,给每个线程的栈分配的内存越大,反而越容易产生内存溢出异常。
原因其实不难理解,操作系统分配给每个进程的内存时有限制的,如果每个线程分配到的栈容量越大,可以建立的线程数量自然就越少,建立线程时就越容易把剩下的内存耗尽。
如果是建立多线程导致的内存溢出,在不能减少线程数或者更换64位虚拟机的情况下,就只能通过减少最大堆和减少栈容量来换取更多的线程。
《深入理解java虚拟机》一 java内存区域与内存溢出异常
(3) 方法区和运行时常量池溢出

package jvm.chp1;

import java.util.ArrayList;
import java.util.List;

/**
 * @author chengzhengda
 * @version 1.0
 * @date 2019-12-26 13:13
 * @desc
 */
public class RuntimeConstantPoolOOM {
    public static void main(String[] args) {
        List<String> list = new ArrayList<>();
        int i = 0;
        while (true) {
            list.add(String.valueOf(i++).intern());
        }
    }
}