欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

从上帝视角看Java如何运行

程序员文章站 2022-03-25 18:05:51
JVM内存结构 可以看出JVM从宏观上可以分为 ‘内部’ 及 ‘外部’ 两个部分(便于记忆理解): ‘内部’包含:线程共享(公有)数据区 和 线程隔离(私有)数据区 ‘外部’包含:类加载子系统、垃圾回收器、执行引擎、本地库接口、本地方法库 以上部件构成了整个jvm,接下来我们一个一个零件拆开了看。 ......

jvm内存结构

从上帝视角看Java如何运行

可以看出jvm从宏观上可以分为 ‘内部’  及 ‘外部’  两个部分(便于记忆理解):

‘内部’包含:线程共享(公有)数据区 和 线程隔离(私有)数据区

‘外部’包含:类加载子系统、垃圾回收器、执行引擎、本地库接口、本地方法库

 

以上部件构成了整个jvm,接下来我们一个一个零件拆开了看。

 

class文件

  一个java文件会通过编译工具(javac)编译成class字节码文件,通过jvm进行加载运行。因为jvm屏蔽了底层操作系统的差异(平台无关性),所以一次编译到处运行。

 

类加载子系统

  类加载子系统:负责查找和装载class文件,将其中的二进制数据加载到jvm中。

从上帝视角看Java如何运行

字节码 --> 加载 -->  验证 --> 准备 --> 解析  --> 初始化

加载:通过类的完全限定名找到类文件所在位置,根据其中的字节码创建java.lang.class对象,所以才会说万物皆对象,我们也可以继承classloader,重写findclass方法来自定义实现类加载器。默认情况下我们都使用appclassloader

验证:确保加载的字节码的是否符合虚拟机的要求,是java提供的一种自我保护机制,不让其危害虚拟机安全。其主要包括四种验证,字节码验证、文件格式验证,元数据验证、符号引用验证。

准备:为类变量分配地址和初始化值,类变量会分配到方法区(元空间)中,这里的初始化是指该数据类型的默认初始值,例如int对应的是0,long对应的0l,只有在初始化时才会动显示赋值

解析:把类中的二进制数据中的符号引用转换为直接引用;例如我们通过user.getinfo();这里的.getinfo()就是符号引用,在解析阶段会将它指向真正的内存位置,这就是直接引用

初始化:主要为类的静态变量赋予正确的值,比如int num = 10; 这里num的值会从准备阶段的0变为10;并且若该类有父类,会对其进行初始化操作;如果类中有初始化语句,系统会按照顺序进行初始化

 

双亲委派模式

从上帝视角看Java如何运行

双亲委派:自底向上检查是否加载成功,自顶向下尝试加载。

当一个类加载器收到类加载请求,它不会自己进行加载,而是将该请求丢给父类加载,如果父类还存在父类,则会依次向上请求,直到到达*加载器,如果父类加载器能加载完成就返回加载成功,否则子类加载器才会自己尝试加载。

system.out.println(test.class.getclassloader());
system.out.println(test.class.getclassloader().getparent());
system.out.println(test.class.getclassloader().getparent().getparent());
system.out.println(string.class.getclassloader());

通过代码验证,可以很轻松的了解 appclassloader -> extclassloader -> bootstrapclassloader 这三层的关系。

 

类加载的三种方式

1. new关键字加载

  user user = new user();

    静态加载,在运行时候通过new关键字创建类实例

2. class.forname()加载

  class clazz = class.forname(“user”);  
  object user=clazz.newinstance();

    动态加载,通过class.forname()来加载类,然后调用类的newinstance()方法实例化对象

3. classloader 实例的 loadclass() 方法

  class clazz = classloader.loadclass(“user”); 
  object user=clazz.newinstance();

    动态加载,可通过继承classloader实现自定义类加载器

 

线程私有和线程公有

 

从上帝视角看Java如何运行

jvm内存区从宏观上可以分为 线程私有 和 线程公有 两块。

线程私有部分

  这部分没有线程安全问题,随着线程执行结束而结束;包含程序计数器、虚拟机栈、本地方法栈三个部件。

程序计数器:

   程序计数器也叫pc寄存器,作用是cpu进行切换的时候,指向当前时刻需要获取指令的位置。

   特点:

  1. 线程私有
  2. 一块较小的区域
  3. 记录程序执行的位置
  4. 不存在内存溢出outofmemoryerror

虚拟机栈:

  数据结构实现,入口和出口只有一个,称之为入栈和出栈,先进后出(filo)

从上帝视角看Java如何运行

  栈的作用主要是执行方法,先执行的方法在最下面,然后依次放入,方法执行完毕之后从上往下依次退出;所以方法执行就是压栈,方法结束就是出栈(销毁栈帧)。

public void start(){    
    say();    
    run();
}

从上帝视角看Java如何运行

 

虚拟机栈如何执行

从上帝视角看Java如何运行

栈帧

  栈帧存在java虚拟机栈中,是虚拟机栈中的单位元素。方法执行会创建栈帧,一个方法就是一个栈帧,一个栈帧分为四个部分:

1. 局部变量表

         存放方法参数或者内部定义的一组变量列表;例如方法中声明的对象:

  user user = new user();  //局部变量user
2. 操作数栈

           执行字节码指令的时候使用,通俗的讲就是方法的执行在操作数栈中进行,通过压栈和出栈进行访问

3. 动态链接

           java运行期间是动态链接的,需要将指向方法的符号引用转换为直接引用(内存地址);在类加载解析阶段,将符号引用转换为直接引用称之为静态解析。而此处正好就是动态链接

           user.getinfo();  //找到这个getinfo()方法的内存位置

4. 返回地址

         方法不管正常执行结束还是异常退出,需要返回方法被调用的位置

 

以上四个部分对应方法执行的过程。虚拟里面包含很多个栈帧,每个方法对应一个栈帧。

将一个class文件,通过bin/javap.exe文件进行反汇编可以查看出以上四个部分。

栈溢出:当栈的深度大于虚拟机允许会报*error,-xss可设置大小

/** 递归演示如何栈溢出 */
public static int num = 0;
public static void a(){    
    num++;    
    a();
}
public static void main(string[] args) {    
    try{        
        a();    
    }catch (exception ex){        
        system.out.println("调用次数:"+num);   
    }
} 

内存溢出:当栈需要扩展而无法申请空间会报outofmemoryerror

 

本地方法栈

    本地方法栈和虚拟机栈类似,区别在于虚拟机栈主要为jvm执行字节码服务,而本地方法栈为native方法服务,即本地方法服务;所以本地方法栈也是一块内存私有区域,与虚拟机栈相同也有同样的异常问题。

  特点:

  1. 与虚拟机栈基本类似
  2. 区域在于本地方法栈为native方法服务(windows下调用dll文件)
  3. sun hotspot将虚拟机栈和本地方法栈合并
  4. *erroroutofmemoryerror

 

线程公有部分

从上帝视角看Java如何运行

  这部分存在线程安全问题,平常我们所指的内存优化,溢出等问题都是需要关注这个区域。包含堆、方法区(也叫元空间)两个部件。

方法区(元空间)

  类加载器加载类的时候,会将一些类的元数据信息(字节码)保存在这个区域,例如:类变量,静态方法,普通方法等,方法区是线程共享的,多个线程能用到同一个类

  jdk1.7合并方法区到了堆里面

  jdk1.8保留了方法区的概念,只不过实现方式不同,jdk1.8称为元空间,与堆不相连,但是与堆共享物理内存,逻辑上可以认为是在堆中

 特点:

  1. 线程共享
  2. 存储类信息、常量、静态变量、方法描述等信息
  3. hotspot虚拟机中称之为永久代
  4. gc很少回收这个区域
  5. 存在outofmemoryerror,可以通过-xx:maxpermsize设置大小

 

从上帝视角看Java如何运行

  堆中用于存放所有实例化对象和数组,堆中信息线程共享,所有jvm部件中分配内存中最大的区域,在虚拟机启动时就创建,垃圾回收器主要管理该区域,堆分为新生代(占堆内存1/3)和老年代(占堆内存2/3),新生代更细致可以分为eden、from survivor、to survivor空间,比例8:1:1 ;可以通过-xmx、-xms设置大小

在堆中产生了一个实例对象或数组,可以在栈中声明一个变量,用于指向堆中的对象,该变量的取值等于堆中对象的内存地址,所以我们在打印变量名的时候是一串内存地址

 test test = new test();
 system.out.println(test);  //输出test@1b6d3586

  万物皆对象,当我们在实际开发中,创建了许多对象,为了防止内存泄露,java确保有效的使用内存,会由java虚拟机自动垃圾回收器来管理;且把堆分为新生代和老年代进行管理

新生代与老年代

  新生代是java对象出生的地方,是新对象分配内存的地方,大部分对象存活时间都不需要太久,这个区域会频繁触发minorgc进行垃圾回收;
  而老年代存放的都是存活时间较久或者内存较大的对象,所以full gc不会频繁执行。

minor gc

  发生在新生代中的垃圾回收机制,采用复制算法(扫描存活对象,复制到一块新内存空间中),from survivor 和 to survivor是相对的,也就是说minor gc发生时,eden区和其中一个survivor区会把一些仍然存活的对象放置另外一个survivor 区,然后清理eden区和之前的survivor 区,下次同理,当达到一定 ‘年龄’ 后,新生代会把对象放入老年代(每发生一次minor gc增加1岁,默认15岁)

full gc

  发生在老年代中的垃圾回收机制,采用标记-清除(标记存活的对象,清除未标记的对象,即需要回收的对象),因为老年代中的对象较稳定,所以发生full gc的频率相对minor gc较少,但是一次回收的时间会比minor gc更长