[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！

程序员文章站 2022-05-22 20:34:40

...

一、关于解释型和编译型语言

解释型语言就是源代码不是直接翻译成机器语言，而是先翻译成中间代码，再由解释器对中间代码进行解释执行，如Python/JavaScript/Perl/Shell/PHP等都是解释型语言，因为代码是在运行时才被翻译成机器码，所以运行效率相对编译型语言比较低。
编译型语言是相对于解释型语言存在的，编译型语言首先由编译器将源代码编译生成机器语言，再由机器运行机器码（二进制），典型的编译型语言有C/C++，编译型语言从效率上更胜一筹，所以很多东西比如操作系统、数据库的底层都是用C/C++实现的。

二、Java是解释型还是编译型语言？

Java是编程语言中一个比较特殊的存在，它诞生的理念是“一次编译，到处运行”，但如果你认为它是编译型语言那就错了，Java既不是解释型语言也不是编译型语言，它更像两者的一个结合体。
解释型语言 依赖于解释引擎（或者说解释器）的存在，能够做到平台无关性，不管是在32位还是64位，不管是Linux、Windows或mac操作系统，只要提供相应的解释引擎，就能做到写出来的代码导出运行，缺点是运行效率较低。
编译型语言 由于是直接翻译成机器码的，所以在不同的平台上，同样的代码编译出来的机器码是不一样的，所以这也是C++比较难写的原因，数据类型所占字节、大小范围等在不同平台上的表现都不一样，在某个平台上运行良好的代码到了另外一个平台上可能水土不服，所以很难做到一次编写代码，到处运行，所以一个用编译型语言写的一个产品要实现多平台发布可能要写多份代码。
Java集合了两者的优点，通过JVM隔离了跟底层平台的耦合性，从这点看可以将JVM看成是类解释器的存在，但是Java源代码无法被JVM直接读取解释，还要被JDK编译成字节码，一个xx.java通常会被编译成一个xx.class文件，JVM加载读取.class文件先校验，然后转换成底层的机器指令，再交给执行引擎去执行，JVM会通过本地库接口去调用OS本地方法库，所以JVM是平台相关性的。
Java中数据类型的大小都是固定的，不管运行在什么平台之上，JVM会帮我们去跟OS进行交互沟通解决平台相关性的问题，如下图所示，所以只要有运行在对应平台上的JVM，Java就能做到“一次编译，导出运行”。
[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！
Java的性能比不上C/C++这种编译型语言，为了提高Java的运行效率，JVM引入了JIT（Just In Time Compiler），翻译为即时编译器，这是一种非虚拟机必须的优化手段。在众多厂商的JVM中，HotSpot正是由于在JIT方面的出色表现，才得以脱颖而出成为新一代的主流JVM。
HotSpot虚拟机的执行引擎在执行Java代码时可采用【解释执行】和【编译执行】两种方式，常规情况下，解释执行也就是逐一读取字节码指令，再解释给执行引擎执行，不会用到JIT；如果某块代码被反复执行到了一定的频率（特别是递归、循环），那么就会升级为热点代码，HotSpot启动JIT机制，将热点代码编译成本地机器码，执行引擎执行热点代码时直接执行机器码，有效地提升了代码执行的效率，如下图所示：
[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！

三、JVM运行时数据区

[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！
如图所示，JVM运行时数据区，分为线程独占区和线程共享区。

1、线程共享：所有线程能访问这块内存区域，随虚拟机或者GC而创建和销毁

2、线程独占：每个线程都会有它独立的控件，随线程声明周期而创建和销毁

（1）方法区
JVM用来存储加载的类信息、常量、静态变量、编译后的代码等数据，在虚拟机规范中这是一个逻辑区划，具体实现根据不同虚拟机来实现
eg: oracle的HotSpot在Java7中方法区放在永久代，Java8放在元数据空间，并且通过GC机制对这个区域进行管理

（2）堆内存
当创建一个Java对象时，这个对象就会放在堆内存中，而指向对象的引用会存在创建对象的方法的栈中，堆内存可以细分为老年代、新生代，新生代中又可以分为Eden、From Survivor、To Survivor。垃圾回收器主要就是管理堆内存，如果满了，就会出现OutOfMemoryError。

（3）本地方法栈/虚拟机栈
和虚拟机栈功能类似，虚拟机栈是为虚拟机执行Java方法而准备的，本地方法栈是为虚拟机使用Native本地方法而准备的。虚拟机规范没有规定具体的实现，由不同的虚拟机厂商去实现，HotSpot虚拟机中虚拟机栈和本地方法栈的实现方式是一样的，同样地超出栈的大小以后也会抛出*Error。

（4）程序计数器
程序计数器（Program Counter Register）记录当前线程执行字节码的位置，存储的是字节码指令地址，如果执行Native方法，则计数器值为空。每个线程都能在这个空间有一个私有的空间，占用内存空间很少。CPU同一时间只会执行一条线程中的指令，JVM多线程会轮流切换并分配CPU执行时间的方式，为了线程切换后，需要通过程序计数器，来恢复正确的执行位置。

四、class文件内容

class文件包含了Java程序执行的字节码，数据严格按照格式紧凑排列在class文件的二进制流，中间无任何分隔符，文件开头有一个0xcafebabe（16进制）特殊的一个标志，如图所示：
[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！
class文件中，包含了版本（可以看出那个版本的JDK编译的）、访问标志、常量池、当前类、超类、接口、字段、方法、属性等信息，通过javap -v xx.class命令看到字节码对应的可读文字含义，如果想将看到的文本内容输出到文本文件中，可用javap -v xx.class > xx.txt，如下图所示：

[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！
Demo1的代码如下所示：

public class Demo1 {
	public static void main(String[] args) {
		int x = 500;
		int y = 100;
		int a = x / y;
		int b = 50;
		System.out.println(a + b);
	}
}

1、版本号/访问控制

public class Demo1
  SourceFile: "Demo1.java"
  minor version: 0	 // 次版本号
  major version: 52  // 主版本号，JDK5,6,7,8分别对应49,50,51,52
  flags: ACC_PUBLIC, ACC_SUPER    // 访问标志

版本号规则：JDK5, 6, 7, 8分别对应49, 50, 51, 52

标志名称	标志值	含义
ACC_PUBLIC	0x0001	是否为public类型
ACC_FINAL	0x0010	是否被声明为final，只有类可设置
ACC_SUPER	0x0020	是否允许使用invokespecial字节码指令，JDK1.2之后编译出来的类的这个标志为true
ACC_INTERFACE	0X0200	标志这个是一个接口
ACC_ABSTRACT	0X0400	是否为abstract类型，对于接口或抽象类来说，此标志值为true，其他值为false
ACC_SYNTHETIC	0x1000	标志这个类并非由用户产生的
ACC_ANNOTATION	0x2000	标识这是一个注解
ACC_ENUM	0x4000	标识这是一个枚举

2、常量池

类信息包含的静态常量，编译之后就能确认，这里的常量跟String的常量池有区别，记录的是类的元信息，包括类名、方法名、字段及其的符号引用等，标志和含义如下：

常量类型	含义
CONSTANT_utf_info	UTF-8编码的字符串
CONSTANT_Integer_info	整型字面量
CONSTANT_Float_info	浮点型字面量
CONSTANT_Long_info	长整型字面量
CONSTANT_Double_info	双精度浮点型字面量
CONSTANT_Class_info	类或接口的符号引用
CONSTANT_String_info	字符串类型字面量
CONSTANT_Fieldred_info	字段的符号引用
CONSTANT_Methodred_info	类中方法的符号引用
CONSTANT_InterfaceMethodred_info	接口中方法的符号引用
CONSTANT_NameAndType_info	字段或方法的符号引用
CONSTANT_MethodType_info	标志方法类型
CONSTANT_MethodHandle_info	表示方法句柄
CONSTANT_InvokeDynamic_info	表示一个动态方法调用点

3、构造函数

  public Demo1();      // 构造函数
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0       
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return        
      LineNumberTable:
        line 2: 0

PS.没有定义构造函数时也会有隐式的构造函数

4、程序入口main方法

下面一行描述了方法的访问控制、本地变量数量、参数数量、方法对应栈帧中操作数栈的深度

stack=3, locals=5, args_size=1

接来下就是JVM执行引擎要去执行的源码编译过后的指令码，javap翻译出来的是操作符，class文件内存储的是指令码，如下面的指令，前面的数字是偏移量（字节），jvm根据这个去区分不同的指令，sipush 500指将值500入栈。

0: sipush        500

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC       // 方法描述，访问控制
    Code:  
      stack=3, locals=5, args_size=1    // 本地变量数量、参数数量、方法对应栈帧中操作数栈的深度
         0: sipush        500
         3: istore_1      
         4: bipush        100
         6: istore_2      
         7: iload_1       
         8: iload_2       
         9: idiv          
        10: istore_3      
        11: bipush        50
        13: istore        4
        15: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        18: iload_3       
        19: iload         4
        21: iadd          
        22: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        25: return        
      LineNumberTable:
        line 4: 0
        line 5: 4
        line 6: 7
        line 7: 11
        line 8: 15
        line 9: 25

五、程序完整运行分析

1、将类信息加载到方法区中

程序运行时会首先用类加载器加载类信息进方法区
[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！

2、JVM为线程分配内存

JVM创建线程来执行代码，在虚拟机栈、程序计数器内存区域中创建线程独占的空间
[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！

3、指令运行分析

每个线程都会有一个对应的程序计数器，当调用到某个类的方法时，就会在虚拟机栈中创建一个对应的方法栈帧，方法执行时会在栈帧中创建本地变量表和操作数栈。
[Java多线程编程之一] Java代码是怎么运行起来的？看完这篇你就懂了！
字节码指令对应的代码如下：

public class Demo1 {
    public static void main(String[] args) {
        int x = 500;
        int y = 100;
        int a = x / y;
        int b = 50;
        System.out.println(a + b);
    }
}

（1）将500放入操作数栈中