欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

探秘类加载器和类加载机制

程序员文章站 2022-04-13 12:38:18
在面向对象编程实践中,我们通过众多的类来组织一个复杂的系统,这些类之间相互关联、调用使他们的关系形成了一个复杂紧密的网络。当系统启动时,出于性能、资源利用多方面的考虑,我们不可能要求 JVM 一次性将全部的类都加载完成,而是只加载能够支持系统顺利启动和运行的类和资源即可。那么在系统运行过程中如果需要 ......

在面向对象编程实践中,我们通过众多的类来组织一个复杂的系统,这些类之间相互关联、调用使他们的关系形成了一个复杂紧密的网络。当系统启动时,出于性能、资源利用多方面的考虑,我们不可能要求 jvm 一次性将全部的类都加载完成,而是只加载能够支持系统顺利启动和运行的类和资源即可。那么在系统运行过程中如果需要使用未在启动时加载的类或资源时该怎么办呢?这就要靠类加载器来完成了。

什么是类加载器

类加载器(classloader)就是在系统运行过程中动态的将字节码文件加载到 jvm 中的工具,基于这个工具的整套类加载流程,我们称作类加载机制。我们在 ide 中编写的都是源代码文件,以后缀名 .java 的文件形式存在于磁盘上,通过编译后生成后缀名 .class 的字节码文件,classloader 加载的就是这些字节码文件。

有哪些类加载器

java 默认提供了三个 classloader,分别是 appclassloader、extclassloader、bootstrapclassloader,依次后者分别是前者的「父加载器」。父加载器不是「父类」,三者之间没有继承关系,只是因为类加载的流程使三者之间形成了父子关系,下文会详细讲述。

bootstrapclassloader

bootstrapclassloader 也叫「根加载器」,它是脱离 java 语言,使用 c/c++ 编写的类加载器,所以当你尝试使用 extclassloader 的实例调用 getparent() 方法获取其父加载器时会得到一个 null 值。

// 返回一个 appclassloader 的实例
classloader appclassloader = this.getclass().getclassloader();
// 返回一个 extclassloader 的实例
classloader extclassloader = appclassloader.getparent();
// 返回 null,因为 bootstrapclassloader 是 c/c++ 编写的,无法在 java 中获得其实例
classloader bootstrapclassloader = extclassloader.getparent();

根加载器会默认加载系统变量 sun.boot.class.path 指定的类库(jar 文件和 .class 文件),默认是 $jre_home/lib 下的类库,如 rt.jar、resources.jar 等,具体可以输出该环境变量的值来查看。

string bootclasspath = system.getproperty("sun.boot.class.path");
string[] paths = bootclasspath.split(":");
for (string path : paths) {
    system.out.println(path);
}

// output
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/resources.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/rt.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/sunrsasign.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/jsse.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/jce.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/charsets.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/jfr.jar
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/classes

除了加载这些默认的类库外,也可以使用 jvm 参数 -xbootclasspath/a 来追加额外需要让根加载器加载的类库。比如我们自定义一个 com.ganpengyu.boot.dateutils 类来让根加载器加载。

package com.ganpengyu.boot;

import java.text.simpledateformat;
import java.util.date;

public class dateutils {
    public static void printnow() {
        simpledateformat sdf = new simpledateformat("yyyy-mm-dd hh:mm:ss");
        system.out.println(sdf.format(new date()));
    }
}

我们将其制作成一个名为 gpy-boot 的 jar 包放到 /users/yu/desktop/lib 下,然后写一个测试类去尝试加载 dateutils。

public class test {
    public static void main(string[] args) throws exception {
        class<?> clz = class.forname("com.ganpengyu.boot.dateutils");
        classloader loader = clz.getclassloader();
        system.out.println(loader == null);
    }
}

运行这个测试类:

java -xbootclasspath/a:/users/yu/desktop/lib/gpy-boot.jar -cp /users/yu/desktop/lib/gpy-boot.jar:. test

可以看到输出为 true,也就是说加载 com.ganpengyu.boot.dateutils 的类加载器在 java 中无法获得其引用,而任何类都必须通过类加载器加载才能被使用,所以推断出这个类是被 bootstrapclassloader 加载的,也证明了 -xbootclasspath/a 参数确实可以追加需要被根加载器额外加载的类库。

总之,对于 bootstrapclassloader 这个根加载器我们需要知道三点:

  1. 根加载器使用 c/c++ 编写,我们无法在 java 中获得其实例
  2. 根加载器默认加载系统变量 sun.boot.class.path 指定的类库
  3. 可以使用 -xbootclasspath/a 参数追加根加载器的默认加载类库

extclassloader

extclassloader 也叫「扩展类加载器」,它是一个使用 java 实现的类加载器(sun.misc.launcher.extclassloader),用于加载系统所需要的扩展类库。默认加载系统变量 java.ext.dirs 指定位置下的类库,通常是 $jre_home/lib/ext 目录下的类库。

public static void main(string[] args) {
    string extclasspath = system.getproperty("java.ext.dirs");
    string[] paths = extclasspath.split(":");
    for (string path : paths) {
        system.out.println(path);
    }
}

// output
// /users/leon/library/java/extensions
// /library/java/javavirtualmachines/jdk1.8.0_151.jdk/contents/home/jre/lib/ext
// /library/java/extensions
// /network/library/java/extensions
// /system/library/java/extensions
// /usr/lib/java

我们可以在启动时修改java.ext.dirs 变量的值来修改扩展类加载器的默认类库加载目录,但通常并不建议这样做。如果我们真的有需要扩展类加载器在启动时加载的类库,可以将其放置在默认的加载目录下。总之,对于 extclassloader 这个扩展类加载器我们需要知道两点:

  1. 扩展类加载器是使用 java 实现的类加载器,我们可以在程序中获得它的实例并使用。
  2. 通常不建议修改java.ext.dirs 参数的值来修改默认加载目录,如有需要,可以将要加载的类库放到这个默认目录下。

appclassloader

appclassloader 也叫「应用类加载器」,它和 extclassloader 一样,也是使用 java 实现的类加载器(sun.misc.launcher.appclassloader)。它的作用是加载应用程序 classpath 下所有的类库。这是我们最常打交道的类加载器,我们在程序中调用的很多 getclassloader() 方法返回的都是它的实例。在我们自定义类加载器时如果没有特别指定,那么我们自定义的类加载器的默认父加载器也是这个应用类加载器。总之,对于 appclassloader 这个应用类加载器我们需要知道两点:

  1. 应用类加载器是使用 java 实现的类加载器,负责加载应用程序 classpath 下的类库。
  2. 应用类加载器是和我们最常打交道的类加载器。
  3. 没有特别指定的情况下,自定义类加载器的父加载器就是应用类加载器。

自定义类加载器

除了上述三种 java 默认提供的类加载器外,我们还可以通过继承 java.lang.classloader 来自定义一个类加载器。如果在创建自定义类加载器时没有指定父加载器,那么默认使用 appclassloader 作为父加载器。关于自定义类加载器的创建和使用,我们会在后面的章节详细讲解。

类加载器的启动顺序

上文已经提到过 bootstrapclassloader 是一个使用 c/c++ 编写的类加载器,它已经嵌入到了 jvm 的内核之中。当 jvm 启动时,bootstrapclassloader 也会随之启动并加载核心类库。当核心类库加载完成后,bootstrapclassloader 会创建 extclassloader 和 appclassloader 的实例,两个 java 实现的类加载器将会加载自己负责路径下的类库,这个过程我们可以在 sun.misc.launcher 中窥见。

extclassloader 的创建过程

我们将 launcher 类的构造方法源码精简展示如下:

public launcher() {
    // 创建 extclassloader
    launcher.extclassloader var1;
    try {
        var1 = launcher.extclassloader.getextclassloader();
    } catch (ioexception var10) {
        throw new internalerror("could not create extension class loader", var10);
    }
    // 创建 appclassloader
    try {
        this.loader = launcher.appclassloader.getappclassloader(var1);
    } catch (ioexception var9) {
        throw new internalerror("could not create application class loader", var9);
    }
    // 设置线程上下文类加载器
    thread.currentthread().setcontextclassloader(this.loader);
    // 创建 securitymanager

}

可以看到当 launcher 被初始化时就会依次创建 extclassloader 和 appclassloader。我们进入 getextclassloader() 方法并跟踪创建流程,发现这里又调用了 extclassloader 的构造方法,在这个构造方法里调用了父类的构造方法,这便是 extclassloader 创建的关键步骤,注意这里传入父类构造器的第二个参数为 null。接着我们去查看这个父类构造方法,它位于 java.net.urlclassloader 类中:

urlclassloader(url[] urls, classloader parent,
                          urlstreamhandlerfactory factory)

通过这个构造方法的签名和注释我们可以明确的知道,第二个参数 parent 表示的是当前要创建的类加载器的父加载器。结合前面我们提到的 extclassloader 的父加载器是 jvm 内核中 c/c++ 开发的 bootstrapclassloader,且无法在 java 中获得这个类加载器的引用,同时每个类加载器又必然有一个父加载器,我们可以反证出,extclassloader 的父加载器就是 bootstrapclassloader。

appclassloader 的创建过程

理清了 extclassloader 的创建过程,我们来看 appclassloader 的创建过程就清晰很多了。跟踪 getappclassloader() 方法的调用过程,可以看到这个方法本身将 extclassloader 的实例作为参数传入,最后还是调用了 java.net.urlclassloader 的构造方法,将 extclassloader 的实例作为父构造器 parent 参数值传入。所以这里我们又可以确定,appclassloader 的父构造器就是 extclassloader。

怎么加载一个类

将一个 .class 字节码文件加载到 jvm 中成为一个 java.lang.class 实例需要加载这个类的类加载器及其所有的父级加载器共同参与完成,这主要是遵循「双亲委派原则」。

双亲委派

当我们要加载一个应用程序 classpath 下的自定义类时,appclassloader 会首先查看自己是否已经加载过这个类,如果已经加载过则直接返回类的实例,否则将加载任务委托给自己的父加载器 extclassloader。同样,extclassloader 也会先查看自己是否已经加载过这个类,如果已经加载过则直接返回类的实例,否则将加载任务委托给自己的父加载器 bootstrapclassloader。

bootstrapclassloader 收到类加载任务时,会首先检查自己是否已经加载过这个类,如果已经加载则直接返回类的实例,否则在自己负责的加载路径下搜索这个类并尝试加载。如果找到了这个类,则执行加载任务并返回类实例,否则将加载任务交给 extclassloader 去执行。

extclassloader 同样也在自己负责的加载路径下搜索这个类并尝试加载。如果找到了这个类,则执行加载任务并返回类实例,否则将加载任务交给 appclassloader 去执行。

由于自己的父加载器 extclassloader 和 bootstrapclassloader 都没能成功加载到这个类,所以最后由 appclassloader 来尝试加载。同样,appclassloader 会在 classpath 下所有的类库中查找这个类并尝试加载。如果最后还是没有找到这个类,则抛出 classnotfoundexception 异常。

综上,当类加载器要加载一个类时,如果自己曾经没有加载过这个类,则层层向上委托给父加载器尝试加载。对于 appclassloader 而言,它上面有 extclassloader 和 bootstrapclassloader,所以我们称作「双亲委派」。但是如果我们是使用自定义类加载器来加载类,且这个自定义类加载器的默认父加载器是 appclassloader 时,它上面就有三个父加载器,这时再说「双亲」就不太合适了。当然,理解了加载一个类的整个流程,这些名字就无关痛痒了。

为什么需要双亲委派机制

「双亲委派机制」最大的好处是避免自定义类和核心类库冲突。比如我们大量使用的 java.lang.string 类,如果我们自己写的一个 string 类被加载成功,那对于应用系统来说完全是毁灭性的破坏。我们可以尝试着写一个自定义的 string 类,将其包也设置为 java.lang

package java.lang;

public class string {

    private int n;

    public string(int n) {
        this.n = n;
    }

    public string tolowercase() {
        return new string(this.n + 100);
    }

}

我们将其制作成一个 jar 包,命名为 thief-jdk,然后写一个测试类尝试加载 java.lang.string 并使用接收一个 int 类型参数的构造方法创建实例。

import java.lang.reflect.constructor;

public class test {

    public static void main(string[] args) throws exception {
        class<?> clz = class.forname("java.lang.string");
        system.out.println(clz.getclassloader() == null);
        constructor<?> c = clz.getconstructor(int.class);
        string str = (string) c.newinstance(5);
        str.tolowercase();
    }
}

运行测试程序

java -cp /users/yu/desktop/lib/thief/thief-jdk.jar:. test

程序抛出 nosuchmethodexception 异常,因为 jvm 不能够加载我们自定义的 java.lang.string,而是从 bootstrapclassloader 的缓存中返回了核心类库中的 java.lang.string 的实例,且核心类库中的 string 没有接收 int 类型参数的构造方法。同时我们也看到 class 实例的类加载器是 null,这也说明了我们拿到的 java.lang.string 的实例确实是由 bootstrapclassloader 加载的。

总之,「双亲委派」机制的作用就是确保类的唯一性,最直接的例子就是避免我们自定义类和核心类库冲突。

jvm 怎么判断两个类是相同的

「双亲委派」机制用来保证类的唯一性,那么 jvm 通过什么条件来判断唯一性呢?其实很简单,只要两个类的全路径名称一致,且都是同一个类加载器加载,那么就判断这两个类是相同的。如果同一份字节码被不同的两个类加载器加载,那么它们就不会被 jvm 判断为同一个类。

person 类

public class person {
    private person p;
    public void setperson(object obj) {
        this.p = (person) obj;
    }
}

setperson(object obj) 方法接收一个对象,并将其强制转换为 person 类型赋值给变量 p。

测试类

import java.lang.reflect.method;
public class test {
    public static void main(string[] args) {
        customclassloader classloader1 = new customclassloader("/users/yu/desktop/lib");
        customclassloader classloader2 = new customclassloader("/users/yu/desktop/lib");
        try {
            class c1 = classloader1.findclass("person");
            object instance1 = c1.newinstance();

            class c2 = classloader2.findclass("person");
            object instance2 = c2.newinstance();

            method method = c1.getdeclaredmethod("setperson", object.class);
            method.invoke(instance1, instance2);
        } catch (exception e) {
            e.printstacktrace();
        }
    }
}

customclassloader 是一个自定义的类加载器,它将字节码文件加载为字符数组,然后调用 classloader 的 defineclass() 方法创建类的实例,后文会详细讲解怎么自定义类加载器。在测试类中,我们创建了两个类加载器的实例,让他们分别去加载同一份字节码文件,即 person 类的字节码。然后在实例一上调用 setperson() 方法将实例二传入,将实例二强制转型为实例一。

运行程序会看到 jvm 抛出了 classcastexception 异常,异常信息为 person cannot be cast to person。从这我们就可以知道,同一份字节码文件,如果使用的类加载器不同,那么 jvm 就会判断他们是不同的类型。

全盘负责

「全盘负责」是类加载的另一个原则。它的意思是如果类 a 是被类加载器 x 加载的,那么在没有显示指定别的类加载器的情况下,类 a 引用的其他所有类都由类加载器 x 负责加载,加载过程遵循「双亲委派」原则。我们编写两个类来验证「全盘负责」原则。

worker 类

package com.ganpengyu.full;

import com.ganpengyu.boot.dateutils;

public class worker {

    public worker() {
    }
    public void say() {
        dateutils dateutils = new dateutils();
        system.out.println(dateutils.getclass().getclassloader() == null);
        dateutils.printnow();
    }
}

dateutils 类

package com.ganpengyu.boot;

import java.text.simpledateformat;
import java.util.date;

public class dateutils {

    public void printnow() {
        simpledateformat sdf = new simpledateformat("yyyy-mm-dd hh:mm:ss");
        system.out.println(sdf.format(new date()));
    }
}

测试类

import com.ganpengyu.full.worker;
import java.lang.reflect.constructor;
public class test {
    public static void main(string[] args) throws exception {
        class<?> clz = class.forname("com.ganpengyu.full.worker");
        system.out.println(clz.getclassloader() == null);
        worker worker = (worker) clz.newinstance();
        worker.say();
    }
}

运行测试类

java -xbootclasspath/a:/users/yu/desktop/lib/worker.jar test

运行结果

true
true
2018-09-16 22:34:43

我们将 worker 类和 dateutils 类制作成名为worker 的 jar 包,将其设置为由根加载器加载,这样 worker 类就必然是被根加载器加载的。然后在 worker 类的 say() 方法中初始化了 dateutils 类,然后判断 dateutils 类是否由根加载器加载。从运行结果看到,worker 和其引用的 dateutils 类都被跟加载器加载,符合类加载的「全盘委托」原则。

「全盘委托」原则实际是为「双亲委派」原则提供了保证。如果不遵守「全盘委托」原则,那么同一份字节码可能会被 jvm 加载出多个不同的实例,这就会导致应用系统中对该类引用的混乱,具体可以参考上文「jvm 怎么判断两个类是相同的」这一节的示例。

自定义类加载器

除了使用 jvm 预定义的三种类加载器外,java 还允许我们自定义类加载器以让我们系统的类加载方式更灵活。要自定义类加载器非常简单,通常只需要三个步骤:

  1. 继承 java.lang.classloader 类,让 jvm 知道这是一个类加载器
  2. 重写 findclass(string name) 方法,告诉 jvm 在使用这个类加载器时应该按什么方式去寻找 .class 文件
  3. 调用 defineclass(string name, byte[] b, int off, int len) 方法,让 jvm 加载上一步读取的 .class 文件
import java.io.*;
import java.lang.reflect.constructor;
import java.lang.reflect.method;
import java.nio.file.files;
import java.nio.file.path;
import java.nio.file.paths;

public class customclassloader extends classloader {
    private string classpath;
    
    public customclassloader(string classpath) {
        this.classpath = classpath;
    }

    @override
    protected class<?> findclass(string name) throws classnotfoundexception {
        string classfilepath = getclassfilepath(name);
        byte[] classdata = readclassfile(classfilepath);
        return defineclass(name, classdata, 0, classdata.length);
    }

    public string getclassfilepath(string name) {
        if (name.lastindexof(".") == -1) {
            return classpath + "/" + name + ".class";
        } else {
            name = name.replace(".", "/");
            return classpath + "/" + name + ".class";
        }
    }

    public byte[] readclassfile(string filepath) {
        path path = paths.get(filepath);
        if (!files.exists(path)) {
            return null;
        }
        try {
            return files.readallbytes(path);
        } catch (ioexception e) {
            throw new runtimeexception("can not read class file into byte array");
        }
    }

    public static void main(string[] args) {
        customclassloader loader = new customclassloader("/users/leon/desktop/lib");
        try {
            class<?> clz = loader.loadclass("com.ganpengyu.demo.person");
            system.out.println(clz.getclassloader().tostring());

            constructor<?> c = clz.getconstructor(string.class);
            object instance = c.newinstance("leon");
            method method = clz.getdeclaredmethod("say", null);
            method.invoke(instance, null);
        } catch (exception e) {
            e.printstacktrace();
        }
    }
}

示例中我们通过继承 java.lang.classloader 创建了一个自定义类加载器,通过构造方法指定这个类加载器的类路径(classpath)。重写 findclass(string name) 方法自定义类加载的方式,其中 getclassfilepath(string filepath) 方法和 readclassfile(string filepath) 方法用于找到指定的 .class 文件并加载成一个字符数组。最后调用 defineclass(string name, byte[] b, int off, int len) 方法完成类的加载。

main() 方法中我们测试加载了一个 person 类,通过 loadclass(string name) 方法加载一个 person 类。我们自定义的 findclass(string name) 方法,就是在这里面调用的,我们把这个方法精简展示如下:

protected class<?> loadclass(string name, boolean resolve) throws classnotfoundexception {
    synchronized (getclassloadinglock(name)) {
        // 先检查是否已经加载过这个类
        class<?> c = findloadedclass(name);
        if (c == null) {
            long t0 = system.nanotime();
            try {
                // 否则的话递归调用父加载器尝试加载
                if (parent != null) {
                    c = parent.loadclass(name, false);
                } else {
                    // 所有父加载器都无法加载,使用根加载器尝试加载
                    c = findbootstrapclassornull(name);
                }
            } catch (classnotfoundexception e) {}
            if (c == null) {
                // 所有父加载器和根加载器都无法加载
                // 使用自定义的 findclass() 方法查找 .class 文件
                c = findclass(name);
            }
        }
        return c;
    }
}

可以看到 loadclass(string name) 方法内部是遵循「双亲委派」机制来完成类的加载。在「双亲」都没能成功加载类的情况下才调用我们自定义的 findclass(string name) 方法查找目标类执行加载。

为什么需要自定义类加载器

自定义类加载器的用处有很多,这里简单列举一些常见的场景。

  1. 从任意位置加载类。jvm 预定义的三个类加载器都被限定了自己的类路径,我们可以通过自定义类加载器去加载其他任意位置的类。
  2. 解密类文件。比如我们可以对编译后的类文件进行加密,然后通过自定义类加载器进行解密。当然这种方法实际并没有太大的用处,因为自定义的类加载器也可以被反编译。
  3. 支持更灵活的内存管理。我们可以使用自定义类加载器在运行时卸载已加载的类,从而更高效的利用内存。

就这样吧

类加载器是 java 中非常核心的技术,本文仅对类加载器进行了较为粗浅的分析,如果需要深入更底层则需要我们打开 jvm 的源码进行研读。「java 有路勤为径,jvm 无涯苦作舟」,与君共勉。