欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

你还在为怎么查看字节码指令而担忧吗?

程序员文章站 2022-06-27 14:30:36
前言 我们平时编码过程中,可能很少去查看 Java 文件编译后的字节码指令。但是,不管你是因为对技术非常热爱,喜欢刨根问底,还是想在别人面前装X 。我认为,都非常有必要了解一下常见的字节码指令。这对于我们理解代码的运行原理也会很有帮助。 注释会被执行吗? 比如,最近我就看到了二哥(沉默王二)的一篇文 ......

前言

我们平时编码过程中,可能很少去查看 java 文件编译后的字节码指令。但是,不管你是因为对技术非常热爱,喜欢刨根问底,还是想在别人面前装x 。我认为,都非常有必要了解一下常见的字节码指令。这对于我们理解代码的运行原理也会很有帮助。

注释会被执行吗?

比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也让我涨了见识了。且看代码,可能会让你怀疑人生~

public class testanno {
    public static void main(string[] args) {
        string str = "张三";
        // \u000d str="李四";
        system.out.println(str);
    }
}

可以猜一下最终打印结果是什么。我来告诉你,结果是: “李四”。what? 这是什么神仙操作。为何会这样,这被注释的代码还能执行?

别光顾着吃惊,我们来看一下为什么打印结果跟我们想象中的略有偏差。

仔细查看,发现注释行中,有一个 \u000d 。这是一个 unicode 码,它代表的是一个换行符。因此,在执行后,就会把 str="李四" 这行代码换行到下一行,从而导致了它也被编译执行。

有的小伙伴就说了,我怎么知道你说的是真是假呢,你这不是瞎说呢吗,一点说服力都没有啊。

好吧,这就需要我们看一下编译后的字节码了,编译器总不能骗我们吧。

查看字节码的两种方式

我们知道,通过 javac 命令,可以把 java 文件编译成 class 文件。然后,想看它的字节码指令,需要用到 javap -c 反编译一下。

但是,每次都通过命令行,还是有一些麻烦。因此,懒人福利来了。这里我提供两种方式,直接在 idea 中就可以查看,非常的方便(果然,懒惰才是促使科技进步的原动力啊)。

配置 external tools

这种方式,其实就是先配置一下,jdk 中 javap 命令的位置,然后让 idea 帮我们自动执行 javap 命令。

找到 idea 的菜单栏,file --> settings 。然后找到 external tools 。

你还在为怎么查看字节码指令而担忧吗?

点击加号,添加一个 tool ,里边的配置项,如下,

你还在为怎么查看字节码指令而担忧吗?

  • name,就给当前 tool 起一个名字好了,用于使用时,在右键菜单选项中展示。
  • decriptions,描述此功能,别到时候你自己都忘了当前配置这个东西是用来干嘛的了。
  • program:电脑本机 javap 命令的绝对路径。
  • arguments:填写 -c $filenamewithoutextension$.class 就可以,代表编译的class文件。
  • working directory:填写 $outputpath$/$filedirrelativetosourcepath$ ,代表class文件的工作目录。

配置完成了,可以在idea中,直接右键,选择配置中 name 对应的选项。

你还在为怎么查看字节码指令而担忧吗?

此时 ,就可以打印出当前类编译后的字节码指令。

你还在为怎么查看字节码指令而担忧吗?

我们稍后再来分析里边的具体含义。下边,还有另外一种使用插件的方式,来查看字节码。而且功能更加强大。

jclasslib bytecode viewer 插件

同上,在 idea 的 setting 菜单,找到 plugins 插件项,然后搜索这个插件。

你还在为怎么查看字节码指令而担忧吗?

安装之后,并重启 idea ,就可以生效了。

使用的时候,在 view 菜单,找到 show bytecode with jclasslib。

你还在为怎么查看字节码指令而担忧吗?

它可以查看基本信息,常量池,接口,属性,方法等信息。如下,找到我们对应的 main 方法。

你还在为怎么查看字节码指令而担忧吗?

这个插件还有一个好处,就是当我们不知道某个指令是什么意思的时候,直接鼠标在指令上边单击,就可以链接到官方的解释。如,不知道第一行 ldc 什么意思,直接单击 ldc 就可以跳转到 oracle 官网对应命令的解释。这非常有利用我们学习此命令。

你还在为怎么查看字节码指令而担忧吗?

常用字节码指令

以上两种方式,都挺方便的,根据自己喜好*选择就好了。

相信你肯定也被很多字节码指令搞的一头雾水过,接下来,我们就一起学习下常用的指令都有哪些吧。之后,再来看上边的例子就轻松很多了。

数据类型

我们知道 java 是强类型语言,在使用之前肯定已经确定了它的类型。而数据类型,无非就是基本数据类型和引用类型。它们对应的字节码,其实就是用它们的对应类型的英文首字母来表示的。(引用类型除外)

例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。

加载和存储指令

我们知道,一个方法的运行,会在栈的栈帧中执行。方法中的变量称为局部变量,数的操作需要用到操作数栈。因此,加载和存储指令,就是数据在局部变量表和操作数栈中来回传输。

将一个局部变量加载到操作数栈:如 iload、iload_ 。表示加载的是 int 类型变量。

iload_ 后边带数字代表第几个 int 型变量。例如 iload_0 代表把第一个 int 型局部变量加载到操作数栈。

其他类型变量同上: lload ,fload ,dload,aload 。

将一个数值存储到局部变量表: istore,istore_,lstore,lstore_,fstore,fstore_,dstore,dstore_,astore,astore_ 。

将一个常量加载到操作数栈: aconst_null,iconst_m1,iconst_,lconst_,fconst_,dconst_ ,bipush,sipush。

ldc 代表把 int、float、string类型常量从常量池中加载到操作数栈。 ldc_w 代表宽索引。

ldc2_w 代表把 long 或 double 类型常量从常量池中加载到操作数栈。(宽索引)

这里需要说的是,int 类型根据数值的取值范围不同,而采用不同的字节码指令。

iconst_m1 代表 -1 ,iconst_ 代表 0~5 。bipush 代表 -128~127(byte取值范围), sipush 代表 -32768~32767(short取值范围),ldc 在 int 中代表 -2147483648~2147483647(int取值范围)。

public class testbytecode {
    public static void main(string[] args) {
        int a = -1;
        int b = 0;
        int c = 1;
        int d = 2;
        int e = 3;
        int f = 4;
        int g = 5;
        int h = 127;
        int i = 32767;
        int j = 2147483647;
    }
}

其字节码为:

0 iconst_m1
 1 istore_1
 2 iconst_0
 3 istore_2
 4 iconst_1
 5 istore_3
 6 iconst_2
 7 istore 4
 9 iconst_3
10 istore 5
12 iconst_4
13 istore 6
15 iconst_5
16 istore 7
18 bipush 127
20 istore 8
22 sipush 32767
25 istore 9
27 ldc #2 <2147483647>
29 istore 10
31 return

访问指令

访问类字段:getstatic,putstatic

访问类实例字段:getfield,putfield

方法调用和返回

  • invokevirtual : 用于调用对象的实例方法。
  • invokeinterfce: 用于调用接口方法。
  • invokespecial:用于调用一些特殊的方法,如父类构造方法,实例初始化方法,私有方法。
  • invokestatic:用于调用类的静态方法。
  • invokedynamic:用于调用动态方法。

方法返回是跟返回类型相关,根据不同的返回类型,有不同的指令。

  • return:返回 void。
  • ireturn:注意,这个不止返回 int ,返回 boolean,byte,char,short 也用这个指令。其实,很多指令都没有直接支持 byte,char,short和 boolean,而是用 int 类型代替。这是因为,虚拟机的操作码长度只有一个字节,只能表示有限个数的指令。(我们这里所提到的所有指令,都只是方便我们记忆的助记符,而在计算机内部肯定还是一个字节,即 8 个 bit 位的二进制)
  • lreturn:返回 long 类型。
  • freturn:返回 float 类型。
  • dreturn:返回 double 类型。
  • areturn:返回引用类型。

其余字节码指令

上边介绍的指令只是很少一部分字节码指令。但是,麻雀虽小,五脏俱全,也包括了最基本的变量定义,调用方法,和方法返回这些最基本的功能。同时,也足够我们去解释上边的问题,为什么注释行会被执行了。

更多的字节码指令可以参考《深入理解java虚拟机》这本书的 6.4 节,和最后的附录字节码指令表。需要这本书的,可以微信搜索到我《烟雨星空》,后台回复“java虚拟机”。

由于字节码指令太多,比如还有运算指令,包括加减乘除、位运算,比较指令等,if 等控制指令,类型强转指令,还有多线程用到的同步锁。and so on ~

不可能把它们全部记住背会,但是,其实都是由规律可循的,很多都是见名知意,用各种英文首字母简写代表。比如,int类型的加法运算,就是 iadd,double 类型的减法运算是 dsub。等等。

因此,我这里只是给了一个引子,重要的还是需要自己去寻找方法,不断的实践探索 ~

另外,官方文档才是最好的学习途径:

注释行字节码

最后,学以致用,实践出真知。我们一起看一下开头抛出的问题吧,为什么注释行会被执行。看一下它的字节码指令就知道了。

public class testanno {
    public static void main(string[] args) {
        string str = "张三";
        // \u000d str="李四";
        system.out.println(str);
    }
}
 //这里就是从常量池中取出一个字符串“张三”,然后加载到操作数栈
 0 ldc #2 <张三>
 //从操作数栈把这个字符串引用存储到局部变量表中
 2 astore_1
 //从常量池中取出一个字符串“李四”,然后加载到操作数栈
 3 ldc #3 <李四>
 //可以发现和上边一样都是astore_1,说明指向的是同一个引用 str。
 //若定义另外一个str2赋值给“李四”,这个操作指令肯定就不同了。
 5 astore_1
 //访问的是system类的静态属性out,我们知道它的类型是printstream
 6 getstatic #4 <java/lang/system.out>
 //将out这个引用加载到操作数栈栈顶,以便后边操作它
 9 aload_1
 //调用out的实例方法 println ,用于打印结果到控制台
10 invokevirtual #5 <java/io/printstream.println>
//main方法返回值为void
13 return

这里就不用再多余解释了吧,可以从字节码指令中看到,后边的 str="李四" 被编译器执行了。

如果本文对你有用,就赶快关注我,给我点赞吧~