详细分析Java中String、StringBuffer、StringBuilder类的性能
我们先要记住三者的特征:
- string 字符串常量
- stringbuffer 字符串变量(线程安全)
- stringbuilder 字符串变量(非线程安全)
一、定义
查看api会发现,string、stringbuffer、stringbuilder都实现了 charsequence接口,虽然它们都与字符串相关,但是其处理机制不同。
- string:是不可改变的量,也就是创建后就不能在修改了。
- stringbuffer:是一个可变字符串序列,它与string一样,在内存中保存的都是一个有序的字符串序列(char类型的数组),不同点是stringbuffer对象的值都是可变的。
- stringbuilder:与stringbuffer类基本相同,都是可变字符换字符串序列,不同点是stringbuffer是线程安全的,stringbuilder是线程不安全的。 在性能方面,由于string类的操作是产生新的string对象,而stringbuilder和stringbuffer只是一个字符数组的扩容而已,所以string类的操作要远慢于stringbuffer和stringbuilder。
二、使用场景
使用string类的场景:在字符串不经常变化的场景中可以使用string类,例如常量的声明、少量的变量运算。
使用stringbuffer类的场景:在频繁进行字符串运算(如拼接、替换、删除等),并且运行在多线程环境中,则可以考虑使用stringbuffer,例如xml解析、http参数解析和封装。
使用stringbuilder类的场景:在频繁进行字符串运算(如拼接、替换、和删除等),并且运行在单线程的环境中,则可以考虑使用stringbuilder,如sql语句的拼装、json封装等。
三、分析
简要的说, string 类型和 stringbuffer 类型的主要性能区别其实在于 string 是不可变的对象, 因此在每次对 string 类型进行改变的时候其实都等同于生成了一个新的 string 对象,然后将指针指向新的 string 对象。所以经常改变内容的字符串最好不要用 string ,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后, jvm 的 gc 就会开始工作,那速度是一定会相当慢的。
而如果是使用 stringbuffer 类则结果就不一样了,每次结果都会对 stringbuffer 对象本身进行操作,而不是生成新的对象,再改变对象引用。所以在一般情况下我们推荐使用 stringbuffer ,特别是字符串对象经常改变的情况下。而在某些特别情况下, string 对象的字符串拼接其实是被 jvm 解释成了 stringbuffer 对象的拼接,所以这些时候 string 对象的速度并不会比 stringbuffer 对象慢,而特别是以下的字符串对象生成中, string 效率是远要比 stringbuffer 快的:
string s1 = “this is only a" + “ simple" + “ test"; stringbuffer sb = new stringbuilder(“this is only a").append(“ simple").append(“ test");
你会很惊讶的发现,生成 string s1 对象的速度简直太快了,而这个时候 stringbuffer 居然速度上根本一点都不占优势。其实这是 jvm 的一个把戏,在 jvm 眼里,这个
string s1 = “this is only a" + “ simple" + “test";
其实就是:
string s1 = “this is only a simple test";
所以当然不需要太多的时间了。但大家这里要注意的是,如果你的字符串是来自另外的 string 对象的话,速度就没那么快了,譬如:
string s2 = "this is only a"; string s3 = "simple"; string s4 = "test"; string s1 = s2 +s3 + s4;
这时候 jvm 会规规矩矩的按照原来的方式去做。
四、深入jvm的优化处理
真的会有上面的性能代价么,字符串拼接这么常用,没有特殊的处理优化么,答案是有的,这个优化进行在jvm编译.java到bytecode时。
一个java程序如果想运行起来,需要经过两个时期,编译时和运行时。在编译时,java jvm(compiler)将java文件转换成字节码。在运行时,java虚拟机(jvm)运行编译时生成的字节码。通过这样两个时期,java做到了所谓的一处编译,处处运行。
我们实验一下编译期都做了哪些优化,我们制造一段可能会出现性能代价的代码。
public class concatenation { public static void main(string[] args) { string username = "andy"; string age = "24"; string job = "developer"; string info = username + age + job; system.out.println(info); } }
对concatenation.java进行编译一下。得到concatenation.class
javac concatenation.java
然后我们使用javap反编译一下编译出来的concatenation.class文件。javap -c concatenation。如果没有找到javap命令,请考虑将javap所在目录加入环境变量或者使用javap的完整路径。
17:22:04-androidyue~/workspace_adt/strings/src$ javap -c concatenation compiled from "concatenation.java" public class concatenation { public concatenation(); code: 0: aload_0 1: invokespecial #1 // method java/lang/object."<init>":()v 4: return public static void main(java.lang.string[]); code: 0: ldc #2 // string andy 2: astore_1 3: ldc #3 // string 24 5: astore_2 6: ldc #4 // string developer 8: astore_3 9: new #5 // class java/lang/stringbuilder 12: dup 13: invokespecial #6 // method java/lang/stringbuilder."<init>":()v 16: aload_1 17: invokevirtual #7 // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder; 20: aload_2 21: invokevirtual #7 // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder; 24: aload_3 25: invokevirtual #7 // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder; 28: invokevirtual #8 // method java/lang/stringbuilder.tostring:()ljava/lang/string; 31: astore 4 33: getstatic #9 // field java/lang/system.out:ljava/io/printstream; 36: aload 4 38: invokevirtual #10 // method java/io/printstream.println:(ljava/lang/string;)v 41: return }
其中,ldc,astore等为java字节码的指令,类似汇编指令。后面的注释使用了java相关的内容进行了说明。 我们可以看到上面有很多stringbuilder,但是我们在java代码里并没有显示地调用,这就是javajvm做的优化,当javajvm遇到字符串拼接的时候,会创建一个stringbuilder对象,后面的拼接,实际上是调用stringbuilder对象的append方法。这样就不会有我们上面担心的问题了。
五、仅靠jvm优化?
既然jvm帮我们做了优化,是不是仅仅依靠jvm的优化就够了呢,当然不是。
下面我们看一段未优化性能较低的代码
public void implicitusestringbuilder(string[] values) { string result = ""; for (int i = 0 ; i < values.length; i ++) { result += values[i]; } system.out.println(result); }
使用javac编译,使用javap查看
public void implicitusestringbuilder(java.lang.string[]); code: 0: ldc #11 // string 2: astore_2 3: iconst_0 4: istore_3 5: iload_3 6: aload_1 7: arraylength 8: if_icmpge 38 11: new #5 // class java/lang/stringbuilder 14: dup 15: invokespecial #6 // method java/lang/stringbuilder."<init>":()v 18: aload_2 19: invokevirtual #7 // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder; 22: aload_1 23: iload_3 24: aaload 25: invokevirtual #7 // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder; 28: invokevirtual #8 // method java/lang/stringbuilder.tostring:()ljava/lang/string; 31: astore_2 32: iinc 3, 1 35: goto 5 38: getstatic #9 // field java/lang/system.out:ljava/io/printstream; 41: aload_2 42: invokevirtual #10 // method java/io/printstream.println:(ljava/lang/string;)v 45: return
其中8: if_icmpge 38 和35: goto 5构成了一个循环。8: if_icmpge 38的意思是如果jvm操作数栈的整数对比大于等于(i < values.length的相反结果)成立,则跳到第38行(system.out)。35: goto 5则表示直接跳到第5行。
但是这里面有一个很重要的就是stringbuilder对象创建发生在循环之间,也就是意味着有多少次循环会创建多少个stringbuilder对象,这样明显不好。赤裸裸地低水平代码啊。
稍微优化一下,瞬间提升逼格。
public void explicitusestringbuider(string[] values) { stringbuilder result = new stringbuilder(); for (int i = 0; i < values.length; i ++) { result.append(values[i]); } }
对应的编译后的信息
public void explicitusestringbuider(java.lang.string[]); code: 0: new #5 // class java/lang/stringbuilder 3: dup 4: invokespecial #6 // method java/lang/stringbuilder."<init>":()v 7: astore_2 8: iconst_0 9: istore_3 10: iload_3 11: aload_1 12: arraylength 13: if_icmpge 30 16: aload_2 17: aload_1 18: iload_3 19: aaload 20: invokevirtual #7 // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder; 23: pop 24: iinc 3, 1 27: goto 10 30: return
从上面可以看出,13: if_icmpge 30和27: goto 10构成了一个loop循环,而0: new #5位于循环之外,所以不会多次创建stringbuilder.
总的来说,我们在循环体中需要尽量避免隐式或者显式创建stringbuilder. 所以那些了解代码如何编译,内部如何执行的人,写的代码档次都比较高。
六、结论
在大部分情况下 stringbuffer > string
java.lang.stringbuffer是线程安全的可变字符序列。一个类似于 string 的字符串缓冲区,但不能修改。虽然在任意时间点上它都包含某种特定的字符序列,但通过某些方法调用可以改变该序列的长度和内容。在程序中可将字符串缓冲区安全地用于多线程。而且在必要时可以对这些方法进行同步,因此任意特定实例上的所有操作就好像是以串行顺序发生的,该顺序与所涉及的每个线程进行的方法调用顺序一致。
stringbuffer 上的主要操作是 append 和 insert 方法,可重载这些方法,以接受任意类型的数据。每个方法都能有效地将给定的数据转换成字符串,然后将该字符串的字符追加或插入到字符串缓冲区中。append 方法始终将这些字符添加到缓冲区的末端;而 insert 方法则在指定的点添加字符。
例如,如果 z 引用一个当前内容是“start”的字符串缓冲区对象,则此方法调用 z.append(“le”) 会使字符串缓冲区包含“startle”(累加);而 z.insert(4, “le”) 将更改字符串缓冲区,使之包含“starlet”。
在大部分情况下 stringbuilder > stringbuffer
java.lang.stringbuilder一个可变的字符序列是java 5.0新增的。此类提供一个与 stringbuffer 兼容的 api,但不保证同步,所以使用场景是单线程。该类被设计用作 stringbuffer 的一个简易替换,用在字符串缓冲区被单个线程使用的时候(这种情况很普遍)。如果可能,建议优先采用该类,因为在大多数实现中,它比 stringbuffer 要快。两者的使用方法基本相同。
上一篇: 利用Java计算某个日期是星期几
下一篇: java equals和==的区别详解
推荐阅读
-
详细分析Java中String、StringBuffer、StringBuilder类的性能
-
深入剖析java中String、StringBuffer、StringBuilder的区别
-
java实现利用String类的简单方法读取xml文件中某个标签中的内容
-
详细分析Java中String、StringBuffer、StringBuilder类的性能
-
从内存方面解释Java中String与StringBuilder的性能差异
-
深入剖析java中String、StringBuffer、StringBuilder的区别
-
JAVA中String类与StringBuffer类的区别
-
java实现利用String类的简单方法读取xml文件中某个标签中的内容
-
JAVA中String类与StringBuffer类的区别
-
浅谈java中String与StringBuffer的不同