欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

详细分析Java中String、StringBuffer、StringBuilder类的性能

程序员文章站 2024-03-11 15:39:01
我们先要记住三者的特征: string 字符串常量 stringbuffer 字符串变量(线程安全) stringbuilder 字符串变量(非线程安...

我们先要记住三者的特征:

  • string 字符串常量
  • stringbuffer 字符串变量(线程安全)
  • stringbuilder 字符串变量(非线程安全)

一、定义
查看api会发现,string、stringbuffer、stringbuilder都实现了 charsequence接口,虽然它们都与字符串相关,但是其处理机制不同。

  • string:是不可改变的量,也就是创建后就不能在修改了。
  • stringbuffer:是一个可变字符串序列,它与string一样,在内存中保存的都是一个有序的字符串序列(char类型的数组),不同点是stringbuffer对象的值都是可变的。
  • stringbuilder:与stringbuffer类基本相同,都是可变字符换字符串序列,不同点是stringbuffer是线程安全的,stringbuilder是线程不安全的。 在性能方面,由于string类的操作是产生新的string对象,而stringbuilder和stringbuffer只是一个字符数组的扩容而已,所以string类的操作要远慢于stringbuffer和stringbuilder。

二、使用场景
使用string类的场景:在字符串不经常变化的场景中可以使用string类,例如常量的声明、少量的变量运算。
使用stringbuffer类的场景:在频繁进行字符串运算(如拼接、替换、删除等),并且运行在多线程环境中,则可以考虑使用stringbuffer,例如xml解析、http参数解析和封装。
使用stringbuilder类的场景:在频繁进行字符串运算(如拼接、替换、和删除等),并且运行在单线程的环境中,则可以考虑使用stringbuilder,如sql语句的拼装、json封装等。

三、分析
简要的说, string 类型和 stringbuffer 类型的主要性能区别其实在于 string 是不可变的对象, 因此在每次对 string 类型进行改变的时候其实都等同于生成了一个新的 string 对象,然后将指针指向新的 string 对象。所以经常改变内容的字符串最好不要用 string ,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后, jvm 的 gc 就会开始工作,那速度是一定会相当慢的。

而如果是使用 stringbuffer 类则结果就不一样了,每次结果都会对 stringbuffer 对象本身进行操作,而不是生成新的对象,再改变对象引用。所以在一般情况下我们推荐使用 stringbuffer ,特别是字符串对象经常改变的情况下。而在某些特别情况下, string 对象的字符串拼接其实是被 jvm 解释成了 stringbuffer 对象的拼接,所以这些时候 string 对象的速度并不会比 stringbuffer 对象慢,而特别是以下的字符串对象生成中, string 效率是远要比 stringbuffer 快的:

string s1 = “this is only a" + “ simple" + “ test";
stringbuffer sb = new stringbuilder(“this is only a").append(“ simple").append(“ test");

你会很惊讶的发现,生成 string s1 对象的速度简直太快了,而这个时候 stringbuffer 居然速度上根本一点都不占优势。其实这是 jvm 的一个把戏,在 jvm 眼里,这个

string s1 = “this is only a" + “ simple" + “test"; 

其实就是:

string s1 = “this is only a simple test";

所以当然不需要太多的时间了。但大家这里要注意的是,如果你的字符串是来自另外的 string 对象的话,速度就没那么快了,譬如:

string s2 = "this is only a";
string s3 = "simple";
string s4 = "test";
string s1 = s2 +s3 + s4;

这时候 jvm 会规规矩矩的按照原来的方式去做。

四、深入jvm的优化处理
真的会有上面的性能代价么,字符串拼接这么常用,没有特殊的处理优化么,答案是有的,这个优化进行在jvm编译.java到bytecode时。

一个java程序如果想运行起来,需要经过两个时期,编译时和运行时。在编译时,java jvm(compiler)将java文件转换成字节码。在运行时,java虚拟机(jvm)运行编译时生成的字节码。通过这样两个时期,java做到了所谓的一处编译,处处运行。

我们实验一下编译期都做了哪些优化,我们制造一段可能会出现性能代价的代码。

public class concatenation {
 public static void main(string[] args) {
   string username = "andy";
   string age = "24";
   string job = "developer";
   string info = username + age + job;
   system.out.println(info);
 }
}

对concatenation.java进行编译一下。得到concatenation.class

javac concatenation.java

然后我们使用javap反编译一下编译出来的concatenation.class文件。javap -c concatenation。如果没有找到javap命令,请考虑将javap所在目录加入环境变量或者使用javap的完整路径。

17:22:04-androidyue~/workspace_adt/strings/src$ javap -c concatenation
compiled from "concatenation.java"
public class concatenation {
 public concatenation();
  code:
    0: aload_0
    1: invokespecial #1         // method java/lang/object."<init>":()v
    4: return    

 public static void main(java.lang.string[]);
  code:
    0: ldc      #2         // string andy
    2: astore_1
    3: ldc      #3         // string 24
    5: astore_2
    6: ldc      #4         // string developer
    8: astore_3
    9: new      #5         // class java/lang/stringbuilder
   12: dup
   13: invokespecial #6         // method java/lang/stringbuilder."<init>":()v
   16: aload_1
   17: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   20: aload_2
   21: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   24: aload_3
   25: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   28: invokevirtual #8         // method java/lang/stringbuilder.tostring:()ljava/lang/string;
   31: astore    4
   33: getstatic   #9         // field java/lang/system.out:ljava/io/printstream;
   36: aload     4
   38: invokevirtual #10         // method java/io/printstream.println:(ljava/lang/string;)v
   41: return
}

其中,ldc,astore等为java字节码的指令,类似汇编指令。后面的注释使用了java相关的内容进行了说明。 我们可以看到上面有很多stringbuilder,但是我们在java代码里并没有显示地调用,这就是javajvm做的优化,当javajvm遇到字符串拼接的时候,会创建一个stringbuilder对象,后面的拼接,实际上是调用stringbuilder对象的append方法。这样就不会有我们上面担心的问题了。

五、仅靠jvm优化?
既然jvm帮我们做了优化,是不是仅仅依靠jvm的优化就够了呢,当然不是。
下面我们看一段未优化性能较低的代码

public void implicitusestringbuilder(string[] values) {
 string result = "";
 for (int i = 0 ; i < values.length; i ++) {
   result += values[i];
 }
 system.out.println(result);
}

使用javac编译,使用javap查看

public void implicitusestringbuilder(java.lang.string[]);
  code:
    0: ldc      #11         // string 
    2: astore_2
    3: iconst_0
    4: istore_3
    5: iload_3
    6: aload_1
    7: arraylength
    8: if_icmpge   38
   11: new      #5         // class java/lang/stringbuilder
   14: dup
   15: invokespecial #6         // method java/lang/stringbuilder."<init>":()v
   18: aload_2
   19: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   22: aload_1
   23: iload_3
   24: aaload
   25: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   28: invokevirtual #8         // method java/lang/stringbuilder.tostring:()ljava/lang/string;
   31: astore_2
   32: iinc     3, 1
   35: goto     5
   38: getstatic   #9         // field java/lang/system.out:ljava/io/printstream;
   41: aload_2
   42: invokevirtual #10         // method java/io/printstream.println:(ljava/lang/string;)v
   45: return

其中8: if_icmpge 38 和35: goto 5构成了一个循环。8: if_icmpge 38的意思是如果jvm操作数栈的整数对比大于等于(i < values.length的相反结果)成立,则跳到第38行(system.out)。35: goto 5则表示直接跳到第5行。

但是这里面有一个很重要的就是stringbuilder对象创建发生在循环之间,也就是意味着有多少次循环会创建多少个stringbuilder对象,这样明显不好。赤裸裸地低水平代码啊。

稍微优化一下,瞬间提升逼格。

public void explicitusestringbuider(string[] values) {
 stringbuilder result = new stringbuilder();
 for (int i = 0; i < values.length; i ++) {
   result.append(values[i]);
 }
}

对应的编译后的信息

public void explicitusestringbuider(java.lang.string[]);
  code:
    0: new      #5         // class java/lang/stringbuilder
    3: dup
    4: invokespecial #6         // method java/lang/stringbuilder."<init>":()v
    7: astore_2
    8: iconst_0
    9: istore_3
   10: iload_3
   11: aload_1
   12: arraylength
   13: if_icmpge   30
   16: aload_2
   17: aload_1
   18: iload_3
   19: aaload
   20: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   23: pop
   24: iinc     3, 1
   27: goto     10
   30: return

从上面可以看出,13: if_icmpge 30和27: goto 10构成了一个loop循环,而0: new #5位于循环之外,所以不会多次创建stringbuilder.

总的来说,我们在循环体中需要尽量避免隐式或者显式创建stringbuilder. 所以那些了解代码如何编译,内部如何执行的人,写的代码档次都比较高。

六、结论
在大部分情况下 stringbuffer > string

java.lang.stringbuffer是线程安全的可变字符序列。一个类似于 string 的字符串缓冲区,但不能修改。虽然在任意时间点上它都包含某种特定的字符序列,但通过某些方法调用可以改变该序列的长度和内容。在程序中可将字符串缓冲区安全地用于多线程。而且在必要时可以对这些方法进行同步,因此任意特定实例上的所有操作就好像是以串行顺序发生的,该顺序与所涉及的每个线程进行的方法调用顺序一致。

stringbuffer 上的主要操作是 append 和 insert 方法,可重载这些方法,以接受任意类型的数据。每个方法都能有效地将给定的数据转换成字符串,然后将该字符串的字符追加或插入到字符串缓冲区中。append 方法始终将这些字符添加到缓冲区的末端;而 insert 方法则在指定的点添加字符。

例如,如果 z 引用一个当前内容是“start”的字符串缓冲区对象,则此方法调用 z.append(“le”) 会使字符串缓冲区包含“startle”(累加);而 z.insert(4, “le”) 将更改字符串缓冲区,使之包含“starlet”。

在大部分情况下 stringbuilder > stringbuffer

java.lang.stringbuilder一个可变的字符序列是java 5.0新增的。此类提供一个与 stringbuffer 兼容的 api,但不保证同步,所以使用场景是单线程。该类被设计用作 stringbuffer 的一个简易替换,用在字符串缓冲区被单个线程使用的时候(这种情况很普遍)。如果可能,建议优先采用该类,因为在大多数实现中,它比 stringbuffer 要快。两者的使用方法基本相同。