关于Java里面的字符串拼接,你了解多少?
程序员文章站
2022-06-21 09:06:24
...
# 关于Java里面的字符串拼接,你了解多少?
### 前言
字符串拼接是我们日常开发中很常见的操作,虽然常见,但要是使用不当的的话,很有可能让你的程序处理效率降低一大半,所以我们有必要来重新了解一下Java里面的字符串操作。
### 基础知识回顾
(1)关于字符串字面量
``` String text="我是攻城师1"; ```
上面的这行代码是我们最常见的声明方式,它会创建一个对象,并放在字符串常量池里面,关于常量池的内容,可以参考我之前的文章。
(2)关于new String
``` String text2=new String("我是攻城师2") ```
上面的这段代码是通过new的方式来创建字符串对象的,这里总共会产生2个对象,第一个是new创建的在堆内存里,第二个是字面量创建的在常量池里面。此外text2变量是在线程的栈里面,它只引用了堆里面的对象实例,这一点需要注意很多新手分不清楚他们之间的联系。
(3)关于String不可变性
Java的里面String类的有关操作,都会生成新的String实例,所以在大量修改操作时,应该使用可变的StringBuffer或者StringBuilder。
### 字符串拼接的几种方法
(1)使用 + 号
(2)使用字符串的concat方法
(3)StringBuffer的append方法
(4)StringBuilder的append方法
上面的四种就是Java里面所有的关于字符串拼接的方法,问题来了四种方法之间有什么区别?
* StringBuffer是线程安全的,StringBuilder是线程不安全的,大部分时候应该首选StringBuilder方法,它的字符串拼接效率最高,因为不会创建很多的String实例。
* +号与concat方法的:
首先+号是可以和各种类型拼接字符串的,而concat的参数必须是字符串类型,其次concat方法拼接null值是会抛空指针的,代码如下:
``` //DIFFERENCE 1 String a = null; String b = "foo"; String c = a + b; // c = nullfoo String d = b.concat(a); // 空指针 String e = a.concat(b); // 空指针 //DIFFERENCE 2 String x = "1" + 2; // x = 12 String y = "1".concat(2); // 编译错误 ```
最后,他们在底层处理机制上也不同:
``` String c ="a" + "b"; ```
上面的语句在编译的时候会转化成下面的代码:
``` c = new StringBuilder() .append("a") .append("b") .toString(); ```
注意上面的代码会涉及三次的new char[]数组分配和数组拷贝动作。
而同样的操作使用concat方法,则只会涉及一次的数组分组和数组拷贝:
``` String c=”a“.concat("b") ```
源码如下:
``` public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } int len = value.length; char buf[] = Arrays.copyOf(value, len + otherLen); str.getChars(buf, len); return new String(buf, true); } ```
### 字符串拼接的性能对比
下面我们分别对上面的四种方法在jdk8的mac系统上,进行1万次的拼接动作,看下性能表现,测试代码如下:
``` final int loop_count=10000; // 1 + String s1="s1"; long startTime=System.nanoTime(); for (int i = 0; i < loop_count; i++) { s1=s1+Integer.toString(i); } long duration=System.nanoTime()-startTime; System.out.println(" + cost: "+duration/1000+" 微秒 "); // 2 concat String s2="s2"; startTime=System.nanoTime(); for (int i = 0; i < loop_count; i++) { s2=s2.concat(Integer.toString(i)); } duration=System.nanoTime()-startTime; System.out.println(" concat cost: "+duration/1000+" 微秒 "); // 3 stringbuffer StringBuffer s3=new StringBuffer("s3"); startTime=System.nanoTime(); for (int i = 0; i < loop_count; i++) { s3.append(Integer.toString(i)); } duration=System.nanoTime()-startTime; System.out.println(" StringBuffer cost: "+duration/1000+" 微秒 "); // 4 stringbuilder StringBuilder s4=new StringBuilder("s4"); startTime=System.nanoTime(); for (int i = 0; i < loop_count; i++) { s4.append(Integer.toString(i)); } duration=System.nanoTime()-startTime; System.out.println(" StringBuilder cost: "+duration/1000+" 微秒 "); ```
结果输出如下:
``` + cost: 432673 微秒 concat cost: 49118 微秒 StringBuffer cost: 1011 微秒 StringBuilder cost: 734 微秒 ```
从上面的循环1万次拼接的结果来看+操作符在循环loop中拼接字符串最耗时,前两个结果与后两个结果完全不在一个量级上,因为前面的两种方法在每次循环时候都会生成一个新的String实例返回,而后面的两个则只需要最后使用一次,至于StringBuffer比StringBuilder耗时是因为前者是同步的方法,后者则不是。
### 总结
(1)在没有线程问题的情况下大量修改字符串优先考虑StringBuilder
(2)在有线程问题的情况下大量修改字符串优先考虑StringBuffer
(3)如果仅仅是两个字符串的拼接优先考虑String类的concat方法
(4)如果一次性拼接多个字符串,可以考虑使用非循环模式下的+号拼接
或者直接使用StringBuilder对象。
(5)最后还有一个不常用的方法String.join其内部用的是StringBuilder类,所以不再多说。
上一篇: 深入理解Java内存模型的语义