欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

StringBuilder StringBuffer --阅读源码从jdk开始

程序员文章站 2022-04-22 20:29:06
...

引言

 

最近我的同事分享了一个页面渲染过程中,字符串拼接的优化处理。我们系统的页面渲染是分模块渲染,每个模块渲染完成后都是一个String型的html片段,最终我们需要把所有模块的html片段拼接成一个完整html页面。老代码逻辑大致如下:

        List<String> moudleHtmls = new ArrayList<>(moduleSize);
        for(int i=0;i<moduleSize;i++){
            String tempHtml = null;
            //模块内容渲染 省略代码
            moudleHtmls.set(i, tempHtml);//把每个模块html片段放入List
        }
       
        String pageString="";
        for (int i=0;i <moduleSize; i++){
            pageString+=moudleHtmls.get(i);//遍历把所有模块的html片段拼接成一个页面
        }

通过反编译发现第二个for循环,每次拼接操作都会自动生成一个StringBuilder对象,反编译的代码如下(第二个for循环部分):

        String pageString="";
        for (int i=0;i <moduleSize; i++){
            pageString=new StringBuilder().append(pageString).append(moudleHtmls.get(i)).toString();
        }
 

 

每次for循环都会生成一个StringBuilder,其默认容量为16,超过16又需要自动扩容(后面源码详细讲解),势必会影响性能。改进后的代码如下:

StringBuilder pageString = new StringBuilder(pageTemplate.length * 2);//预估页面长度
for (int i=0;i <moduleSize; i++){
            pageString.append(moudleHtmls.get(i));//遍历把所有模块的html片段拼接成一个页面
        }

通过对比发现改造后的拼接性能大幅提升。我们系统每天都有上百万次的页面渲染,这个小小的改动带来的收益是可想而知的。

为了对StringBuilder有更深入的了解,决定阅读其相关源码,做一次全面的总结。

 

字符串连接的三种方式

 

1、字符串连接操作符(+),是把多个字符串合并为一个字符串的便利途径。

2 StringBuilder,创建该类对象,调用其append方法实现字符串连接,从jdk1.5开始支持。

3StringBuffer,用法和StringBuilder相同,从jdk1.0就开始支持。

 

通过阅读源码发现StringBuilderStringBuffer都是继承自AbstractStringBuilder,方式实现也是基本相同,只是StringBuffer的每个方式都是synchronized修饰的,也就是说StringBuffer适合使用在多线程并发环境下的字符串拼接。单线程环境下使用StringBuilder的性能会更好些。

 

String t=“123”+“456”

这种方式每次执行,本质上是创建一个新String,然后把两个String的的内容复制到这个新String,性能非常差。但从jdk1.5开始,该操作做了优化,执行过程中会自动new 一个StringBuilder,真实的执行过程变为:String t=new StringBuilder().append(“123”).append(“456”)

 

也就是说在拼接后的字符串总长度比较短的情况下(总长度不超过16),直接使用“(+)”符号拼接是最佳选择。

如果拼接后的字符串总长度大于16,最好新建一个指定预估容量的StringBuilder,调用其append方法进行拼接。如上述优化中:

StringBuilder pageString = new StringBuilder(pageTemplate.length * 2);//预估页面长度

 

另外如果在for循环中也不建议直接使用(+)操作,因为这会导致每次循环都会新创建一个StringBuilder,如上述优化中主要就是优化这个问题。

 

为什么要指定StringBuilder容量,其实跟ArrayListHashMap等原理相同,都存在自动扩容的问题,看下源码就一目了然。

 

StringBuilderStringBufferAbstractStringBuilder 源码解析

 

StringBuilderStringBuffer都是继承自AbstractStringBuilder抽象类,每个方法的实现基本相同,都是调用AbstractStringBuilder中的方法。唯一的差异,就是toString方法,方法也是AbstractStringBuilder中唯一的抽象方法。

 

成员变量是一个char性的数组,StringBuilderStringBuffer的所有操作基本都是围绕这个数组进行:

char[] value;//在AbstractStringBuilder中定义

该字符数组在StringBuilderStringBuffer的初始默认容量都是16,方法操作完全相同,以StringBuilder为例:

//默认构造方法
public StringBuilder() {
        super(16);//默认容量
}
//指定容量构造方法
public StringBuilder(int capacity) {
        super(capacity);
}
//指定初始字符串构造方法
public StringBuilder (String str) {
        super(str.length() + 16); //初始容量为字符串长度+16
        append(str);
}

 

这里通过super调用AbstractStringBuilder的构造方法:

AbstractStringBuilder(int capacity) {
        value = new char[capacity];//指定数组容量,初始化字节数组
}

 

成员变量字节数组value初始化完成。

 

append系列重载方法

 

AbstractStringBuilder中的append系列重载方法(StringBuilderStringBuffer 中的append方法通过super直接调用该系列方法),是其核心方法,可以处理处理所有的基础类型(比如booleanintlongdouble等)、引用类型的拼接(StringObjectAbstractStringBuilder自身等),这里以用得最多的append(String)进行讲解:

public AbstractStringBuilder append(String str) {
        if (str == null)
            return appendNull();//注意如果为str为null,会拼接一个"null"字符串
        int len = str.length();
        ensureCapacityInternal(count + len);//判断容量是否足够,如不够先扩容,再copy到新扩容后的数组
        str.getChars(0, len, value, count);//把str copy到 字符数组中
        count += len;//重新计算字符数组总长度
        return this;
    }
 
private void ensureCapacityInternal(int minimumCapacity) {
        // overflow-conscious code
        if (minimumCapacity - value.length > 0)
            expandCapacity(minimumCapacity);//容量不够,进行扩容
    }
   
    void expandCapacity(int minimumCapacity) {
        int newCapacity = value.length * 2 + 2;//扩容两倍 + 2
        if (newCapacity - minimumCapacity < 0)
            newCapacity = minimumCapacity;
        if (newCapacity < 0) {//溢出处理
            if (minimumCapacity < 0) // overflow
                throw new OutOfMemoryError();
            newCapacity = Integer.MAX_VALUE;
        }
        value = Arrays.copyOf(value, newCapacity); //把老数据复制到扩容后的新数组。
    }
 

 

StringBuilderStringBuffer的字符串拼接,实际上就是把待拼接的字符串,放到自己的字符数组,如果字符数组的容量不够,需要进行扩容。具体操作是新创建一个字符数组(容量为老数组的2+2),再把老数组中的内容copy到新数组。这就是为什么在拼接大量字符串(拼接后超过长度16),最好采用指定容量的方式创建StringBuilder(或StringBuffer),防止拼接过程中不断扩容带来的性能消耗。

 

toString方法

 

需要注意的是StringBuilderStringBuffer不是String类型,不能强制转换。只能通过调用其toString方法转换为String。前面已经提到StringBuilderStringBuffer重要区别就是toString方法的实现不同。

StringBuildertoString方法,采用自己成员变量value字符数组新建一个String

@Override
    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
}
 

StringBuffertoString方法:

public synchronized String toString() {
        if (toStringCache == null) {
            toStringCache = Arrays.copyOfRange(value, 0, count);//缓存成员变量value字符数组
        }
        return new String(toStringCache, true);
}
 

 

其中toStringCache主要用作缓存。当StringBuffer对成员变量value字符数组有修改时,需要先清理缓存,如StringBuffer append(String)方法实现:

@Override
    public synchronized StringBuffer append(String str) {
        toStringCache = null;//清理缓存
        super.append(str);//调用父类AbstractStringBuilder的append方法
        return this;
    }
 

 

再来看下StringBuilderappend(String)方法实现:

@Override
    public StringBuilder append(String str) {
        super.append(str);
        return this; //调用父类AbstractStringBuilder的append方法
}
 

 

区别有两点:

1StringBuffer的方法是synchronized修饰。

2StringBuffer的方法需要清理缓存。

StringBuilderStringBufferappend系列方法不再一一讲解,具体操作都差不多,把待拼接类型转换中字符,依次放到其成员变量value字符数组中。

 

其他方法:

 

AbstractStringBuilderdelete方法,本质上也是对字符数组的copy操作:

public AbstractStringBuilder delete(int start, int end) {
        if (start < 0)
            throw new StringIndexOutOfBoundsException(start);
        if (end > count)
            end = count;
        if (start > end)
            throw new StringIndexOutOfBoundsException();
        int len = end - start;
        if (len > 0) {
            System.arraycopy(value, start+len, value, start, count-end);//本质上先复制到一个临时数组,再覆盖原数组 无内存泄漏问题
            count -= len;
        }
        return this;
    }
 

 

AbstractStringBuilderinsert系列方法,这里以String为例:

public AbstractStringBuilder insert(int offset, String str) {
        if ((offset < 0) || (offset > length()))
            throw new StringIndexOutOfBoundsException(offset);
        if (str == null)
            str = "null";
        int len = str.length();
        ensureCapacityInternal(count + len);//确认容量
        System.arraycopy(value, offset, value, offset + len, count - offset);//通过复制预留出待插入空间
        str.getChars(value, offset);//copy字符串 到指定开始位置
        count += len;
        return this;
    }

 

举个列子:“hello!”字符串中插入“pig”字符串,形成“hellopig!”, java代码如下:

StringBuilder sb = new StringBuilder;
sb.append(“hello!”)
sb.insert(4,“pig”);

对应的示意图:


StringBuilder StringBuffer --阅读源码从jdk开始
            
    
    博客分类: java基础 StringBufferStringBuilder 
 

 

AbstractStringBuilderreverse方法,本质上就是把字符数组里每个字符反序排列,不在累述。

 

最后总结下:

1、拼接完成的字符串长度短的情况下,直接使用(+)操作符即可:如String t = “123”+”456”

2、不要在for循环中使用(+)操作符,使用StringBuilder代替。

3、单线程环境下,使用StringBuilder拼接一个比较长的字符串,最好先预估容量,采用指定容量的StringBuilder构造方法,构造StringBuilder实例。

4、多线程环境下使用StringBuffer

 

 

  • StringBuilder StringBuffer --阅读源码从jdk开始
            
    
    博客分类: java基础 StringBufferStringBuilder 
  • 大小: 87.1 KB