java byte转string乱码（byte数组转字符串java）

程序员文章站 2023-11-24 11:23:28

一、string基础1、创建字符串方式string test = “abc”；string test = new string(“abc”);2、str...

一、string基础

1、创建字符串方式

string test = “abc”；
string test = new string(“abc”);

2、string类是不可变的

string类被final关键字修饰，意味着string类不能被继承，并且它的成员方法都默认为final方法；字符串一旦创建就不能再修改。
string实例的值是通过字符数组实现字符串存储的。

string类不可变的好处？

作为hashmap的键：因为string是不可变的，当创建string的时候哈希吗已经计算好了，所以每次在使用字符串的哈希码的时候就不用再计算一次，更高效。
线程安全：因为字符串是不可变的，所以一定是线程安全的，不用考虑多线程访问加锁的情况。
字符串常量池的需要。

3、string类常用方法

int length()：返回字符串的长度。

int indexof(int ch, int fromindex) / int indexof(string str, int fromindex)：该字符串中查找从fromindex开始第一次出现ch字符/str字符串的位置。

int lastindexof(int ch, int fromindex) / int lastindexof(string str, int fromindex)：查找ch字符/str字符串在该字符串最后一次出现的位置。

string substring(int beginindex, int endindex)：截取从beginindex(包含)到endindex（不包含）的字符串。

string trim()：去除字符串中的前后空格

boolean equals(object anobject)：重写object中的equals方法，字符串相同则返回true。

string tolowercase()：将字符串转换为小写。

string touppercase()：将字符串转换为大写。

char charat(int index)：获取字符串中指定位置的字符。

string[] split(string regex, int limit)：将字符串分割为子字符串，返回字符串数组。

string replace(char oldchar, char newchar)：把字符串序列中的oldchar替换为newchar。

byte[] getbytes()：将该字符串转为byte数组。

二、string高级

1、字符串常量池

字符串的分配和其他对象分配一样，是需要消耗高昂的时间和空间的，而且字符串使用的非常多。jvm为了提高性能和减少内存的开销，在实例化字符串的时候进行了一些优化：使用字符串常量池。每当创建字符串常量时，jvm会首先检查字符串常量池，如果该字符串已经存在常量池中，那么就直接返回常量池中的实例引用。如果字符串不存在常量池中，就会实例化该字符串并且将其放到常量池中。由于string字符串的不可变性，常量池中一定不存在两个相同的字符串。

字符串常量池在jdk1.7之前是存在方法去的，从1.7之后放到堆里面了。

2、string test = “abc”和new string(“abc”)区别

string test = “abc”：首先检查字符串常量池中是否存在此字符串，如果存在则直接返回字符串常量池中字符串的引用，如果不存在则添加此字符串进常量池然后返回此引用。

new string(“abc”)：直接在堆中创建字符串返回新创建字符串的引用，每次创建都是一个新的对象。

如下例子：

3、intern()方法

直接使用双引号创建出来的string对象会直接存储在字符串常量池中，new创建的的string对象，可以使用string提供的intern方法。intern 方法是一个native方法，intern方法会从字符串常量池中查询当前字符串是否存在，如果存在，就直接返回当前字符串；如果不存在就会将当前字符串放入常量池中，之后再返回。

如下例子：

4、+字符串拼接

使用“+”拼接字符串时，jvm会隐式创建stringbuilder对象，每一个拼接就会隐式创建一个stringbuilder对象，当大量字符串拼接时，就会有大量stringbuilder在堆内存中创建，肯定会造成效率的损失，所以一般大量字符串拼接建议用stringbuilder(线程不安全)或stringbuffer(线程安全)。

如下例子看一下两者效率：

运行输出：

从结果我们可以看到，10万次字符串的拼接用“+”的方式耗时13684毫秒，而stringbuilder拼接的话耗时1毫秒，效率是显而易见的。

当”+”两端均为编译期确定的字符串常量时，编译器会进行相应的优化，直接将两个字符串常量拼接好

看如下例子：

编译后class文件如下：

可见拼接的两个字符串如果是常亮则直接在编译器合并优化。

5、stringbuilder和stringbuffer拼接字符串

stringbuilder为了解决使用”+“大量拼接字符串时产生很多中间对象问题而提供的一个类，提供append和add方法，可以将字符串添加到已有序列的末尾或指定位置，实际上底层都是利用可修改的char数组(jdk 9 以后是 byte数组)来存储的，当前容量不足时触发扩容机制。

stringbuffer和stringbuilder的机制一样，唯一不同点是stringbuffer内部使用synchronized关键字来保证线程安全，保证线程安全不可避免的产生了一些额外的开销，如果不要求线程安全的情况下还是建议优先使用stringbuilder。

stringbuilder和stringbuffer都是继承abstractstringbuilder抽象类，里面实现了字符串拼接的具体逻辑，我们来看一下：

数据都是保存在char[]里面，当容量不足时进行数组的扩容：

从源码可以看到，当需要容量不足时触发扩容机制，扩容为原来的2倍+2的容量，最大数组扩容容量为：max_array_size = integer.max_value – 8，integer.max_value为2的31次方-1。扩容完后把老的数组里面的数据拷贝到新的数组里面。

6、string字符串长度限制

要回答这个问题要分两个阶段看，分别是编译期和运行期。不同的时期限制不一样。

编译期

我们所能想到的是string源码中定义，存储string字符的char数组最大是integer.max_value为2的31次方-1，那么也就是说可以存储2147483647个字符，分析到这时是不是以为大功告成了，其实不然，我们忽略了一点。

我们编译java文件为class文件的时候是把字符串放在class的常量池中的，jvm对常量池的容量有严格的限制，jvn规定，字符串是由constantutf8info类型的结构，constantutf8_info的定义如下：

其中u1、u2是无符号的分别代表1个字节和2个字节，那么我们只需要看length最多允许两个字节的长度，因此理论上允许的的最大长度是2^16=65536。而 java class 文件是使用一种变体utf-8格式来存放字符的，null 值使用两个字节来表示，因此只剩下 65536－ 2 ＝ 65534个字节。

所以，在java中，所有需要保存在常量池中的数据，长度最大不能超过65535，这当然也包括字符串的定义。

运行期

上面提到的这种string长度的限制是编译期的限制，也就是使用string str= “”;这种字面值方式定义的时候才会有的限制。

string在运行期的限制，其实就是我们前文提到的那个integer.max_value ，这个值约等于4g，在运行期，如果string的长度超过这个范围，就会抛出异常。

上一篇：世界十大最漂亮的猫优雅还是可爱，你喜欢哪种

下一篇： nes游戏模拟器哪个好用（最全的java游戏网站）

java byte转string乱码（byte数组转字符串java）

一、string基础

二、string高级

javabyte数组转string（java byte类型相加）