java中编码问题的处理方案
程序员文章站
2024-03-05 14:30:54
首先我使用的开发环境是eclipse.创建一个java project默认的编码则为gbk,如图:
下面便是具体代码:
import java.io.uns...
首先我使用的开发环境是eclipse.创建一个java project默认的编码则为gbk,如图:
下面便是具体代码:
import java.io.unsupportedencodingexception; public class demo1 { public static void main(string[] args) throws unsupportedencodingexception { string s = "我爱abc"; byte[] bytes1 = s.getbytes("gbk");//不写编码,则使用平台的默认字符集将此 string 编码为 byte序列,并返回byte[]. //s.getbytes(charset charset) 使用给定的charset将此string编码到byte序列; //返回的是一个byte[]字节数组 for(byte b: bytes1){ system.out.print(integer.tohexstring(b&0xff)+" "); //integer.tohexstring(int i)以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式 } //gbk编码中文占有两个字节,英文占有一个字节 system.out.println(); byte[] bytes2 = s.getbytes("utf-8"); for(byte b: bytes2){ system.out.print(integer.tohexstring(b&0xff)+" "); } //utf-8编码 中文占有三个字节,英文占有一个字节 system.out.println(); //java是双字节编码 --->utf-16be >> 中文和英文都占有两个字节 byte[] bytes3 = s.getbytes("utf-16be"); for(byte b: bytes3){ system.out.print(integer.tohexstring(b&0xff)+" "); } /*当你的字节序列是某种编码时,这个时候想把字节序列变成 *字符串,也需要用这种编码方式,否则会出现乱码 * */ system.out.println(); string str1 = new string(bytes3);//用项目默认的编码即(gbk编码) ----->> bytes3在上面定义成“utf-16be”的编码了,所以会出现乱码 system.out.println(str1); system.out.println(); string str2 = new string(bytes3,"utf-16be"); system.out.println(str2); /* * 文本文件就是字节序列 * 可以是任意编码的字节序列 * 如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码 * */ } }
打印的结果:
总的来说,编码必须对应,不然会出现乱码。
推荐阅读
-
java中编码问题的处理方案
-
深入剖析Java中的各种异常处理方式
-
使用C#处理WebBrowser控件在不同域名中的跨域问题
-
Java跨域问题的处理详解
-
java中URLEncoder.encode与URLDecoder.decode处理url特殊参数的方法
-
java中编码问题的处理方案
-
eclipse中的Java数组问题,求教
-
关于JAVA中TreeMap集合使用匿名内部类Comparetor自定制比较器排序无法序列化的问题
-
java中的connection reset 异常处理分析
-
sonar-scanner连接sonarquebe7的sonar.java.binaries问题的解决方案