tomcat6.0下 用Base64.decode解码 中文乱码如何处理
程序员文章站
2022-06-11 17:15:40
...
在tomcat6.0 下 Base64.decode() 解码的中文为什么是乱码,我的tomcat编码是utf-8:
而在javaIDE环境下运行,Base64.decode()解码的中文得出的是正常。有没有好的解决方案?
写道
public static String Base64ToStr(String s) {
if (s == null)
return null;
BASE64Decoder decoder = new BASE64Decoder();
try {
byte[] b = decoder.decodeBuffer(s);
return new String(b, "UTF-8");
} catch (Exception e) {
return null;
}
}
if (s == null)
return null;
BASE64Decoder decoder = new BASE64Decoder();
try {
byte[] b = decoder.decodeBuffer(s);
return new String(b, "UTF-8");
} catch (Exception e) {
return null;
}
}
Java 虽然是采用 Unicode 字符的。但是在网络通信中,都是采用字节进行传输的,由于在传输时并没有告之 tomcat 使用什么编码,那么 tomcat 就会使用 ISO8859-1 的编码格式进行传输。
举个例子吧,比如我们要传输的字符串是“劳动节快到了”,这个串的 GBK 编码为:
c0cd b6af bdda bfec b5bd c1cb (GBK 是采用两个字节的,这里采用空格进行了分隔)
在网络传输中是以 Big-Endian 方式传送的,也就是一个字节一个字节地传,依次会这样:
c0 cd b6 af bd da bf ec b5 bd c1 cb
在 tomcat 接收到这些字节时,并不知道该如何去组装这些字节,默认就使用一个字节编码的 ISO8859-1 进行编码,得出的字符为:
Java codeÀ Í ¶ ¯ ½ Ú ¿ ì µ ½ Á Ë
c0 cd b6 af bd da bf ec b5 bd c1 cb
上一篇: Linux下杀掉根据进程名批量杀进程
下一篇: Linux下杀掉根据进程名批量杀进程