java 中的乱码问题汇总及解决方案
程序员文章站
2024-03-11 18:25:31
java中的乱码问题
最近做项目经常会遇到java中的乱码问题,于是就抽时间整理下出现乱码问题的...
java中的乱码问题
最近做项目经常会遇到java中的乱码问题,于是就抽时间整理下出现乱码问题的情况和如何处理,这里做了一个整理,
分析
编码与解码
编码就是将字符转为字节,解码就是就是将字节转换为字符。
字节流与字符流
对文件的读写操作都是通过字节流来实现的,即使java中有字符流,但是其底层仍然使用的字节流。
乱码问题出现
java中使用最频繁的是字符,当我们将文件读入内存并在控制台显示时(字节流--->字符流),就需要用到解码。如果文件是utf-8编码,而我们解码时错用成gbk(如果不指定编码,java会采取系统默认编码)来解码,那么只能显示乱码。而我们写文件时,最好指定编码(utf-8)。
解决方案
示例1
将字节流转换为字符流时,我们指定编码格式。这是我们文件也应该是gb2312编码
public static string read(string filename) throws exception { inputstream is = new fileinputstream(filename); bufferedreader in = new bufferedreader(new inputstreamreader(is, "gb2312")); //指定编码格式 string s; stringbuilder sb = new stringbuilder(); while ((s = in.readline()) != null) { sb.append(s + "\n"); } in.close(); return sb.tostring(); }
示例2
直接通过字节流读入,使用string转换为字符时,指定编码。
package com.dy.xidian; import java.io.fileinputstream; import java.io.inputstream; class bufferedinputfile { public static string read(string filename) throws exception { @suppresswarnings("resource") inputstream is = new fileinputstream(filename); byte[] b = new byte[1024]; is.read(b); return new string(b, "gb2312"); } } public class memoryinput { public static void main(string[] args) throws exception { string filename = "e:/html/gb2312.php"; string s = bufferedinputfile.read(filename); system.out.println(s); } }
陷阱
i/o操作中有个filereader类,这个类隐藏了字节流转为字符流的细节,我们可以这样使用。 bufferedreader in = new bufferedreader(new filereader(filename)); 这样,我们直接得到就是字符流了。但我们发现,我们并没有去设置编码,这是因为filereader中采用了默认编码方式。这就变得很危险了,如果其默认的编码格式和我们文件的编码不同,那么读出来的数据一定是乱码。所以我们最好采用示例中的方式来进行流的转换。
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
上一篇: asp.ne去除html的函数代码