编码与解码的java展示以及乱码的原因总结
程序员文章站
2024-03-13 09:22:27
...
因为计算机只识别二进制数,所以编码与解码可以理解为以下
编码
字符 -->字节 (是字符转字节的过程)
解码
字节–>字符(是字节转字符的过程)
乱码的原因:
①字符集不统一
public class Main {
public static void main(String[] args) throws UnsupportedEncodingException {
String msg = "我对编程很感兴趣a";
//编码,字节数组
byte[] datas = msg.getBytes("GBK"); //字符串转字节,是编码的过程;其中getBytes()方法没有指明编码的格式所以默认是工程编码;
System.out.println(msg);
//解码:字符串String(byte[] bytes,int offset,int length,String charsetName)
msg = new String(datas,0,datas.length,"utf8");
System.out.println(msg);
}
}
以上例子以GBK进行编码,以utf8进行解码,编码与解码的字符集不统一,出现乱码
运行结果为
我对编程很感兴趣a
�ҶԱ�̺ܸ���Ȥa
②字符数不够
public class Main {
public static void main(String[] args) throws UnsupportedEncodingException {
String msg = "我对编程很感兴趣";
//编码,字节数组
byte[] datas = msg.getBytes("GBK"); //字符串转字节,是解码的过程;其中getBytes()方法没有指明编码的格式所以默认是工程编码;
System.out.println(msg);
//解码:字符串String(byte[] bytes,int offset,int length,String charsetName)
msg = new String(datas,0,datas.length-1,"GBK");
System.out.println(msg);
}
}
输出结果为
我对编程很感兴趣
我对编程很感兴�
由于解码长度影响了最后一个字符的解码
(注意:utf-8编码中一个中文字符占3个字节
一个字母占一个字节。而GBK编码方式中一个中文字符占2个字节,一个字母占一个字节。)
最近在学客户端与服务器交互之间数据传输之间的问题要用到这一块知识,借此总结一下,哈哈!
上一篇: 轻松掌握Java建造者模式
推荐阅读