欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

java中编码问题的处理方案

程序员文章站 2024-03-05 14:30:54
首先我使用的开发环境是eclipse.创建一个java project默认的编码则为gbk,如图: 下面便是具体代码: import java.io.uns...

首先我使用的开发环境是eclipse.创建一个java project默认的编码则为gbk,如图:

java中编码问题的处理方案

下面便是具体代码:

import java.io.unsupportedencodingexception;

public class demo1 {
  public static void main(string[] args) throws unsupportedencodingexception {
    string s = "我爱abc";
    byte[] bytes1 = s.getbytes("gbk");//不写编码,则使用平台的默认字符集将此 string 编码为 byte序列,并返回byte[].
    //s.getbytes(charset charset) 使用给定的charset将此string编码到byte序列;
    //返回的是一个byte[]字节数组
    
    for(byte b: bytes1){
      system.out.print(integer.tohexstring(b&0xff)+" ");
      //integer.tohexstring(int i)以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式
    }
    //gbk编码中文占有两个字节,英文占有一个字节
    system.out.println();
    byte[] bytes2 = s.getbytes("utf-8");
    for(byte b: bytes2){
      system.out.print(integer.tohexstring(b&0xff)+" ");
    }
    //utf-8编码 中文占有三个字节,英文占有一个字节
    system.out.println();
    //java是双字节编码 --->utf-16be >> 中文和英文都占有两个字节
    byte[] bytes3 = s.getbytes("utf-16be");
    for(byte b: bytes3){
      system.out.print(integer.tohexstring(b&0xff)+" ");
    }
    
    /*当你的字节序列是某种编码时,这个时候想把字节序列变成
     *字符串,也需要用这种编码方式,否则会出现乱码
     * */
    system.out.println();
    string str1 = new string(bytes3);//用项目默认的编码即(gbk编码) ----->> bytes3在上面定义成“utf-16be”的编码了,所以会出现乱码
    system.out.println(str1);
    system.out.println();
    
    string str2 = new string(bytes3,"utf-16be");
    system.out.println(str2);
    
   /*
    * 文本文件就是字节序列
    * 可以是任意编码的字节序列
    * 如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码
    * 
   */  
  }
}

打印的结果:

java中编码问题的处理方案

总的来说,编码必须对应,不然会出现乱码。