欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

java big5到gb2312的编码转换

程序员文章站 2024-02-19 19:58:04
package com.big5toutf8; import java.io.*; public class big5tran { private static final...
package com.big5toutf8;
import java.io.*;
public class big5tran {
private static final string tabfile ="bg-gb.tab";
private static byte[] data;
static{
try{
fileinputstream fis =new fileinputstream(tabfile);
int len =fis.available();
data =new byte[len];
fis.read(data);
fis.close();
}catch(exception ex){
ex.printstacktrace();
system.exit(1);
}
}
/**
*取得big5汉字big在data中的偏移
*/
private static int indexof(int big){
int high =(big>>>8)&0xff;
int low =big&0xff;
high -= 0xa1;
if(low<=0x7e) low -= 0x40;
else low -= (0xa1 -0x7e -1) +0x40;
return 2*(high*157+low);
}
/**
*将保存在bs数字中的big5编码的字符串数据转换成gb2312编码的数据
*注意:此方法将更改原先存储的数据
*@param bs 需要转换的以big5编码的字符串数据
*@return bs 经过转换的数据,保存在参数中的byte数组中
*/
public static byte[] translatebig5togb(byte[] bs){
int index =0;
while(index<bs.length){
int high =bs[index]&0xff;
if(high>=0xa1&&high<=0xfe){
index ++;
if(index>=bs.length) break;
int low =bs[index]&0xff;
if(low<0x40||low>0xfe) continue;
if(low>0x7e&&low<0xa1) continue;
int offset =indexof((high<<8)|low);
bs[index-1] =data[offset];
bs[index ] =data[offset+1];
index++;
}
else index++;
}
return bs;
}
public static string translatebig5togb(string big){
string result =null;
try{
byte[] bs =big.getbytes("big5");
bs =translatebig5togb(bs);
result =new string(bs,"gb2312");
}catch(exception e){
}
return result;
}
}