欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

将文本文档的中文字符转换成对应的unicode编码

程序员文章站 2022-06-24 20:01:17
...
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;

public class ChineseToUnicode2 {
	/*txt必须为ANSI格式
	 * 本代码写出txt是刷新不是追加
	*/
public static void main(String[] args) throws IOException {
	StringBuffer buffer = new StringBuffer();
    BufferedReader bf= new BufferedReader(new FileReader("转换前.txt"));//txt必须为ANSI格式
    String s = null;
    while((s = bf.readLine())!=null){//使用readLine方法,一次读一行
        buffer.append(s.trim());
    }

String s1 = buffer.toString();		
char a1[]=s1.toCharArray();
StringBuffer returnStr = new StringBuffer();


 for (char e : a1) {
	if (isChinese(e)) {
	System.out.println(e);
	System.out.println("\\u" + Integer.toString(e, 16));
	returnStr.append("\\u" + Integer.toString(e, 16));
	
}else {
	returnStr.append(e);
}
}
File file = new File("转换后.txt");
FileWriter writer = null;
writer = new FileWriter(file);//加上true是追加
writer.append(returnStr);
writer.flush();
writer.close();
bf.close();}

//判断是否为中文
	public static boolean isChinese(char c) {
	    return String.valueOf(c).matches("[\u4e00-\u9fa5]");
	}
}