字节字符转换流

程序员文章站 2022-04-30 20:35:26

...

一基本概念

1、认识文本和文本文件

java的文本（char）是16位无符号，是字符的unicode编码（双字节编码）

文件是byte byte byte 的数据序列

文本文件是文本（char）序列按照某种编码方案（utf-8，utf-16be，gbk）序列化为byte的存储结果。

2、字符流（Reader Writer）---操作的都是文本文件

字符的处理：一次处理一个字符

字符的底层任然是基本的字节序列

3、字符流的基本实现

InputStreamReader完成byte流解析未char流，按照编码解析

OutputStreamWriter 提供完成char流到byte流，按照编码处理

4、UE编码查看方法

UltraEdit-32的状态栏可以显示文件的编码类型，详细情况如下：

5、Myeclipse编码查看方法

Project->Property->Resource

二实例

package com.imooc.io;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;

public class IsrAndOswDemo {
	public static void main(String[] args)throws IOException {
		FileInputStream in = new FileInputStream("e:\\javaio\\test2.txt");
		InputStreamReader isr = new InputStreamReader(in,"utf-8");//默认项目的编码,操作的时候，要写文件本身的编码格式
	
		FileOutputStream out = new FileOutputStream("e:\\javaio\\test1.txt");
		OutputStreamWriter osw = new OutputStreamWriter(out,"utf-8");
		/*int c ;
		while((c = isr.read())!=-1){
			System.out.print((char)c);
		}*/
		char[] buffer = new char[8*1024];
		int c;
		/*批量读取，放入buffer这个字符数组，从第0个位置开始放置，最多放buffer.length个
		  返回的是读到的字符的个数
		*/
		while(( c = isr.read(buffer,0,buffer.length))!=-1){
			String s = new String(buffer,0,c);
			System.out.print(s);
			osw.write(buffer,0,c);
			osw.flush();
		}
		isr.close();
		osw.close();
		
	}

}

三运行结果

中国1jd

四说明

用UE创建的utf-8和用myeclipse创建的utf-8，文件大小不一样，该程序是用myeclipse创建的utf-8进行测试的。

五 utf-8无bom和utf-8什么区别

utf-8+bom比utf-8多了三个字节前缀:0xEF0xBB0xBF，有这三个字节前缀的文本或字符串，程序可以自动判断它为utf-8格式，并按照utf-8格式来解析文本或字符串，否则，一个文本或者字符串在未知编码的情况下，需要按照字符编码规范去一个个验证

六 utf-8编码说明

https://baike.baidu.com/item/UTF-8/481798?fr=aladdin

七编码实例

打开”记事本“程序Notepad.exe，新建一个文本文件，内容就是一个”严“字，依次采用ANSI，Unicode，Unicode big endian 和 UTF-8编码方式保存。

然后，用文本编辑软件UltraEdit中的”编辑-十六进制函数“，观察该文件的内部编码方式。

1）ANSI：文件的编码就是两个字节“D1 CF”，这正是“严”的GB2312编码，这也暗示GB2312是采用大头方式存储的。

2）Unicode：编码是四个字节“FF FE 25 4E”，其中“FF FE”表明是小头方式存储，真正的编码是4E25。

3）Unicode big endian：编码是四个字节“FE FF 4E 25”，其中“FE FF”表明是大头方式存储。

4）UTF-8：编码是六个字节“EF BB BF E4 B8 A5”，前三个字节“EF BB BF”表示这是UTF-8编码，后三个“E4B8A5”就是“严”的具体编码，它的存储顺序与编码顺序是一致的。

字节字符转换流

提供一个Java字符串转整型数组的方法

整型转字符串判断是否为指定长度内字符串的php函数

字符串转 list集合

【转】MySQL中GRANT权限的时分特殊字符转义

php中的fread和fgetc获取文件内容的单位是字节还是字符，为什么fgetc读取不到字符？

js获取提交的字符串的字节数代码示例

Java 字符串转float运算 float转字符串的方法

html5转义字符有吗

java 如何实现一个字符串的反转 (转自网络）

从字符串中截取等长字节的Java代码

字节字符转换流

提供一个Java字符串转整型数组的方法

整型转字符串 判断是否为指定长度内字符串的php函数

字符串转 list集合

【转】MySQL中GRANT权限的时分特殊字符转义

php中的fread和fgetc获取文件内容的单位是字节还是字符，为什么fgetc读取不到字符？

js获取提交的字符串的字节数代码示例

Java 字符串转float运算 float转字符串的方法

html5转义字符有 吗

java 如何实现一个字符串的反转 (转自网络）

从字符串中截取等长字节的Java代码

整型转字符串判断是否为指定长度内字符串的php函数

html5转义字符有吗