详解字节流和字符流
一、明确字符和字节的概念
字节:1 byte = 8 bit
字符:1 char = 2 byte = 16 bit(java默认)
在计算机硬件层面,1 bit 是数据最小的单位。但是在大多数情况下,1 bit 存储的信息太少,我们通常把 1 字节作为数据最小的基本单位。
而字符实际上也是对字节的一种包装,那为什么还需要引入字符?
对于西方世界,使用英语等语种的国家来说,1字节有 256个符号编码,对于26个英文字母加上常用的标点符号已经够用了。这就是常用的ASCII 码。
但是对于东方国家,中文,日文等文字,数量太多,1个字节根本没有办法表示所有的字符,所以引入了Unicode —— 统一编码,而这种编码的常规字符集就是使用2个字节,所以引入了字符的概念。
但是,从根本而言,一切都是字节流,字符流也是字节流的一种形式。
二、关于 java中字节流和字符流
2.1 字节流,字符流概念
Java中,读取数据时,字节流的数据存储单位是字节,会使用字节类型数组 byte[] 来保存数据,可以操作字节,字节数组。
而 字符流的存储单位是字符,使用字符类数组 char[] 来保存数据,可以操作字符,字符数组或字符串。
2.2 java中的字节流,字符流相关API
Java 的I/O库有两个分支:
- 面向字节流的InputSteam和OutputStream
- 面向字符的Reader 和 wirter
ByteArrayInputStream:把内存中的一个缓冲区作为 InputStream 使用 .
StringBufferInputStream: 把一个 String 对象作为 InputStream .
FileInputStream:把一个文件作为 InputStream ,实现对文件的读取操作
PipedInputStream :实现了 pipe 的概念,主要在线程中使用 . 管道输入流是指一个通讯管道的接收端。
一个线程通过管道输出流发送数据,而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。
SequenceInputStream :把多个 InputStream 合并为一个 InputStream . “序列输入流”类允许应用程序把几个输入流连续地合并起来,
并且使它们像单个输入流一样出现。每个输入流依次被读取,直到到达该流的末尾。
ByteArrayOutputStream : 把信息存入内存中的一个缓冲区中 . 该类实现一个以字节数组形式写入数据的输出流。
FileOutputStream: 文件输出流是向 File 或 FileDescriptor 输出数据的一个输出流。
PipedOutputStream: 管道输出流是指一个通讯管道的发送端。 一个线程通过管道输出流发送数据,
而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。
CharArrayReader :与 ByteArrayInputStream 对应此类实现一个可用作字符输入流的字符缓冲区
StringReader : 与 StringBufferInputStream 对应其源为一个字符串的字符流。
FileReader : 与 FileInputStream 对应
PipedReader :与 PipedInputStream 对应
CharArrayWrite : 与 ByteArrayOutputStream 对应
StringWrite :无与之对应的以字节为导向的 stream
FileWrite : 与 FileOutputStream 对应
PipedWrite :与 PipedOutputStream 对应
2.3 字符流,字节流API的使用
字节流示例
//字节流写文件
public static void writeFile(){
String str = "采用数据流方式(字节流)写文件!";
try{
BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("D://hello.txt",true));
//需要转化为字节
byte[] data = str.getBytes();
bos.write(data);
bos.close();
}catch (FileNotFoundException e){
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
//字节流读文件
public static void readFile(){
try {
BufferedInputStream bis = new BufferedInputStream(new FileInputStream("D://hello.txt"));
byte[] data = new byte[1024];
int n = -1;
while((n=bis.read(data,0,data.length))!=-1){
String str = new String(data,0,n,"UTF-8");
System.out.println(str);
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
字符流示例
//字符流写文件
public static void writeFile(){
File file = new File("D:\\hello.txt");
String str = " hello, everybody! welcome to the study of Java!";
try{
FileWriter fw = new FileWriter(file);
BufferedWriter bw = new BufferedWriter(fw);
bw.write(str);
bw.close();
fw.close();
}catch(IOException e){
e.printStackTrace();
}
}
//字符流读文件
public static void readerFile(){
File file = new File("D:\\hello.txt");
try{
BufferedReader br = new BufferedReader(new FileReader(file));
String str = null;
while( (str = br.readLine()) != null){
System.out.println(str);
}
br.close();
}catch(FileNotFoundException e){
e.printStackTrace();
}catch(IOException e){
e.printStackTrace();
}
}
三、字节流和字符流的区别
字节流和字符流的区别:
- 字节流在操作文件时,本身不会用到缓冲区(内存),是对文件本身直接操作的;而字符流在操作时是使用到缓冲区的。
- 字节流在操作文件时,即使不关闭资源(close)文件也能输出;字符流如果不是用close方法的话,则不会输出任何内容,说明字符流使用了缓冲区。且可以使用flush方法强制进行刷新缓冲区,此时在不close情况下也能输出内容。
- Reader类的read()方法返回类型是int,占两个字节,如果到达流的末尾,则返回-1;inputStream的read()方法虽然也返回int,打算面向字节流,占一个字节。因此对于超过一个字节的只能使用字符流来读取,如汉字。
- 处理方式不同;字节流:处理字节和字节数组成的二进制对象。
字符流:处理字符,字符数或字符串。
注:缓冲区是什么??
缓冲区可以理解为一段特殊的内存。
在某些情况下,如果程序频繁操作一个资源,则性能会很低,为了提升性能,可以将这部分数据暂时读入内存的一块区域,之后就可以直接从内存中读取数据,提升速度和性能。
四、使用场景判断
4.1 数据格式
- 二进制格式(不能确定是纯文本):字节流,InputStream、OutputStream及其子类。
- 纯文本格式(含中英文或其他编码方式):字符流,Reader,Writer及其子类。
4.2 数据来源
- 文件:字节流 FileInputStream,FileOutputStream;字符流 FileReader,FileWriter
- byte[]: 字节流 ByteArrayInputStream, ByteArrayOutputStream char[]:字符流
- CharArrayReader, CharArrayWriter String: 字节
- StringBufferInputStream, StringBufferOuputStream ;字符流 StringReader,StringWriter
- 网络数据流:字节流 InputStream, OutputStream;字符流 Reader, Writer
4.3 是否需要格式化输出
需要格式化输出的:PrintStream, PrintWriter
4.4 是否需要缓冲
需要缓冲:字节流 BufferedInputStream, BufferedOutputStream;字符流 BufferedReader, BufferedWriter
4.5 输入还是输出
- 输入:Reader, InputStream 类型的子类
- 输出:Writer, OutputStream 类型的子类
4.6 是否有流转化
- 字节到字符:InputStreamReader
- 字符到字节:OutputStreamWriter
4.7 特殊需要
- 对象输入输出:ObjectInputStream, ObjectOutputStream
- 进程间通信:PipedInputStream, PipedOutputStream, PipedReader, PipedWriter
- 合并输入: SequenceInputStream