详解java之IO流常用操作-输入流
最近由于项目需要,经常需要进行IO操作,于是乎重新看了一下JDK1.7API文档,对IO流常用操作类进行了一番整理。
工作中实际经常使用的类无非是FileReader 、FileInputStream、InputStreamReader、BufferedReader类,因此下文对这几个主要的类进行讲解。
<1>首先,查看java.io包下的类层次结构,可以发现下面有两个抽象类:InputStream和Reader类。
image.png image.png其中,InputStream是表示字节输入流的所有类的超类。 Reader类是用于读取字符流的抽象类。
InputStream提供的是字节流的读取,读取出来的是byte数组,而非文本读取,而Reader读取出来的是char数组或者String ,这是他们的主要区别。
InputStream类
从类层次结构可以看出:
image.png
FileInputStream是InputStream类的一个子类,其主要功能是从文件系统中的某个文件中获取输入字节。
构造方法概要:
FileInputStream(File file):通过打开一个到实际文件的链接来创建一个FileInputStream对象,该文件通过文件系统中的File对象file指定。
FileInputStream(FileDescriptor fileDesc):通过使用文件描述符对象fileDesc创建一个FileInputStream,该文件描述符表示到文件系统中某个实际文件的链接。
FileInputStream(String fileName):通过打卡一个到实际文件的链接来创建一个FileInputStream,该文件通过文件系统中的路径名fileName指定。
Reader类
image.png从类层次结构中可以看出Reader类中主要有三个常用的类,分别是BufferedReader、InputStreamReader、FileReader。
BufferedReader用于从字符输入流读取文本,缓冲各个字符,从而实现字符、数组和行的高效读取。
构造方法概要:
BufferedReader(Reader in):创建一个使用默认大小输入缓冲区的缓冲字符输入流。
BufferedReader(Reader in, int size):创建一个使用指定大小输入缓冲区的缓冲字符输入流。
BufferedReader最大的特点就是缓冲区的设置。通常Reader所做的每个读取请求都会导致对底层字符或字节流进行相应的读取请求,如果没有缓冲,则每次调用read()或readLine()都会导致从文件中读取字节,并将其转换成字符后返回,效率极低。因此考虑读取效率问题,建议使用BufferedReader包装所有其read()操作可能开销很高的Reader(如FileReader 和 InputStreamReader)。
eg:BufferedReader br = new BufferedReader(new FileReader("test.in"))
InputStreamReader 是字节流通向字符流的桥梁,它使用指定的charset读取文件并将其解码为字符。它使用的字符集可以有名称指定或显示指定,或使用平台默认的额字符集。
构造方法概要:
InputStreamReader(InputStream in):创建一个使用默认的字符集的InputStreamReader.
InputStreamReader(InputStream in, Charset cs):创建使用指定的字符集的InputStreamReader。
InputStreamReader(InputStream in, CharsetDecoder dec):创建使用给定的字符集解码器的InputStreamReader.
InputStreamReader(InputStream in, String charsetName):创建使用指定字符集的InputStreamReader。
InputStreamReader最大的特点就是可以指定编码格式,这是其他类所不能的,然而每次调用InputStreamReader中的一个read()方法都会导致从底层输入流读取一个或多个字节,要启用从字节到字符的有效转换,可以提前从底层输入流读取更多的字节,使其超过满足当前读取操作所需的字节。为了达到高效率,可以考虑在BufferedReader内包装InputStreamReader.
eg:BufferedReader br = new BufferedReader(new InputStreamReader(System.in))
FileReader 是InputStreamReader的子类,继承父类中的所有方法。
构造方法概要:
FileReader(File file):在给定从中读取数据的File的情况下创建一个新的FileReader.
FileReader(FileDescriptor fd):在给定从中读取数据的FileDescriptor的情况下创建一个新的FileReader.
FileReader(String fileName):在给定从中读取数据的文件名的情况下创建一个新的FileReader.
该类与它的父类InputStreamReader的主要区别在于构造函数,主要区别也在构造函数。
从InputStreamReader的构造方法可以看出,参数为InputStream和编码方式,因此当要指定编码方式是,必须使用InputStreamReader类。而FileReader的构造函数的参数与InputStream相同,为File对象或表示path的String,因此当要根据File对象或者String读取一个文件时,用FileReader.
字节与字符的区别:
FileInputStream类以二进制输入/输出,I/o速度快且效率极高,但是其read()方法读到的是一个字节(二进制数据),很不利于人们阅读,而且无法直接对文件中的字符进行操作,比如替换、查找。Reader类弥补了这个缺陷,可以以文本格式输入输出,非常方便,比如常用操作while((ch = filereader.read()) != -1)循环来读取文件;可以使用BufferedReader的readLine()方法一行一行的读取文本。
编码
InputStreamReader,它是字节转换为字符的桥梁。用户可以在构造器中指定编码的方式,如果不指定的话讲采用底层操作系统的默认编码方式,例如GBK等。
FileReader与InputStreamReader可能在不同的平台上出现乱码现象,而FileInputStream以二进制方式处理,不会出现乱码现象。
因此要指定编码方式时,必须使用InputStreamReader类,所以说它是字节转换为字符的桥梁。
缓冲区
BufferedReader类用来包装所有其read()操作可能开销很高的Reader,如(FileReader 和 InputStreamReader).
总结:
基于上述详细的阐述,在日常工作中比较规范的用法主要有以下三种:
<1> File file = new File("test.txt");
FileInputStream in = new FileInputStream(file);
<2>File file = new File("test.txt");
FileInputStream in = new FileInputStream(file);
InputStreamReader inReader = new InputStreamReader(in, "utf-8");
BufferedReader br = new BufferedReader(inReader);
<3>File file = new File("test.txt");
FileReader fileReader = new FileReader(file);
BufferedReader br = new BufferedReader(fileReader);