欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

面试(Java之IO与NIO)

程序员文章站 2022-04-08 23:05:31
一、概念 NIO即New IO,这个库是在JDK1.4中才引入的。NIO和IO有相同的作用和目的,但实现方式不同,NIO主要用到的是块,所以NIO的效率要比IO高很多。在Java API中提供了两套NIO,一套是针对标准输入输出NIO,另一套就是网络编程NIO。 二、NIO和IO的主要区别 下表总结 ......

一、概念

     nio即new io,这个库是在jdk1.4中才引入的。nio和io有相同的作用和目的,但实现方式不同,nio主要用到的是块,所以nio的效率要比io高很多。在java api中提供了两套nio,一套是针对标准输入输出nio,另一套就是网络编程nio。

二、nio和io的主要区别

下表总结了java io和nio之间的主要区别:

io

nio

面向流

面向缓冲

阻塞io

非阻塞io

选择器

 

 

 

 

 

 

 

 

1、面向流与面向缓冲

      java io和nio之间第一个最大的区别是,io是面向流的,nio是面向缓冲区的。

java io面向流意味着每次从流中读一个或多个字节,直至读取所有字节,它们没有被缓存在任何地方。此外,它不能前后移动流中的数据。如果需要前后移动从流中读取的数据,需要先将它缓存到一个缓冲区。

    java nio面向缓冲区的缓冲导向方法略有不同。数据读取到一个它稍后处理的缓冲区,需要时可在缓冲区中前后移动。这就增加了处理过程中的灵活性。但是,还需要检查是否该缓冲区中包含所有您需要处理的数据。而且,需确保当更多的数据读入缓冲区时,不要覆盖缓冲区里尚未处理的数据。

2、阻塞与非阻塞io

      java io的各种流是阻塞的。这意味着,当一个线程调用read() 或 write()时,该线程被阻塞,直到有一些数据被读取,或数据完全写入。该线程在此期间不能再干任何事情了。

java nio的非阻塞模式,使一个线程从某通道发送请求读取数据,但是它仅能得到目前可用的数据,如果目前没有数据可用时,就什么都不会获取,而不是保持线程阻塞,所以直至数据变的可以读取之前,该线程可以继续做其他的事情。 非阻塞写也是如此。一个线程请求写入一些数据到某通道,但不需要等待它完全写入,这个线程同时可以去做别的事情。 线程通常将非阻塞io的空闲时间用于在其它通道上执行io操作,所以一个单独的线程现在可以管理多个输入和输出通道(channel)。

3、选择器(selectors)

     java nio的选择器允许一个单独的线程来监视多个输入通道,你可以注册多个通道使用一个选择器,然后使用一个单独的线程来“选择”通道:这些通道里已经有可以处理的输入,或者选择已准备写入的通道。这种选择机制,使得一个单独的线程很容易来管理多个通道。

三、nio和io如何影响应用程序的设计

无论您选择io或nio工具箱,可能会影响您应用程序设计的以下几个方面:

1.对nio或io类的api调用。
2.数据处理。
3.用来处理数据的线程数。

1、api调用

当然,使用nio的api调用时看起来与使用io时有所不同,但这并不意外,因为并不是仅从一个inputstream逐字节读取,而是数据必须先读入缓冲区再处理。

2、数据处理

使用纯粹的nio设计相较io设计,数据处理也受到影响。

在io设计中,我们从inputstream或 reader逐字节读取数据。假设你正在处理一基于行的文本数据流,例如:

name: anna

age: 25

email: anna@mailserver.com

phone: 1234567890

该文本行的流可以这样处理:

inputstream input = ... ; // get the inputstream from the client socket  

 

bufferedreader reader = new bufferedreader(new inputstreamreader(input));  

 

string nameline   = reader.readline();

string ageline    = reader.readline();

string emailline  = reader.readline();

string phoneline  = reader.readline();

 

 

     请注意处理状态由程序执行多久决定。换句话说,一旦reader.readline()方法返回,你就知道肯定文本行就已读完, readline()阻塞直到整行读完,这就是原因。你也知道此行包含名称;同样,第二个readline()调用返回的时候,你知道这行包含年龄等。 正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如此)。下图也说明了这条原则:

 

而一个nio的实现会有所不同,下面是一个简单的例子:

bytebuffer buffer = bytebuffer.allocate(48);

int bytesread = inchannel.read(buffer);

注意第二行,从通道读取字节到bytebuffer。当这个方法调用返回时,你不知道你所需的所有数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。假设第一次 read(buffer)调用后,读入缓冲区的数据只有半行,例如,“name:an”,你能处理数据吗?显然不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。所以,你怎么知道是否该缓冲区包含足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道所有数据都在缓冲区里之前,你必须检查几次缓冲区的数据。这不仅效率低下,而且可以使程序设计方案杂乱不堪。例如

bytebuffer buffer = bytebuffer.allocate(48);  

 

int bytesread = inchannel.read(buffer);  

 

while(! bufferfull(bytesread) ) {  

       bytesread = inchannel.read(buffer);  

}

 

bufferfull()方法必须跟踪有多少数据读入缓冲区,并返回真或假,这取决于缓冲区是否已满。换句话说,如果缓冲区准备好被处理,那么表示缓冲区满了。

bufferfull()方法扫描缓冲区,但必须保持在bufferfull()方法被调用之前状态相同。如果没有,下一个读入缓冲区的数据可能无法读到正确的位置。这是不可能的,但却是需要注意的又一问题。

如果缓冲区已满,它可以被处理。如果它不满,并且在你的实际案例中有意义,你或许能处理其中的部分数据。但是许多情况下并非如此。下图展示了“缓冲区数据循环就绪”:

 

四、io与nio的选择

nio可让您只使用一个(或几个)单线程管理多个通道(网络连接或文件),但付出的代价是解析数据可能会比从一个阻塞流中读取数据更复杂。

如果需要管理同时打开的成千上万个连接,这些连接每次只是发送少量的数据,例如聊天服务器,实现nio的服务器可能是一个优势。同样,如果你需要维持许多打开的连接到其他计算机上,如p2p网络中,使用一个单独的线程来管理你所有出站连接,可能是一个优势。一个线程多个连接的设计方案如下图所示:

 

java nio: 单线程管理多个连接

如果你有少量的连接使用非常高的带宽,一次发送大量的数据,也许典型的io服务器实现可能非常契合。下图说明了一个典型的io服务器设计:

 

java io: 一个典型的io服务器设计- 一个连接通过一个线程处理.

ps.

1.   java io 流中涉及到了哪些设计策略和设计模式

java 的 io 库提供了一种链接(chaining)机制,可以将一个流处理器跟另一个流处理器首尾相接,以其中之一的输出作为另一个的输入而形成一个流管道链接,譬如常见的 new datainputstream(new fileinputstream(file)) 就是把 fileinputstream 流当作 datainputstream 流的管道链接。其次,对于 java io 流还涉及一种对称性的设计策略,其表现为输入输出对称性(如 inputstream 和 outputstream 的字节输入输出操作,reader 和 writer 的字符输入输出操作)和字节字符的对称性(inputstream 和 reader 的字节字符输入操作,outputstream 和 writer 的字节字符输出操作)。此外,对于 java io 流在整体设计上还涉及装饰者(decorator)和适配器(adapter)两种设计模式。

对于 io 流涉及的装饰者设计模式例子如下:

//把inputstreamreader装饰成bufferedreader来成为具备缓冲能力的reader。bufferedreader bufferedreader = new bufferedreader(inputstreamreader);

对于 io 流涉及的适配器设计模式例子如下:

//把fileinputstream文件字节流适配成inputstreamreader字符流来操作文件字符串。

fileinputstream fileinput = new fileinputstream(file);

inputstreamreader inputstreamreader = new inputstreamreader(fileinput);

而对于上面涉及的两种设计模式通俗总结如下。装饰者模式就是给一个对象增加一些新的功能,而且是动态的,要求装饰对象和被装饰对象实现同一个接口,装饰对象持有被装饰对象的实例(各种字符流间装饰,各种字节流间装饰)。适配器模式就是将某个类的接口转换成我们期望的另一个接口表示,目的是消除由于接口不匹配所造成的类的兼容性问题(字符流与字节流间互相适配)。

 

 

2.   字节流与字符流有什么区别:

计算机中的一切最终都是以二进制字节形式存在的,对于我们经常操作的字符串,在写入时其实都是先得到了其对应的字节,然后将字节写入到输出流,在读取时其实都是先读到的是字节,然后将字节直接使用或者转换为字符给我们使用。由于对于字节和字符两种操作的需求比较广泛,所以 java 专门提供了字符流与字节流相关io类。对于程序运行的底层设备来说永远都只接受字节数据,所以当我们往设备写数据时无论是字节还是字符最终都是写的字节流。字符流是字节流的包装类,所以当我们将字符流向字节流转换时要注意编码问题(因为字符串转成字节数组的实质是转成该字符串的某种字节编码)。字符流和字节流的使用非常相似,但是实际上字节流的操作不会经过缓冲区(内存)而是直接操作文本本身的,而字符流的操作会先经过缓冲区(内存)然后通过缓冲区再操作文件。

字符流和字节流的使用非常相似,但是实际上字节流的操作不会经过缓冲区(内存)而是直接操作文本本身的,而字符流的操作会先经过缓冲区(内存)然后通过缓冲区再操作文件。

3.  字节流和字符流哪个好,如何选择?

缓大多数情况下使用字节流会更好,因为字节流是字符流的包装,而大多数时候 io 操作都是直接操作磁盘文件,所以这些流在传输时都是以字节的方式进行的(图片等都是按字节存储的)。

而如果对于操作需要通过 io 在内存中频繁处理字符串的情况使用字符流会好些,因为字符流具备缓冲区,提高了性能。