当学习了Java NIO和IO的API后,一个问题立刻涌入脑海:缓存
我应该什么时候使用IO,什么时候使用NIO呢?在本文中,我会尽可能清晰地解析Java NIO和IO的差别、它们的使用场景,以及它们如何影响您的代码设计。服务器
下表总结了Java NIO和IO之间的主要差异,我会更详细地描述表中每部分的差别。网络
IO NIO
面向流 面向缓冲
阻塞IO 非阻塞IO
无 选择器socket
Java NIO和IO之间第一个最大的区别是,IO是面向流的,NIO是面向缓冲区的。 Java IO面向流意味着每次从流中读一个或多个字节,直至读取全部字节,它们没有被缓存在任何地方。此外,它不能先后移动流中的数据。若是须要先后移动从流中读取的数据,须要先将它缓存到一个缓冲区。 Java NIO的缓冲导向方法略有不一样。数据读取到一个它稍后处理的缓冲区,须要时可在缓冲区中先后移动。这就增长了处理过程当中的灵活性。可是,还须要检查是否该缓冲区中包含全部您须要处理的数据。并且,需确保当更多的数据读入缓冲区时,不要覆盖缓冲区里还没有处理的数据。工具
Java IO的各类流是阻塞的。这意味着,当一个线程调用read() 或 write()时,该线程被阻塞,直到有一些数据被读取,或数据彻底写入。该线程在此期间不能再干任何事情了。 Java NIO的非阻塞模式,使一个线程从某通道发送请求读取数据,可是它仅能获得目前可用的数据,若是目前没有数据可用时,就什么都不会获取。而不是保持线程阻塞,因此直至数据变的能够读取以前,该线程能够继续作其余的事情。 非阻塞写也是如此。一个线程请求写入一些数据到某通道,但不须要等待它彻底写入,这个线程同时能够去作别的事情。 线程一般将非阻塞IO的空闲时间用于在其它通道上执行IO操做,因此一个单独的线程如今能够管理多个输入和输出通道(channel)。学习
Java NIO的选择器容许一个单独的线程来监视多个输入通道,你能够注册多个通道使用一个选择器,而后使用一个单独的线程来“选择”通道:这些通道里已经有能够处理的输入,或者选择已准备写入的通道。这种选择机制,使得一个单独的线程很容易来管理多个通道。线程
NIO和IO如何影响应用程序的设计设计
不管您选择IO或NIO工具箱,可能会影响您应用程序设计的如下几个方面:code
对NIO或IO类的API调用。
数据处理。
用来处理数据的线程数。
API调用
固然,使用NIO的API调用时看起来与使用IO时有所不一样,但这并不意外,由于并非仅从一个InputStream逐字节读取,而是数据必须先读入缓冲区再处理。server
数据处理
使用纯粹的NIO设计相较IO设计,数据处理也受到影响。
在IO设计中,咱们从InputStream或 Reader逐字节读取数据。假设你正在处理一基于行的文本数据流,例如:
Name: Anna Age: 25 Email: anna@mailserver.com Phone: 1234567890
该文本行的流能够这样处理:
InputStream input = … ; // get the InputStream from the client socket BufferedReader reader = new BufferedReader(new InputStreamReader(input)); String nameLine = reader.readLine(); String ageLine = reader.readLine(); String emailLine = reader.readLine(); String phoneLine = reader.readLine();
请注意处理状态由程序执行多久决定。换句话说,一旦reader.readLine()方法返回,你就知道确定文本行就已读完, readline()阻塞直到整行读完,这就是缘由。你也知道此行包含名称;一样,第二个readline()调用返回的时候,你知道这行包含年龄等。 正如你能够看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如此)。下图也说明了这条原则:
(Java IO: 从一个阻塞的流中读数据) 而一个NIO的实现会有所不一样,下面是一个简单的例子:
ByteBuffer buffer = ByteBuffer.allocate(48); int bytesRead = inChannel.read(buffer);
注意第二行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的全部数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。
假设第一次 read(buffer)调用后,读入缓冲区的数据只有半行,例如,“Name:An”,你能处理数据吗?显然不能,须要等待,直到整行数据读入缓存,在此以前,对数据的任何处理毫无心义。
因此,你怎么知道是否该缓冲区包含足够的数据能够处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道全部数据都在缓冲区里以前,你必须检查几回缓冲区的数据。这不只效率低下,并且可使程序设计方案杂乱不堪。例如:
ByteBuffer buffer = ByteBuffer.allocate(48); int bytesRead = inChannel.read(buffer); while(! bufferFull(bytesRead) ) { bytesRead = inChannel.read(buffer); }
bufferFull()方法必须跟踪有多少数据读入缓冲区,并返回真或假,这取决于缓冲区是否已满。换句话说,若是缓冲区准备好被处理,那么表示缓冲区满了。
bufferFull()方法扫描缓冲区,但必须保持在bufferFull()方法被调用以前状态相同。若是没有,下一个读入缓冲区的数据可能没法读到正确的位置。这是不可能的,但倒是须要注意的又一问题。
若是缓冲区已满,它能够被处理。若是它不满,而且在你的实际案例中有意义,你或许能处理其中的部分数据。可是许多状况下并不是如此。下图展现了“缓冲区数据循环就绪”:
Java NIO:从一个通道里读数据,直到全部的数据都读到缓冲区里.
3) 用来处理数据的线程数
NIO可以让您只使用一个(或几个)单线程管理多个通道(网络链接或文件),但付出的代价是解析数据可能会比从一个阻塞流中读取数据更复杂。
若是须要管理同时打开的成千上万个链接,这些链接每次只是发送少许的数据,例如聊天服务器,实现NIO的服务器多是一个优点。一样,若是你须要维持许多打开的链接到其余计算机上,如P2P网络中,使用一个单独的线程来管理你全部出站链接,多是一个优点。一个线程多个链接的设计方案以下图所示:
Java NIO: 单线程管理多个链接
若是你有少许的链接使用很是高的带宽,一次发送大量的数据,也许典型的IO服务器实现可能很是契合。下图说明了一个典型的IO服务器设计:
Java IO: 一个典型的IO服务器设计- 一个链接经过一个线程处理.