Java NIO vs. IO

时间 2019-11-12

标签 java nio 栏目 Java 繁體版

原文原文链接

当学习了Java NIO和IO的API后，一个问题很快进入心中：我应该在什么时候使用IO，什么时候使用NIO呢？在本文中，我会尽可能清晰地阐明Java NIO和IO的差别、它们的用例，以及它们如何影响您的代码设计。缓存

下表总结了Java NIO和IO之间的主要差异，我会更详细地描述表中每部分的差别。服务器

IO NIO 网络

面向流面向缓冲 socket

阻塞IO 非阻塞IO 工具

选择器学习

1.面向流与面向缓冲

Java NIO和IO之间第一个最大的区别是，IO是面向流的，其中NIO是面向缓冲区的。Java IO面向流意味着每次从流中读一个或多个字节，直至读取全部字节，它们没有被缓存在任何地方。此外，不能先后移动流中的数据。若是须要先后移动从流中读取的数据，须要先将它缓存到一个缓冲区。 Java NIO的缓冲导向方法略有不一样。数据读取到一个它之后处理的缓冲区，须要时，可在缓冲区中先后移动。这就增长了处理过程当中的灵活性。可是，还须要检查，是否该缓冲区包含全部您须要充分处理的数据。并且，需确保当更多的数据读入缓冲区时，不要覆盖还没有处理的缓冲区数据。 spa

2.阻塞与非阻塞IO

Java IO的各类流是阻塞的。这意味着，当一线程调用读read() 或 write()时，该线程被阻塞，直到有一些数据被读取，或数据彻底写入。该线程在此期间不能再干任何事情。 Java NIO的非阻塞模式，使一个线程从某通道请求读取数据，仅得目前可用的，或若目前没有数据可用时，什么都没有。而不是保持线程阻塞，直至数据变得可供读取，该线程能够继续其余的事情。非阻塞写也是如此。一线程请求写入一些数据到某通道，但不等待它彻底写入，而后该线程同时能够去作别的事情。线程将不是阻塞的IO空闲时间调用一般花费在其它通道在此期间的IO执行上，亦即，一个单独的线程如今能够管理多个输入和输出通道。线程

3.选择器

Java NIO的选择器容许一个单独的线程来监视多个输入通道，能够注册一个选择器的多个通道，而后使用一个单独的线程“选择”通道：已有输入可用于处理，或某通道已准备写入。这种选择机制，使得一个单独的线程很容易来管理多个通道。设计

4.NIO和IO如何影响应用程序的设计

不管您选择IO或NIO工具箱，可能会影响您应用程序设计的如下几个方面： 1) 对NIO或IO类的API调用。 2) 数据处理。 3) 用来处理数据的线程数。 code

1) API调用

固然，使用NIO的API调用时看起来与使用IO时有所不一样，这也难怪，不是仅仅从一个InputStream逐字节读取，数据必须先读入缓冲区，而后从那里处理。

2) 数据处理

使用纯粹的NIO设计相较IO设计，数据处理也受到影响。

在IO设计中，咱们从InputStream或 Reader逐字节读取数据。想象一下，正在处理一基于文本数据的行流，例如：

Name: Anna

Age: 25

Email: anna@mailserver.com

Phone: 1234567890

该文本行的流能够这样处理：

InputStream input = ... ; // get the InputStream from the client socket

BufferedReader reader = new BufferedReader(new InputStreamReader(input));

String nameLine   = reader.readLine();
String ageLine    = reader.readLine();
String emailLine  = reader.readLine();
String phoneLine  = reader.readLine();

请注意处理状态由程序执行多久决定肯定。换句话说，一旦reader.readLine()方法返回，你就知道确定文本行就已读完， readline()阻塞直到整行读完，此即缘由。你也知道此行包含名称；一样，第二个readline()调用返回的时候，你知道这行包含年龄等。

正如你能够看到，该处理程序仅在有新数据读入时运行，并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据，该线程不会再回退数据（大多如此）。下图也说明了这条原则：

一个NIO实现会有所不一样。下面是一个简单的例子：

ByteBuffer buffer = ByteBuffer.allocate(48);
 
int bytesRead = inChannel.read(buffer);

注意第二行，从通道读取字节到ByteBuffer。当这个方法调用返回时，你不知道你所需的全部数据是否在缓冲区内。你所知道的是，该缓冲区包含一些字节，这使得处理有点困难。

想象一下，若是第一次 read(buffer)调用后，全部读入缓冲区为半行，例如，“Name:An”，你能处理数据吗？显然不能，须要等待，直到整行数据读入缓存，在此以前，对数据的任何处理毫无心义。

因此，你怎么知道是否该缓冲区包含足够的数据能够处理呢？好了，你不知道。发现的方法只能查看缓冲区中的数据。其结果是，在知道数据是否在其中前，须要检查缓冲区几回。这不只效率低下，并且可使方案设计杂乱不堪。例如：

ByteBuffer buffer = ByteBuffer.allocate(48);
 
 
int bytesRead = inChannel.read(buffer);
 
 
while(! bufferFull(bytesRead) ) {
 
bytesRead = inChannel.read(buffer);
 
}

bufferFull()方法必须跟踪有多少数据读入缓冲区，并返回真或假，取决于缓冲区是否已满。换句话说，若是缓冲区准备好被处理，它被认为是满了。

bufferFull()方法扫描缓冲区，但必须保持在bufferFull（）方法被调用以前状态相同。若是没有，下一个读入缓冲区的数据可能没法读到正确的位置。这是不可能的，但倒是须要注意的又一问题。

若是缓冲区已满，它能够被处理。若是它不满，在特定的状况下，也许能够部分过处理其中存在的任何数据。许多状况下并不是如此。

下图展现了“缓冲区数据循环就绪”：

3) 用来处理数据的线程数

NIO可以让您管理只使用一个（或几个）单线程管理多个通道（网络链接或文件），但付出的代价是，解析数据可能会比从一个阻塞流中读取数据时较为复杂。

若是须要管理成千上万打开的链接共存，每次只能发送小部分数据，例如聊天服务器，实现NIO的服务器多是一个优点。一样，若是你须要保持许多打开的链接到其余计算机上，如P2P网络中，使用一个单独的线程来管理你全部出站链接，多是一个优点。一个线程多个链接的设计方案以下图所示：

若是你有很是高的带宽更少的链接，一次发送大量的数据，也许典型的IO服务器实现可能的最佳契合。下图说明了一个典型的IO服务器设计：