《Netty权威指南》(一)走进 Java NIO

 

1.1 I/O 基础入门

Java1.4 以前的早期版本,对 I/O 的支持存在以下问题:linux

  • 没有数据缓冲区,I/O 性能存在问题;
  • 没有 C 或者 C++ 中的 Channel 概念,只有输入和输出流;
  • 同步阻塞式 I/O 通讯(BIO),一般会致使通讯线程被长时间阻塞;
  • 支持的字符集有限,硬件可移植性很差。

 

1.1.1 Linux 网络 I/O 模型

根据 UNIX 网络编程对 I/O 模型的分类,UNIX 提供了 5 种 I/O 模型:正则表达式

  1. 阻塞 I/O(blocking I/O)
  2. 非阻塞 I/O(nonblocking I/O)
  3. I/O 复用(I/O multiplexing (select and poll))
  4. 信号驱动 I/O(signal driven I/O (SIGIO))
  5. 异步 I/O(asynchronous I/O (the POSIX aio_ functions))

对于一个套接口上的输入操做,一般包括2个阶段:编程

  1. 等待数据准备就绪。等待数据从网络中到达,当包到达时,它被复制到内核缓冲区。
  2. 数据从内核复制到用户空间。将数据从内核缓冲区复制到应用进程缓冲区。

(1)阻塞 I/O 模型

最经常使用的 I/O 模型就是阻塞 I/O 模型,缺省情形下,全部文件操做都是阻塞的。咱们以套接字接口为例来说解此模型:在进程空间中调用 recvfrom,其系统调用直到数据包到达且被复制到应用进程的缓冲区中或者发生错误时才返回,在此期间一直会等待,进程在从调用 recvfrom 开始到它返回的整段时间内都是被阻塞的,所以被称为阻塞 I/O 模型。服务器

(2)非阻塞 I/O 模型

recvfrom 从应用层到内核的时候,若是该缓冲区没有数据的话,就直接返回一个 EWOULDBLOCK 错误,通常都对非阻塞 I/O 模型进行轮询检查这个状态,看内核是否是有数据到来。网络

(3)I/O 多路复用模型

Linux 提供 select/poll,进程经过将一个或多个 fd 传递给 select 或 poll 系统调用,阻塞在 select 操做上,这样 select/poll 能够帮咱们侦测多个 fd 是否处于就绪状态。select/poll 是顺序扫描 fd 是否就绪,并且支持的 fd 数量有限,所以它的使用收到了一些制约。Linux 还提供了一个 epoll 系统调用,epoll 使用基于事件驱动方式代替顺序扫描,所以性能更高。当有 fd 就绪时,当即回调函数 rollback。多线程

(4)信号驱动 I/O 模型

首先开启套接口信号驱动 I/O 功能,并经过系统调用 sigaction 执行一个信号处理函数(此系统调用当即返回,进程继续工做,它是非阻塞的)。当数据准备就绪时,就为该进程生成一个 SIGIO 信号,经过信号回调通知应用程序调用 recvfrom 来读取数据,并通知主循环函数处理数据。并发

(5)异步 I/O 模型

告知内核启动某个操做,并让内核在整个操做完成后(包括将数据从内核复制到用户本身的缓冲区)通知咱们。这种模型与信号驱动模型的主要区别是:信号驱动 I/O 由内核通知咱们什么时候能够开始一个 I/O 操做;异步 I/O 模型由内核通知咱们 I/O 操做什么时候已经完成。异步

5种 I/O 模型比较
socket

 

1.1.2 I/O 多路复用技术

在 I/O 编程过程当中,当须要处理多个客户端接入请求时,能够利用多线程或者 I/O 多路复用技术进行处理。I/O 多路复用技术经过把多个 I/O 的阻塞复用到同一个 select 的阻塞上,从而使得系统在单线程的状况下能够同时处理多个客户端请求。与传统的多线程/多进程模型比,I/O 多路复用的最大优点是系统开销小,系统不须要建立新的额外进程或者线程,也不须要维护这些进程和线程的运行,下降了系统的维护工做量,节省了系统资源。

I/O 多路复用的主要应用场景以下:

  • 服务器须要同时处理多个处于监听状态或者多个链接状态的套接字;
  • 服务器须要同时处理多种网络协议的套接字。

目前支持 I/O 多路服用的系统调用有 select、pselect、poll、epoll,在 Linux 网络编程过程当中,很长一段时间都使用 select 作轮询和网络事件通知。为了克服 select 的缺点,epoll 做了很大的改进:

  1. 支持一个进程打开的 socket 描述符(FD)不受限制(仅受限于操做系统的最大文件句柄数)。
  2. I/O 效率不会随着 FD 数据的增长而线性降低。
  3. 使用 mmap 加速内核与用户空间的消息传递。
  4. epoll 的 API 更加简单。包括建立一个 epoll 描述符、添加监听时间、阻塞等待所监听的事件发生、关闭 epoll 描述符等。

注:epoll 是 Linux 内核为处理大批量文件描述符而做了改进的 poll,是 Linux 下多路复用 IO接口 select/poll 的加强版本,它能显著提升程序在大量并发链接中只有少许活跃的状况下的系统 CPU 利用率。

 

2. Java 的 I/O 演进

从JDK1.0 到 JDK1.3,Java 的 I/O 类库都很是原始,不少 UNIX 网络编程中的概念或者接口在 I/O 类库中都没有体现,例如 Pipe、Channel、Buffer 和 Selector 等。

2002年发布的 JDK1.4 时,NIO 以 JSR-51 的身份正式随 JDK 发布。它新增了个 java.nio 包,提供了不少进行异步 I/O 开发的 API 和类库,主要的类和接口以下:

  • 进行异步 I/O 操做的缓冲区 ByteBuffer 等;
  • 进行异步 I/O 操做的管道 Pipe;
  • 进行各类 I/O 操做的 Channel,包括 ServerSocketChannel 和 SocketChannel;
  • 多种字符集的编解码能力;
  • 实现非阻塞 I/O 操做的多路复用器 selector;
  • 基于流行的 Perl 实现的正则表达式类库;
  • 文件通道 FileChannel。

2011年7月28日,JDK1.7 正式发布,将原来的 NIO 类库进行了升级,被称为 NIO2.0。主要包括以下三个方面的改进:

  • 提供可以批量获取文件属性的 API,这些 API 具备平台无关性。提供了标准文件系统的 SPI,供各个服务提供商扩展实现;
  • 提供 AIO 功能,支持基于我呢见的异步 I/O 操做和针对网络套接字的异步操做;
  • 完成 JSR-51 定义的通道功能,包括对配置和多播数据报的支持等。
相关文章
相关标签/搜索