记得那是一个风和日丽的周末,太阳红彤彤,花儿五光十色,96 年的普哥微信找到我,描述了一个诡异的线上问题:线上程序使用了 NIO FileChannel 的 堆内内存(HeapByteBuffer)做为缓冲区,读写文件,逻辑能够说至关简单,但根据监控,却发现堆外内存(DirectByteBuffer)飙升,致使了 OutOfMemeory 的异常。java
由这个线上问题,引出了这篇文章的主题,主要包括:FileChannel 源码分析,堆外内存监控,堆外内存回收。数组
根据异常日志的定位,发现的确使用的是 HeapByteBuffer 来进行读写,但却致使堆外内存飙升,随即翻了 FileChannel 的源码,来一探究竟。缓存
FileChannel 使用的是 IOUtil 进行读写操做(本文只分析读的逻辑,写和读的代码逻辑一致,不作重复分析)微信
//sun.nio.ch.IOUtil#read
static int read(FileDescriptor var0, ByteBuffer var1, long var2, NativeDispatcher var4) throws IOException {
if (var1.isReadOnly()) {
throw new IllegalArgumentException("Read-only buffer");
} else if (var1 instanceof DirectBuffer) {
return readIntoNativeBuffer(var0, var1, var2, var4);
} else {
ByteBuffer var5 = Util.getTemporaryDirectBuffer(var1.remaining());
int var7;
try {
int var6 = readIntoNativeBuffer(var0, var5, var2, var4);
var5.flip();
if (var6 > 0) {
var1.put(var5);
}
var7 = var6;
} finally {
Util.offerFirstTemporaryDirectBuffer(var5);
}
return var7;
}
}
复制代码
能够发现当使用 HeapByteBuffer 时,会走到下面这行看似有点疑问的代码分支:多线程
Util.getTemporaryDirectBuffer(var1.remaining());
复制代码
这个 Util 封装了更为底层的一些 IO 逻辑app
package sun.nio.ch;
public class Util {
private static ThreadLocal<Util.BufferCache> bufferCache;
public static ByteBuffer getTemporaryDirectBuffer(int var0) {
if (isBufferTooLarge(var0)) {
return ByteBuffer.allocateDirect(var0);
} else {
// FOUCS ON THIS LINE
Util.BufferCache var1 = (Util.BufferCache)bufferCache.get();
ByteBuffer var2 = var1.get(var0);
if (var2 != null) {
return var2;
} else {
if (!var1.isEmpty()) {
var2 = var1.removeFirst();
free(var2);
}
return ByteBuffer.allocateDirect(var0);
}
}
}
}
复制代码
isBufferTooLarge 这个方法会根据传入 Buffer 的大小决定如何分配堆外内存,若是过大,直接分配大缓冲区;若是不是太大,会使用 bufferCache 这个 ThreadLocal 变量来进行缓存,从而复用(实际上这个数值很是大,几乎不会走进直接分配堆外内存这个分支)。这么看来彷佛发现了两个不得了的结论:dom
看到这儿,线上的问题彷佛有了一点眉目:颇有多是多线程使用 HeapByteBuffer 写入文件,而额外分配的这块 DirectByteBuffer 致使了内存溢出。在验证这个猜想以前,咱们最好能直观地监控到堆外内存的使用量,这才能增长咱们定位问题的信心。异步
JDK 提供了一个很是好用的监控工具 —— Java VisualVM。咱们只须要为它安装一个插件,便可很方便地实现堆外内存的监控。ide
进入本地 JDK 的可执行目录(在我本地是:/Library/Java/JavaVirtualMachines/jdk1.8.0_181.jdk/Contents/Home/bin),找到 jvisualvm 命令,双击打开一个可视化的界面函数
左侧树状目录能够选择须要监控的 Java 进程,右侧是监控的维度信息,除了 CPU、线程、堆、类等信息,还能够经过上方的【工具(T)】 安装插件,增长 MBeans、Buffer Pools 等维度的监控。
Buffer Pools 插件能够监控堆外内存(包含 DirectByteBuffer 和 MappedByteBuffer),以下图所示:
左侧对应 DirectByteBuffer,右侧对应 MappedByteBuffer。
为了复现线上的问题,咱们使用一个程序,不断开启线程使用堆内内存做为缓冲区进行文件的读取操做,并监控该进程的堆外内存使用状况。
public class ReadByHeapByteBufferTest {
public static void main(String[] args) throws IOException, InterruptedException {
File data = new File("/tmp/data.txt");
FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();
ByteBuffer buffer = ByteBuffer.allocate(4 * 1024 * 1024);
for (int i = 0; i < 1000; i++) {
Thread.sleep(1000);
new Thread(new Runnable() {
@Override
public void run() {
try {
fileChannel.read(buffer);
buffer.clear();
} catch (IOException e) {
e.printStackTrace();
}
}
}).start();
}
}
}
复制代码
运行一段时间后,咱们观察下堆外内存的使用状况
如上图左所示,堆外内存的确开始疯涨了,的确符合咱们的预期,堆外缓存和线程绑定,当线程很是多时,即便只使用了 4M 的堆内内存,也可能会形成极大的堆外内存膨胀,在中间发生了一次断崖,推测是线程执行完毕 or GC,致使了内存的释放。
知晓了这一点,相信你们从此使用堆内内存时可能就会更加注意了,我总结了两个注意点:
ThreadLocal<Util.BufferCache> bufferCache
致使的堆外内存膨胀的问题。那你们有没有想过,为何 JDK 要如此设计?为何不直接使用堆内内存写入 PageCache 进而落盘呢?为何必定要通过 DirectByteBuffer 的拷贝呢?
在知乎的相关问题中,R 大和曾泽堂 两位同窗进行了解答,是我比较认同的解释:
做者:RednaxelaFX
来源:知乎
这里实际上是在迁就OpenJDK里的HotSpot VM的一点实现细节。
HotSpot VM 里的 GC 除了 CMS 以外都是要移动对象的,是所谓“compacting GC”。
若是要把一个Java里的 byte[] 对象的引用传给native代码,让native代码直接访问数组的内容的话,就必需要保证native代码在访问的时候这个 byte[] 对象不能被移动,也就是要被“pin”(钉)住。
惋惜 HotSpot VM 出于一些取舍而决定不实现单个对象层面的 object pinning,要 pin 的话就得暂时禁用 GC——也就等于把整个 Java 堆都给 pin 住。
因此 Oracle/Sun JDK / OpenJDK 的这个地方就用了点绕弯的作法。它假设把 HeapByteBuffer 背后的 byte[] 里的内容拷贝一次是一个时间开销能够接受的操做,同时假设真正的 I/O 多是一个很慢的操做。
因而它就先把 HeapByteBuffer 背后的 byte[] 的内容拷贝到一个 DirectByteBuffer 背后的 native memory去,这个拷贝会涉及 sun.misc.Unsafe.copyMemory() 的调用,背后是相似 memcpy() 的实现。这个操做本质上是会在整个拷贝过程当中暂时不容许发生 GC 的。
而后数据被拷贝到 native memory 以后就好办了,就去作真正的 I/O,把 DirectByteBuffer 背后的 native memory 地址传给真正作 I/O 的函数。这边就不须要再去访问 Java 对象去读写要作 I/O 的数据了。
总结一下就是:
继续深究下一个话题,也是个人微信交流群中曾经有人提出过的一个疑问,到底该如何回收 DirectByteBuffer?既然能够监控堆外内存,那验证堆外内存的回收就变得很容易实现了。
CASE 1:分配 1G 的 DirectByteBuffer,等待用户输入后,复制为 null,以后阻塞持续观察堆外内存变化
public class WriteByDirectByteBufferTest {
public static void main(String[] args) throws IOException, InterruptedException {
ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);
System.in.read();
buffer = null;
new CountDownLatch(1).await();
}
}
复制代码
结论:变量虽然置为了 null,但内存依旧持续占用。
CASE 2:分配 1G DirectByteBuffer,等待用户输入后,复制为 null,手动触发 GC,以后阻塞持续观察堆外内存变化
public class WriteByDirectByteBufferTest {
public static void main(String[] args) throws IOException, InterruptedException {
ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);
System.in.read();
buffer = null;
System.gc();
new CountDownLatch(1).await();
}
}
复制代码
结论:GC 时会触发堆外空闲内存的回收。
CASE 3:分配 1G DirectByteBuffer,等待用户输入后,手动回收堆外内存,以后阻塞持续观察堆外内存变化
public class WriteByDirectByteBufferTest {
public static void main(String[] args) throws IOException, InterruptedException {
ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);
System.in.read();
((DirectBuffer) buffer).cleaner().clean();
new CountDownLatch(1).await();
}
}
复制代码
结论:手动回收能够马上释放堆外内存,不须要等待到 GC 的发生。
对于 MappedByteBuffer 这个有点神秘的类,它的回收机制大概和 DirectByteBuffer 相似,体如今右边的 Mapped 之中,咱们就不重复 CASE1 和 CASE2 的测试了,直接给出结论,在 GC 发生或者操做系统主动清理时 MappedByteBuffer 会被回收。但也不是不进行测试,咱们会对 MappedByteBuffer 进行更有意思的研究。
CASE 4:手动回收 MappedByteBuffer。
public class MmapUtil {
public static void clean(MappedByteBuffer mappedByteBuffer) {
ByteBuffer buffer = mappedByteBuffer;
if (buffer == null || !buffer.isDirect() || buffer.capacity() == 0)
return;
invoke(invoke(viewed(buffer), "cleaner"), "clean");
}
private static Object invoke(final Object target, final String methodName, final Class<?>... args) {
return AccessController.doPrivileged(new PrivilegedAction<Object>() {
public Object run() {
try {
Method method = method(target, methodName, args);
method.setAccessible(true);
return method.invoke(target);
} catch (Exception e) {
throw new IllegalStateException(e);
}
}
});
}
private static Method method(Object target, String methodName, Class<?>[] args) throws NoSuchMethodException {
try {
return target.getClass().getMethod(methodName, args);
} catch (NoSuchMethodException e) {
return target.getClass().getDeclaredMethod(methodName, args);
}
}
private static ByteBuffer viewed(ByteBuffer buffer) {
String methodName = "viewedBuffer";
Method[] methods = buffer.getClass().getMethods();
for (int i = 0; i < methods.length; i++) {
if (methods[i].getName().equals("attachment")) {
methodName = "attachment";
break;
}
}
ByteBuffer viewedBuffer = (ByteBuffer) invoke(buffer, methodName);
if (viewedBuffer == null)
return buffer;
else
return viewed(viewedBuffer);
}
}
复制代码
这个类曾经在个人《文件 IO 的一些最佳实践》中有所介绍,在这里咱们将验证它的做用。编写测试类:
public class WriteByMappedByteBufferTest {
public static void main(String[] args) throws IOException, InterruptedException {
File data = new File("/tmp/data.txt");
data.createNewFile();
FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();
MappedByteBuffer map = fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, 1024L * 1024 * 1024);
System.in.read();
MmapUtil.clean(map);
new CountDownLatch(1).await();
}
}
复制代码
结论:经过一顿复杂的反射操做,成功地手动回收了 Mmap 的内存映射。
CASE 5:测试 Mmap 的内存占用
public class WriteByMappedByteBufferTest {
public static void main(String[] args) throws IOException, InterruptedException {
File data = new File("/tmp/data.txt");
data.createNewFile();
FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();
for (int i = 0; i < 1000; i++) {
fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, 1024L * 1024 * 1024);
}
System.out.println("map finish");
new CountDownLatch(1).await();
}
}
复制代码
我尝试映射了 1000G 的内存,个人电脑显然没有 1000G 这么大内存,那么监控是如何反馈的呢?
几乎在瞬间,控制台打印出了 map finish 的日志,也意味着 1000G 的内存映射几乎是不耗费时间的,为何要作这个测试?就是为了解释内存映射并不等于内存占用,不少文章认为内存映射这种方式能够大幅度提高文件的读写速度,并宣称“写 MappedByteBuffer 就等于写内存”,实际是很是错误的认知。经过控制面板能够查看到该 Java 进程(pid 39040)实际占用的内存,仅仅不到 100M。(关于 Mmap 的使用场景和方式能够参考我以前的文章)
结论:MappedByteBuffer 映射出一片文件内容以后,不会所有加载到内存中,而是会进行一部分的预读(体如今占用的那 100M 上),MappedByteBuffer 不是文件读写的银弹,它仍然依赖于 PageCache 异步刷盘的机制。经过 Java VisualVM 能够监控到 mmap 总映射的大小,但并非实际占用的内存量。
本文借助一个线上问题,分析了使用堆内内存仍然会致使堆外内存分析的现象以及背后 JDK 如此设计的缘由,并借助安装了插件以后的 Java VisualVM 工具进行了堆外内存的监控,进而讨论了如何正确的回收堆外内存,以及纠正了一个关于 MappedByteBuffer 的错误认知。
欢迎关注个人微信公众号:「Kirito的技术分享」,关于文章的任何疑问都会获得回复,带来更多 Java 相关的技术分享。