前言java
许多Java开发者都曾据说过“不使用的对象应手动赋值为null“这句话,并且好多开发者一直信奉着这句话;问其缘由,大都是回答“有利于GC更早回收内存,减小内存占用”,但再往深刻问就回答不出来了。算法
鉴于网上有太多关于此问题的误导,本文将经过实例,深刻JVM剖析“对象再也不使用时赋值为null”这一操做存在的意义,供君参考。本文尽可能不使用专业术语,但仍须要你对JVM有一些概念。数组
示例代码微信
咱们来看看一段很是简单的代码:机器学习
public static void main(String[] args) { if (true) { byte[] placeHolder = new byte[64 * 1024 * 1024]; System.out.println(placeHolder.length / 1024); } System.gc(); }
咱们在if中实例化了一个数组placeHolder,而后在if的做用域外经过System.gc();手动触发了GC,其用意是回收placeHolder,由于placeHolder已经没法访问到了。来看看输出:学习
65536 [GC 68239K->65952K(125952K), 0.0014820 secs] [Full GC 65952K->65881K(125952K), 0.0093860 secs]
Full GC 65952K->65881K(125952K)表明的意思是:本次GC后,内存占用从65952K降到了65881K。意思实际上是说GC没有将placeHolder回收掉,是否是难以想象?大数据
下面来看看遵循“不使用的对象应手动赋值为null“的状况:优化
public static void main(String[] args) { if (true) { byte[] placeHolder = new byte[64 * 1024 * 1024]; System.out.println(placeHolder.length / 1024); placeHolder = null; } System.gc(); }
其输出为:人工智能
65536 [GC 68239K->65952K(125952K), 0.0014910 secs] [Full GC 65952K->345K(125952K), 0.0099610 secs]
此次GC后内存占用降低到了345K,即placeHolder被成功回收了!对比两段代码,仅仅将placeHolder赋值为null就解决了GC的问题,真应该感谢“不使用的对象应手动赋值为null“。指针
等等,为何例子里placeHolder不赋值为null,GC就“发现不了”placeHolder该回收呢?这才是问题的关键所在。
运行时栈
典型的运行时栈
若是你了解过编译原理,或者程序执行的底层机制,你会知道方法在执行的时候,方法里的变量(局部变量)都是分配在栈上的;固然,对于Java来讲,new出来的对象是在堆中,但栈中也会有这个对象的指针,和int同样。
好比对于下面这段代码:
public static void main(String[] args) { int a = 1; int b = 2; int c = a + b; }
其运行时栈的状态能够理解成:
索引 变量
1 | a |
---|---|
2 | b |
3 | c |
“索引”表示变量在栈中的序号,根据方法内代码执行的前后顺序,变量被按顺序放在栈中。
再好比:
public static void main(String[] args) { if (true) { int a = 1; int b = 2; int c = a + b; } int d = 4; }
这时运行时栈就是:
索引 变量
1 | a |
---|---|
2 | b |
3 | c |
4 | d |
容易理解吧?其实仔细想一想上面这个例子的运行时栈是有优化空间的。
Java的栈优化
上面的例子,main()方法运行时占用了4个栈索引空间,但实际上不须要占用这么多。当if执行完后,变量a、b和c都不可能再访问到了,因此它们占用的1~3的栈索引是能够“回收”掉的,好比像这样:
索引 变量
1 | a |
---|---|
2 | b |
3 | c |
1 | d |
变量d重用了变量a的栈索引,这样就节约了内存空间。
提醒
上面的“运行时栈”和“索引”是为方便引入而故意发明的词,实际上在JVM中,它们的名字分别叫作“局部变量表”和“Slot”。并且局部变量表在编译时即已肯定,不须要等到“运行时”。
GC一瞥
这里来简单讲讲主流GC里很是简单的一小块:如何肯定对象能够被回收。另外一种表达是,如何肯定对象是存活的。
仔细想一想,Java的世界中,对象与对象之间是存在关联的,咱们能够从一个对象访问到另外一个对象。如图所示。
再仔细想一想,这些对象与对象之间构成的引用关系,就像是一张大大的图;更清楚一点,是众多的树。
若是咱们找到了全部的树根,那么从树根走下去就能找到全部存活的对象,那么那些没有找到的对象,就是已经死亡的了!这样GC就能够把那些对象回收掉了。
如今的问题是,怎么找到树根呢?JVM早有规定,其中一个就是:栈中引用的对象。也就是说,只要堆中的这个对象,在栈中还存在引用,就会被认定是存活的。
提醒
上面介绍的肯定对象能够被回收的算法,其名字是“可达性分析算法”。
JVM的“bug”
咱们再来回头看看最开始的例子:
public static void main(String[] args) { if (true) { byte[] placeHolder = new byte[64 * 1024 * 1024]; System.out.println(placeHolder.length / 1024); } System.gc(); }
看看其运行时栈:
LocalVariableTable: Start Length Slot Name Signature 0 21 0 args [Ljava/lang/String; 5 12 1 placeHolder [B
栈中第一个索引是方法传入参数args,其类型为String[];第二个索引是placeHolder,其类型为byte[]。
联系前面的内容,咱们推断placeHolder没有被回收的缘由:System.gc();触发GC时,main()方法的运行时栈中,还存在有对args和placeHolder的引用,GC判断这两个对象都是存活的,不进行回收。也就是说,代码在离开if后,虽然已经离开了placeHolder的做用域,但在此以后,没有任何对运行时栈的读写,placeHolder所在的索引尚未被其余变量重用,因此GC判断其为存活。
为了验证这一推断,咱们在System.gc();以前再声明一个变量,按照以前提到的“Java的栈优化”,这个变量会重用placeHolder的索引。
public static void main(String[] args) { if (true) { byte[] placeHolder = new byte[64 * 1024 * 1024]; System.out.println(placeHolder.length / 1024); } int replacer = 1; System.gc(); }
看看其运行时栈:
LocalVariableTable: Start Length Slot Name Signature 0 23 0 args [Ljava/lang/String; 5 12 1 placeHolder [B 19 4 1 replacer I
不出所料,replacer重用了placeHolder的索引。来看看GC状况:
65536 [GC 68239K->65984K(125952K), 0.0011620 secs] [Full GC 65984K->345K(125952K), 0.0095220 secs]
placeHolder被成功回收了!咱们的推断也被验证了。
再从运行时栈来看,加上int replacer = 1;和将placeHolder赋值为null起到了一样的做用:断开堆中placeHolder和栈的联系,让GC判断placeHolder已经死亡。
如今算是理清了“不使用的对象应手动赋值为null“的原理了,一切根源都是来自于JVM的一个“bug”:代码离开变量做用域时,并不会自动切断其与堆的联系。为何这个“bug”一直存在?你不以为出现这种状况的几率过小了么?算是一个tradeoff了。
总结
但愿看到这里你已经明白了“不使用的对象应手动赋值为null“这句话背后的奥义。我比较赞同《深刻理解Java虚拟机》做者的观点:在须要“不使用的对象应手动赋值为null“时大胆去用,但不该当对其有过多依赖,更不能看成是一个广泛规则来推广。
欢迎关注个人微信公众号「码农突围」,分享Python、Java、大数据、机器学习、人工智能等技术,关注码农技术提高•职场突围•思惟跃迁,20万+码农成长充电第一站,陪有梦想的你一块儿成长