触摸java常量池

时间 2019-11-07

标签触摸 java 常量栏目 Java 繁體版

原文原文链接

转：http://www.cnblogs.com/iyangyuan/p/4631696.htmlhtml

java常量池是一个经久不衰的话题，也是面试官的最爱，题目花样百出，小菜早就对常量池有所耳闻，此次好好总结一下。java

理论面试

小菜先拙劣的表达一下jvm虚拟内存分布：网络

程序计数器是jvm执行程序的流水线，存放一些跳转指令，这个过高深，小菜不懂。jvm

本地方法栈是jvm调用操做系统方法所使用的栈。测试

虚拟机栈是jvm执行java代码所使用的栈。优化

方法区存放了一些常量、静态变量、类信息等，能够理解成class文件在内存中的存放位置。spa

虚拟机堆是jvm执行java代码所使用的堆。操作系统

Java中的常量池，实际上分为两种形态：静态常量池和运行时常量池。翻译

所谓静态常量池，即*.class文件中的常量池，class文件中的常量池不只仅包含字符串(数字)字面量，还包含类、方法的信息，占用class文件绝大部分空间。

而运行时常量池，则是jvm虚拟机在完成类装载操做后，将class文件中的常量池载入到内存中，并保存在方法区中，咱们常说的常量池，就是指方法区中的运行时常量池。

接下来咱们引用一些网络上流行的常量池例子，而后借以讲解。

 1 String s1 = "Hello";
 2 String s2 = "Hello";
 3 String s3 = "Hel" + "lo";
 4 String s4 = "Hel" + new String("lo");
 5 String s5 = new String("Hello");
 6 String s6 = s5.intern();
 7 String s7 = "H";
 8 String s8 = "ello";
 9 String s9 = s7 + s8;
10           
11 System.out.println(s1 == s2);  // true
12 System.out.println(s1 == s3);  // true
13 System.out.println(s1 == s4);  // false
14 System.out.println(s1 == s9);  // false
15 System.out.println(s4 == s5);  // false
16 System.out.println(s1 == s6);  // true

首先说明一点，在java 中，直接使用==操做符，比较的是两个字符串的引用地址，并非比较内容，比较内容请用String.equals()。

s1 == s2这个很是好理解，s一、s2在赋值时，均使用的字符串字面量，说白话点，就是直接把字符串写死，在编译期间，这种字面量会直接放入class文件的常量池中，从而实现复用，载入运行时常量池后，s一、s2指向的是同一个内存地址，因此相等。

s1 == s3这个地方有个坑，s3虽然是动态拼接出来的字符串，可是全部参与拼接的部分都是已知的字面量，在编译期间，这种拼接会被优化，编译器直接帮你拼好，所以String s3 = "Hel" + "lo";在class文件中被优化成String s3 = "Hello";，因此s1 == s3成立。

s1 == s4固然不相等，s4虽然也是拼接出来的，但new String("lo")这部分不是已知字面量，是一个不可预料的部分，编译器不会优化，必须等到运行时才能够肯定结果，结合字符串不变定理，鬼知道s4被分配到哪去了，因此地址确定不一样。配上一张简图理清思路：

s1 == s9也不相等，道理差很少，虽然s七、s8在赋值的时候使用的字符串字面量，可是拼接成s9的时候，s七、s8做为两个变量，都是不可预料的，编译器毕竟是编译器，不可能当解释器用，因此不作优化，等到运行时，s七、s8拼接成的新字符串，在堆中地址不肯定，不可能与方法区常量池中的s1地址相同。

s4 == s5已经不用解释了，绝对不相等，两者都在堆中，但地址不一样。

s1 == s6这两个相等彻底归功于intern方法，s5在堆中，内容为Hello ，intern方法会尝试将Hello字符串添加到常量池中，并返回其在常量池中的地址，由于常量池中已经有了Hello字符串，因此intern方法直接返回地址；而s1在编译期就已经指向常量池了，所以s1和s6指向同一地址，相等。

至此，咱们能够得出三个很是重要的结论：

必需要关注编译期的行为，才能更好的理解常量池。

运行时常量池中的常量，基原本源于各个class文件中的常量池。

程序运行时，除非手动向常量池中添加常量(好比调用intern方法)，不然jvm不会自动添加常量到常量池。

以上所讲仅涉及字符串常量池，实际上还有整型常量池、浮点型常量池等等，但都大同小异，只不过数值类型的常量池不能够手动添加常量，程序启动时常量池中的常量就已经肯定了，好比整型常量池中的常量范围：-128~127，只有这个范围的数字能够用到常量池。

实践

说了这么多理论，接下来让咱们触摸一下真正的常量池。

前文提到过，class文件中存在一个静态常量池，这个常量池是由编译器生成的，用来存储java源文件中的字面量(本文仅仅关注字面量)，假设咱们有以下java代码：

1 String s = "hi";

为了方便起见，就这么简单，没错！将代码编译成class文件后，用winhex打开二进制格式的class文件。如图：

简单讲解一下class文件的结构，开头的4个字节是class文件魔数，用来标识这是一个class文件，说白话点就是文件头，既：CA FE BA BE。

紧接着4个字节是java的版本号，这里的版本号是34，由于笔者是用jdk8编译的，版本号的高低和jdk版本的高低相对应，高版本能够兼容低版本，但低版本没法执行高版本。因此，若是哪天读者想知作别人的class文件是用什么jdk版本编译的，就能够看这4个字节。

接下来就是常量池入口，入口处用2个字节标识常量池常量数量，本例中数值为00 1A，翻译成十进制是26，也就是有25个常量，其中第0个常量是特殊值，因此只有25个常量。

常量池中存放了各类类型的常量，他们都有本身的类型，而且都有本身的存储规范，本文只关注字符串常量，字符串常量以01开头(1个字节)，接着用2个字节记录字符串长度，而后就是字符串实际内容。本例中为：01 00 02 68 69。

接下来再说说运行时常量池，因为运行时常量池在方法区中，咱们能够经过jvm参数：-XX:PermSize、-XX:MaxPermSize来设置方法区大小，从而间接限制常量池大小。

假设jvm启动参数为：-XX:PermSize＝2M -XX:MaxPermSize＝2M，而后运行以下代码：

1 //保持引用，防止自动垃圾回收
2 List<String> list = new ArrayList<String>();
3         
4 int i = 0;
5         
6 while(true){
7     //经过intern方法向常量池中手动添加常量
8     list.add(String.valueOf(i++).intern());
9 }

程序马上会抛出：Exception in thread "main" java.lang.outOfMemoryError: PermGen space异常。PermGen space正是方法区，足以说明常量池在方法区中。

在jdk8中，移除了方法区，转而用Metaspace区域替代，因此咱们须要使用新的jvm参数：-XX:MaxMetaspaceSize=2M，依然运行如上代码，抛出：java.lang.OutOfMemoryError: Metaspace异常。同理说明运行时常量池是划分在Metaspace区域中。具体关于Metaspace区域的知识，请读者自行搜索。

本文全部代码均在jdk七、jdk8下测试经过，其余版本jdk可能会略有差别，请读者自行探索。

参考文献：《深刻理解java虚拟机———jvm高级特性与最佳实践》