jvm系列(1):JVM问答

时间 2019-11-19

标签 jvm 系列问答栏目 Java 繁體版

原文原文链接

一：JVM基础知识java

1）Java 是如何实现跨平台的？

注意：跨平台的是 Java 程序，而不是 JVM。JVM 是用 C/C++ 开发的，是编译后的机器码，不能跨平台，不一样平台下须要安装不一样版本的 JVM面试

答：咱们编写的 Java 源码，编译后会生成一种 .class 文件，称为字节码文件。Java 虚拟机（JVM）就是负责将字节码文件翻译成特定平台下的机器码而后运行，也就是说，只要在不一样平台上安装对应的 JVM，就能够运行字节码文件，运行咱们编写的 Java 程序。算法

而这个过程，咱们编写的 Java 程序没有作任何改变，仅仅是经过 JVM 这一 “中间层” ，就能在不一样平台上运行，真正实现了 “一次编译，处处运行” 的目的。bootstrap

2）什么是 JVM ？

解析：不只仅是基本概念，还有 JVM 的做用。数组

答：JVM，即 Java Virtual Machine，Java 虚拟机。它经过模拟一个计算机来达到一个计算机所具备的的计算功能。JVM 可以跨计算机体系结构来执行 Java 字节码，主要是因为 JVM 屏蔽了与各个计算机平台相关的软件或者硬件之间的差别，使得与平台相关的耦合统一由 JVM 提供者来实现。缓存

3）JVM 由哪些部分组成？

解析：这是对 JVM 体系结构的考察安全

答：JVM 的结构基本上由 4 部分组成：服务器

类加载器，在 JVM 启动时或者类运行时将须要的 class 加载到 JVM 中网络
执行引擎，执行引擎的任务是负责执行 class 文件中包含的字节码指令，至关于实际机器上的 CPU数据结构
内存区，将内存划分红若干个区以模拟实际机器上的存储、记录和调度功能模块，如实际机器上的各类功能的寄存器或者 PC 指针的记录器等
本地方法调用，调用 C 或 C++ 实现的本地方法的代码返回结果

4）类加载器是有了解吗？

解析：底层原理的考察，其中涉及到类加载器的概念，功能以及一些底层的实现。

答：顾名思义，类加载器（class loader）用来加载 Java 类到 Java 虚拟机中。通常来讲，Java 虚拟机使用 Java 类的方式以下：Java 源程序（.java 文件）在通过 Java 编译器编译以后就被转换成 Java 字节代码（.class 文件）。

类加载器负责读取 Java 字节代码，并转换成 java.lang.Class类的一个实例。每一个这样的实例用来表示一个 Java 类。经过此实例的 newInstance()方法就能够建立出该类的一个对象。实际的状况可能更加复杂，好比 Java 字节代码多是经过工具动态生成的，也多是经过网络下载的。

面试官：Java 虚拟机是如何断定两个 Java 类是相同的？

答：Java 虚拟机不只要看类的全名是否相同，还要看加载此类的类加载器是否同样。只有二者都相同的状况，才认为两个类是相同的。即使是一样的字节代码，被不一样的类加载器加载以后所获得的类，也是不一样的。好比一个 Java 类 com.example.Sample，编译以后生成了字节代码文件 Sample.class。两个不一样的类加载器 ClassLoaderA和 ClassLoaderB分别读取了这个 Sample.class文件，并定义出两个 java.lang.Class类的实例来表示这个类。这两个实例是不相同的。对于 Java 虚拟机来讲，它们是不一样的类。试图对这两个类的对象进行相互赋值，会抛出运行时异常 ClassCastException。

5）类加载器是如何加载 class 文件的？

答：下图所示是 ClassLoader 加载一个 class 文件到 JVM 时须要通过的步骤：

第一个阶段是找到 .class 文件并把这个文件包含的字节码加载到内存中

第二阶段又能够分为三个步骤，分别是字节码验证、Class 类数据结构分析及相应的内存分配和最后的符号表的连接

第三个阶段是类中静态属性和初始化赋值，以及静态块的执行等

面试官：能详细讲讲吗？

答：

1.加载

查找并加载类的二进制数据加载时类加载过程的第一个阶段，在加载阶段，虚拟机须要完成如下三件事情：

经过一个类的全限定名来获取其定义的二进制字节流。
将这个字节流所表明的静态存储结构转化为方法区的运行时数据结构。
在Java堆中生成一个表明这个类的 java.lang.Class 对象，做为对方法区中这些数据的访问入口。

相对于类加载的其余阶段而言，加载阶段（准确地说，是加载阶段获取类的二进制字节流的动做）是可控性最强的阶段，由于开发人员既可使用系统提供的类加载器来完成加载，也能够自定义本身的类加载器来完成加载。

加载阶段完成后，虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中，并且在Java堆中也建立一个 java.lang.Class类的对象，这样即可以经过该对象访问方法区中的这些数据。

2.链接

验证：确保被加载的类的正确性

验证是链接阶段的第一步，这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求，而且不会危害虚拟机自身的安全。验证阶段大体会完成4个阶段的检验动做：

文件格式验证：验证字节流是否符合Class文件格式的规范；例如：是否以 0xCAFEBABE开头、主次版本号是否在当前虚拟机的处理范围以内、常量池中的常量是否有不被支持的类型。
元数据验证：对字节码描述的信息进行语义分析（注意：对比javac编译阶段的语义分析），以保证其描述的信息符合Java语言规范的要求；例如：这个类是否有父类，除了 java.lang.Object以外。
字节码验证：经过数据流和控制流分析，肯定程序语义是合法的、符合逻辑的。
符号引用验证：确保解析动做能正确执行。

验证阶段是很是重要的，但不是必须的，它对程序运行期没有影响，若是所引用的类通过反复验证，那么能够考虑采用 -Xverifynone 参数来关闭大部分的类验证措施，以缩短虚拟机类加载的时间。

准备：为类的静态变量分配内存，并将其初始化为默认值

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段，这些内存都将在方法区中分配。对于该阶段有如下几点须要注意：

① 这时候进行内存分配的仅包括类变量（static），而不包括实例变量，实例变量会在对象实例化时随着对象一块分配在Java堆中。
② 这里所设置的初始值一般状况下是数据类型默认的零值（如0、0L、null、false等），而不是被在Java代码中被显式地赋予的值。

假设一个类变量的定义为： public static int value = 3;

那么变量value在准备阶段事后的初始值为 0，而不是 3，由于这时候还没有开始执行任何 Java 方法，而把 value 赋值为 3 的public static指令是在程序编译后，存放于类构造器 <clinit>（）方法之中的，因此把value赋值为3的动做将在初始化阶段才会执行。

这里还须要注意以下几点：

对基本数据类型来讲，对于类变量（static）和全局变量，若是不显式地对其赋值而直接使用，则系统会为其赋予默认的零值，而对于局部变量来讲，在使用前必须显式地为其赋值，不然编译时不经过。

对于同时被static和final修饰的常量，必须在声明的时候就为其显式地赋值，不然编译时不经过；而只被final修饰的常量则既能够在声明时显式地为其赋值，也能够在类初始化时显式地为其赋值，总之，在使用前必须为其显式地赋值，系统不会为其赋予默认零值。

对于引用数据类型reference来讲，如数组引用、对象引用等，若是没有对其进行显式地赋值而直接使用，系统都会为其赋予默认的零值，即null。

若是在数组初始化时没有对数组中的各元素赋值，那么其中的元素将根据对应的数据类型而被赋予默认的零值。

③ 若是类字段的字段属性表中存在 ConstantValue 属性，即同时被 final 和 static 修饰，那么在准备阶段变量 value 就会被初始化为 ConstValue 属性所指定的值。

假设上面的类变量 value 被定义为： public static final int value = 3;

编译时 Javac 将会为 value 生成 ConstantValue 属性，在准备阶段虚拟机就会根据 ConstantValue 的设置将 value 赋值为 3。咱们能够理解为 static final 常量在编译期就将其结果放入了调用它的类的常量池中

解析：把类中的符号引用转换为直接引用

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程，解析动做主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。符号引用就是一组符号来描述目标，能够是任何字面量。

直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

3.初始化

初始化，为类的静态变量赋予正确的初始值，JVM负责对类进行初始化，主要对类变量进行初始化。在Java中对类变量进行初始值设定有两种方式：

① 声明类变量是指定初始值
② 使用静态代码块为类变量指定初始值

JVM初始化步骤

一、假如这个类尚未被加载和链接，则程序先加载并链接该类
二、假如该类的直接父类尚未被初始化，则先初始化其直接父类
三、假如类中有初始化语句，则系统依次执行这些初始化语句

类初始化时机：只有当对类的主动使用的时候才会致使类的初始化，类的主动使用包括如下六种：

建立类的实例，也就是new的方式
访问某个类或接口的静态变量，或者对该静态变量赋值
调用类的静态方法
反射（如 Class.forName(“com.shengsiyuan.Test”)）
初始化某个类的子类，则其父类也会被初始化
Java虚拟机启动时被标明为启动类的类（ JavaTest），直接使用 java.exe命令来运行某个主类

结束生命周期

在以下几种状况下，Java虚拟机将结束生命周期

执行了 System.exit()方法
程序正常执行结束
程序在执行过程当中遇到了异常或错误而异常终止
因为操做系统出现错误而致使Java虚拟机进程终止

参考文章：jvm系列(一):java类的加载机制 - 纯洁的微笑

7）双亲委派模型（Parent Delegation Model）？

解析：类的加载过程采用双亲委派机制，这种机制能更好的保证 Java 平台的安全性

答：类加载器 ClassLoader 是具备层次结构的，也就是父子关系，其中，Bootstrap 是全部类加载器的父亲，以下图所示：

该模型要求除了顶层的 Bootstrap class loader 启动类加载器外，其他的类加载器都应当有本身的父类加载器。子类加载器和父类加载器不是以继承（Inheritance）的关系来实现，而是经过组合（Composition）关系来复用父加载器的代码。每一个类加载器都有本身的命名空间（由该加载器及全部父类加载器所加载的类组成，在同一个命名空间中，不会出现类的完整名字（包括类的包名）相同的两个类；在不一样的命名空间中，有可能会出现类的完整名字（包括类的包名）相同的两个类）

面试官：双亲委派模型的工做过程？

答：

1.当前 ClassLoader 首先从本身已经加载的类中查询是否此类已经加载，若是已经加载则直接返回原来已经加载的类。

每一个类加载器都有本身的加载缓存，当一个类被加载了之后就会放入缓存，
等下次加载的时候就能够直接返回了。

2.当前 ClassLoader 的缓存中没有找到被加载的类的时候，委托父类加载器去加载，父类加载器采用一样的策略，首先查看本身的缓存，而后委托父类的父类去加载，一直到 bootstrap ClassLoader.

当全部的父类加载器都没有加载的时候，再由当前的类加载器加载，并将其放入它本身的缓存中，以便下次有加载请求的时候直接返回。

面试官：为何这样设计呢？

解析：这是对于使用这种模型来组织累加器的好处

答：主要是为了安全性，避免用户本身编写的类动态替换 Java 的一些核心类，好比 String，同时也避免了重复加载，由于 JVM 中区分不一样类，不只仅是根据类名，相同的 class 文件被不一样的 ClassLoader 加载就是不一样的两个类，若是相互转型的话会抛java.lang.ClassCaseException.

二：JVM内存管理

1）JVM 内存划分：

答：

方法区（线程共享）：各个线程共享的一个区域，用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然 Java 虚拟机规范把方法区描述为堆的一个逻辑部分，可是它却又一个别名叫作 Non-Heap（非堆），目的应该是与 Java 堆区分开来。

运行时常量池：是方法区的一部分，用于存放编译器生成的各类字面量和符号引用。

堆内存（线程共享）：全部线程共享的一块区域，垃圾收集器管理的主要区域。目前主要的垃圾回收算法都是分代收集算法，因此 Java 堆中还能够细分为：新生代和老年代；再细致一点的有 Eden 空间、From Survivor 空间、To Survivor 空间等，默认状况下新生代按照8:1:1的比例来分配。根据 Java 虚拟机规范的规定，Java 堆能够处于物理上不连续的内存空间中，只要逻辑上是连续的便可，就像咱们的磁盘同样。
程序计数器： Java 线程私有，相似于操做系统里的 PC 计数器，它能够看作是当前线程所执行的字节码的行号指示器。若是线程正在执行的是一个 Java 方法，这个计数器记录的是正在执行的虚拟机字节码指令的地址；若是正在执行的是 Native 方法，这个计数器值则为空（Undefined）。此内存区域是惟一一个在 Java 虚拟机规范中没有规定任何 OutOfMemoryError 状况的区域。
虚拟机栈（栈内存）：Java线程私有，虚拟机展描述的是Java方法执行的内存模型：每一个方法在执行的时候，都会建立一个栈帧用于存储局部变量、操做数、动态连接、方法出口等信息；每一个方法调用都意味着一个栈帧在虚拟机栈中入栈到出栈的过程；
本地方法栈：和Java虚拟机栈的做用相似，区别是该区域为 JVM 提供使用 native 方法的服务

2）对象分配规则？

答：

对象优先分配在Eden区，若是Eden区没有足够的空间时，虚拟机执行一次Minor GC。
大对象直接进入老年代（大对象是指须要大量连续内存空间的对象）。这样作的目的是避免在Eden区和两个Survivor区之间发生大量的内存拷贝（新生代采用复制算法收集内存）。
长期存活的对象进入老年代。虚拟机为每一个对象定义了一个年龄计数器，若是对象通过了1次Minor GC那么对象会进入Survivor区，以后每通过一次Minor GC那么对象的年龄加1，知道达到阀值对象进入老年区。
动态判断对象的年龄。若是Survivor区中相同年龄的全部对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象能够直接进入老年代。
空间分配担保。每次进行Minor GC时，JVM会计算Survivor区移至老年区的对象的平均大小，若是这个值大于老年区的剩余值大小则进行一次Full GC，若是小于检查HandlePromotionFailure设置，若是true则只进行Monitor GC,若是false则进行Full GC。

3）Java 的内存模型：

答：

Java 虚拟机规范中试图定义一种 Java 内存模型（Java Memory Model, JMM）来屏蔽掉各层硬件和操做系统的内存访问差别，以实现让 Java 程序在各类平台下都能达到一致的内存访问效果。

Java 内存模型规定了全部的变量都存储在主内存（Main Memory）中。每条线程还有本身的工做内存（Working Memory），线程的工做内存中保存了被该线程使用到的变量的主内存副本拷贝，线程对变量的全部操做（读取、赋值等）都必须在主内存中进行，而不能直接读写主内存中的变量。不一样的线程之间也没法直接访问对方工做内存中的变量，线程间的变量值的传递均须要经过主内存来完成，线程、主内存、工做内存三者的关系如上图。

面试官：两个线程之间是如何通讯的呢？

答：在共享内存的并发模型里，线程之间共享程序的公共状态，线程之间经过写-读内存中的公共状态来隐式进行通讯，典型的共享内存通讯方式就是经过共享对象进行通讯。

例如上图线程 A 与线程 B 之间若是要通讯的话，那么就必须经历下面两个步骤：

1.首先，线程 A 把本地内存 A 更新过得共享变量刷新到主内存中去
2.而后，线程 B 到主内存中去读取线程 A 以前更新过的共享变量

在消息传递的并发模型里，线程之间没有公共状态，线程之间必须经过明确的发送消息来显式进行通讯，在 Java 中典型的消息传递方式就是 wait() 和 notify()。

5）内存屏障？

解析：在这以前应该对重排序的问题有所了解，这里我找到一篇很好的文章分享一下：Java内存访问重排序的研究

答：内存屏障，又称内存栅栏，是一组处理器指令，用于实现对内存操做的顺序限制。

面试官：内存屏障为什么重要？

答：对主存的一次访问通常花费硬件的数百次时钟周期。处理器经过缓存（caching）可以从数量级上下降内存延迟的成本这些缓存为了性能从新排列待定内存操做的顺序。也就是说，程序的读写操做不必定会按照它要求处理器的顺序执行。当数据是不可变的，同时/或者数据限制在线程范围内，这些优化是无害的。若是把这些优化与对称多处理（symmetric multi-processing）和共享可变状态（shared mutable state）结合，那么就是一场噩梦。当基于共享可变状态的内存操做被从新排序时，程序可能行为不定。一个线程写入的数据可能被其余线程可见，缘由是数据写入的顺序不一致。适当的放置内存屏障经过强制处理器顺序执行待定的内存操做来避免这个问题。

5）相似-Xms、-Xmn这些参数的含义：

答：

堆内存分配：

JVM初始分配的内存由-Xms指定，默认是物理内存的1/64
JVM最大分配的内存由-Xmx指定，默认是物理内存的1/4
默认空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减小堆直到 -Xms的最小限制。
所以服务器通常设置-Xms、-Xmx相等以免在每次GC 后调整堆的大小。对象的堆内存由称为垃圾回收器的自动内存管理系统回收。

非堆内存分配：

JVM使用-XX:PermSize设置非堆内存初始值，默认是物理内存的1/64；
由XX:MaxPermSize设置最大非堆内存的大小，默认是物理内存的1/4。
-Xmn2G：设置年轻代大小为2G。
-XX:SurvivorRatio，设置年轻代中Eden区与Survivor区的比值。

6）内存泄漏和内存溢出

答：

概念：

内存溢出指的是内存不够用了。
内存泄漏是指对象可达，可是没用了。即本该被GC回收的对象并无被回收
内存泄露是致使内存溢出的缘由之一；内存泄露积累起来将致使内存溢出。

内存泄漏的缘由分析：

长生命周期的对象引用短生命周期的对象
没有将无用对象置为null

小结：本小节涉及到 JVM 虚拟机，包括对内存的管理等知识，相对较深。除了以上问题，面试官会继续问你一些比较深的问题，可能也是为了看看你的极限在哪里吧。好比：内存调优、内存管理，是否遇到过内存泄露的实际案例、是否真正关心过内存等。

7）简述一下 Java 中建立一个对象的过程？

解析：回答这个问题首先就要清楚类的生命周期

答：下图展现的是类的生命周期流向：

Java中对象的建立就是在堆上分配内存空间的过程，此处说的对象建立仅限于new关键字建立的普通Java对象，不包括数组对象的建立。

大体过程以下：

1.检测类是否被加载：

当虚拟机执行到new时，会先去常量池中查找这个类的符号引用。若是能找到符号引用，说明此类已经被加载到方法区（方法区存储虚拟机已经加载的类的信息），能够继续执行；若是找不到符号引用，就会使用类加载器执行类的加载过程，类加载完成后继续执行。

2.为对象分配内存：

类加载完成之后，虚拟机就开始为对象分配内存，此时所需内存的大小就已经肯定了。只须要在堆上分配所须要的内存便可。

具体的分配内存有两种状况：第一种状况是内存空间绝对规整，第二种状况是内存空间是不连续的。

对于内存绝对规整的状况相对简单一些，虚拟机只须要在被占用的内存和可用空间之间移动指针便可，这种方式被称为指针碰撞。
对于内存不规整的状况稍微复杂一点，这时候虚拟机须要维护一个列表，来记录哪些内存是可用的。分配内存的时候须要找到一个可用的内存空间，而后在列表上记录下已被分配，这种方式成为空闲列表。

分配内存的时候也须要考虑线程安全问题，有两种解决方案：

第一种是采用同步的办法，使用CAS来保证操做的原子性。
另外一种是每一个线程分配内存都在本身的空间内进行，便是每一个线程都在堆中预先分配一小块内存，称为本地线程分配缓冲（TLAB），分配内存的时候再TLAB上分配，互不干扰。

3.为分配的内存空间初始化零值：

对象的内存分配完成后，还须要将对象的内存空间都初始化为零值，这样能保证对象即便没有赋初值，也能够直接使用。

4.对对象进行其余设置：

分配完内存空间，初始化零值以后，虚拟机还须要对对象进行其余必要的设置，设置的地方都在对象头中，包括这个对象所属的类，类的元数据信息，对象的hashcode，GC分代年龄等信息。

5.执行 init 方法：

执行完上面的步骤以后，在虚拟机里这个对象就算建立成功了，可是对于Java程序来讲还须要执行init方法才算真正的建立完成，由于这个时候对象只是被初始化零值了，尚未真正的去根据程序中的代码分配初始值，调用了init方法以后，这个对象才真正能使用。

到此为止一个对象就产生了，这就是new关键字建立对象的过程。过程以下：

参考文章：Java建立对象的过程简介

面试官：对象的内存局是怎样的？

答：对象的内存布局包括三个部分：对象头，实例数据和对齐填充。

对象头：对象头包括两部分信息，第一部分是存储对象自身的运行时数据，如哈希码，GC分代年龄，锁状态标志，线程持有的锁等等。第二部分是类型指针，即对象指向类元数据的指针。
实例数据：就是数据啦
对齐填充：不是必然的存在，就是为了对齐的嘛

面试官：对象是如何定位访问的？

答：对象的访问定位有两种：句柄定位和直接指针

句柄定位：Java 堆会画出一块内存来做为句柄池，reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自的具体地址信息

直接指针访问：java堆对象的不居中就必须考虑如何放置访问类型数据的相关信息，而reference中存储的直接就是对象地址

比较：使用直接指针就是速度快，使用句柄reference指向稳定的句柄，对象被移动改变的也只是句柄中实例数据的指针，而reference自己并不须要修改。

三：相关面试题整理

1）64 位 JVM 中，int 的长度是多数？

答：Java 中，int 类型变量的长度是一个固定值，与平台无关，都是 32 位或者 4 个字节。意思就是说，在 32 位和 64 位的Java 虚拟机中，int 类型的长度是相同的。

2）怎样经过 Java 程序来判断 JVM 是 32 位仍是 64 位？

答：Sun有一个Java System属性来肯定JVM的位数：32或64：

sun.arch.data.model=32 // 32 bit JVMsun.arch.data.model=64 // 64 bit JVM

我可使用如下语句来肯定 JVM 是 32 位仍是 64 位：

System.getProperty("sun.arch.data.model")

3）32 位 JVM 和 64 位 JVM 的最大堆内存分别是多数？

答：理论上说上 32 位的 JVM 堆内存能够到达 2^32，即 4GB，但实际上会比这个小不少。不一样操做系统之间不一样，如 Windows 系统大约 1.5 GB，Solaris 大约 3GB。64 位 JVM容许指定最大的堆内存，理论上能够达到 2^64，这是一个很是大的数字，实际上你能够指定堆内存大小到 100GB。甚至有的 JVM，如 Azul，堆内存到 1000G 都是可能的。

4）你能保证 GC 执行吗？

答：不能，虽然你能够调用 System.gc() 或者 Runtime.gc()，可是没有办法保证 GC 的执行。

5）怎么获取 Java 程序使用的内存？堆使用的百分比？

答：能够经过 java.lang.Runtime 类中与内存相关方法来获取剩余的内存，总内存及最大堆内存。经过这些方法你也能够获取到堆使用的百分比及堆内存的剩余空间。Runtime.freeMemory() 方法返回剩余空间的字节数，Runtime.totalMemory() 方法总内存的字节数，Runtime.maxMemory() 返回最大内存的字节数。

6）Java 中堆和栈有什么区别？

答：JVM 中堆和栈属于不一样的内存区域，使用目的也不一样。栈经常使用于保存方法帧和局部变量，而对象老是在堆上分配。栈一般都比堆小，也不会在多个线程之间共享，而堆被整个 JVM 的全部线程共享。