虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验,转换解析和初始化,最终造成能够被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。java
Java中语言里,类型的加载,链接和初始化都是在程序运行期间完成的,这种策略虽然会令类加载时稍微增长一些性能开销,可是会为Java应用程序提供高度的灵活性,Java里天生可动态扩展的语言特性就是依赖运行期动态加载和动态链接这个特色实现的.程序员
类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中验证、准备、解析3个部分统称为链接(Linking)、这7个阶段的发生顺序如图所示。数组
加载、验证、准备、初始化和卸载这5个阶段的顺序是肯定的,类的加载过程必须按照这种顺序循序渐进地开始,而解析阶段则不必定:它在某些状况下能够在初始化以后再循序渐进地开始,这是为了支持Java语言的运行时绑定。安全
什么状况下须要开始类加载过程的第一个阶段?Java虚拟机规范并无进行强制约束,但对于初始化阶段,虚拟机规范则严格规定了有且只有5种状况必须对类进行“初始化”(加载、验证、准备天然须要在此以前开始):数据结构
1)遇到new、getstatic、putstatic或invokestatic这4条字节码指令时,若是类没有进行初始化,则须要先触发其初始化。生成这4条指令的最多见Java代码场景是:使用new关键字实例化对象的时候、读取或设置一个类的静态字段的时候,以及调用一个类的静态方法的时候。布局
2)使用java.lang.reflect包的方法对类进行反射调用的时候,若是类没有进行过初始化,则须要先触发其初始化。性能
3)当初始化一个类的时候,若是其父类尚未进行过初始化,则须要先触发其父类的初始化。spa
4)当虚拟机启动时,用户须要指定一个要执行的主类(包含main方法的类),虚拟机会先初始化这个主类。线程
5)当使用JDK1.7动态语言支持时,若是一个java.lang.invoke.MethodHandle实例最后解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,而且这个方法句柄对应的类没有初始化,则须要先触发其初始化。翻译
这五种场景的行为称为对一个类进行主动引用。除此以外,全部引用类的方式都不会触发初始化,称为被动引用。
“加载”是“类加载”过程的一个阶段,在加载阶段,虚拟机须要完成如下3件事情:
对于数组类而言,状况与非数组类有所不一样,数组类自己不经过类加载器建立,它是由java虚拟机直接建立的。但数组类与类加载器仍然有很密切的关系,由于数组类元素类型最终是要靠类加载器去建立,一个数组类建立过程遵循如下规则:
加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所须要的格式存储在方法区之中,方法区的数据存储格式由虚拟机实现自行定义。而后在内存中实例化一个java.lang.Class对象(HotSpot虚拟机中,Class对象比较特殊,虽然是对象,可是存放在方法区中),这个对象将做为程序访问方法区中这些类型数据的外部接口。
加载阶段与链接阶段的部份内容(如一部分字节码文件格式验证动做)是交叉进行的,加载阶段还没有完成,链接阶段可能已经开始,但这些夹在加载阶段之中进行的动做,仍然属于链接阶段的内容,这两个阶段的开始时间仍然保持着固定的前后顺序。
验证是链接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,而且不会危害虚拟机自身的安全。
Java语言自己是相对安全的语言,使用纯粹的Java代码没法作到诸如访问数组边界意外的数据、将一个对象转型为它并未实现的类型、跳转到不存在的代码行之类的事情,若是这样作了,编译器将拒绝编译。Class文件并不必定非要由Java源码编译而来,可使用任何途径产生,在字节码语言层面上,上述java代码没法作到的事情都是能够实现的。虚拟机若是不检查输入的字节流,对其彻底信任的话,极可能会由于载入了有害的字节流而致使系统的崩溃,因此验证是虚拟机对自身保护的一项重要工做。
验证阶段是否严谨,决定了java虚拟机是否可以承受恶意代码的攻击,从执行性能的角度上讲,验证阶段的工做量在虚拟机的类加载子系统中又占了至关大的一部分。总体上看,验证阶段大体会完成4个阶段的检验动做:文件格式验证、元数据验证、字节码验证、符号引用验证。
准备阶段是正式为变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。这个阶段中有两个容易产生混淆的概念,这时候进行内存分配的仅包括类变量(static修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一块儿分配在java堆中。其次,这里所说的初始值“一般状况”下是数据类型的零值
一些“特殊状况”:若是类字段的字段属性表存在ConstantValue属性,那在准备阶段变量value就会被初始化为ConstantValue所指定的值,假设类变量定义为public static final int value = 123;
编译时javac会为value生成ConstantValue属性,在准备阶段虚拟机就会根据ConstantValue的设置将value赋值为123。
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
类初始化阶段是类加载过程的最后一步,前面的类加载过程当中,除了在加载阶段用户应用程序能够经过自定义类加载器以外,其他彻底由虚拟机主导和控制。到了初始化阶段,才真正开始执行类中定义的Java程序代码。
在准备阶段,变量已经赋过一次初始值,而在初始化阶段,则根据程序员经过程序制定的主观计划去初始化类变量和其余资源。
虚拟机设计团队把类加载阶段中“经过一个类的全限定名来获取描述此类的二进制字节流”这个动做放到Java虚拟机外部去实现,以便让程序本身决定如何去获取所须要的类,实现这个动做的代码模块称为“类加载器”。
类加载器虽然只用于实现类的加载动做,但它在Java程序中起到的做用却远远不限于类加载阶段。对于任意一个类,都须要由加载它的类加载器和这个类自己一同确立其在Java虚拟机中的惟一性,每个类加载器都拥有一个独立的类名称空间。比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,不然,即便这两个类来源于同一个Class文件,被同一个虚拟机加载,只要加载它们的类加载器不一样,那这两个类就一定不相等。
这里所指的“相等”,包括表明类的Class对象的equals方法,isAssignableFrom方法、isInstance方法返回结果,也包括使用instanceof关键字作对象所属关系断定等状况。
从Java虚拟机的角度来说,只存在两种不一样的类加载器:一种是启动类加载器(Bootstrap ClassLoader),这个类加载器由C++语言实现,是虚拟机的一部分;另外一种就是全部其余的类加载器,这些类加载器都是由Java语言实现,独立于虚拟机外部,而且全都继承自抽象类java.lang.ClassLoader。
从Java开发人员的角度来看,类加载器还能够划分的更细致:
上图中展现的这种类加载器之间的层次关系,称为类加载器的双亲委派模型(Parents Delegation Model)。双亲委派模型要求除了顶层的启动类加载器外,其他的类加载器都应当有本身的父类加载器,这里类加载器的父子关系通常不会以继承(Inheritace)的关系来实现,而是都是用组合(Composition)关系来复用父加载器的代码。
双亲委派模型的工做过程是:若是一个类加载器收到了类加载的请求,它首先不会本身去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每个层次的类加载器都是如此,所以全部的加载请求最终都会传送到启动类加载器中,只有当父加载器反馈本身没法完成这个加载请求时,子加载器才会尝试本身去加载。
使用双亲委派模型来组织类加载器之间的关系,有一个显而易见的好处就是Java类随着它的类加载器一块儿具有了一种带有优先级的层器关系,例如Object类它存放在rt.jar之中,不管哪一个类加载器要加载这个类,最终都是委派给处于模型顶端的启动类加载器进行加载,所以Object类在程序各个类加载器环境中都是同一个类,相反,若是没有双亲委派模型,由各个类加载器自行加载的话,若是用户本身编写了一个Object类并放在classpath中,那系统中将出现多个不一样的Object类,应用程序也会变得混乱。
双亲委派模型对于保证Java程序的稳定运行很重要但实现却很是简单,先检查是否已经被加载过,若是没有就调用父加载器的loadClass方法,若父加载器为空则默认使用启动类加载器做为父加载器,若是父加载器加载失败,抛出ClassNotFoundException后,在调用本身的loadClass方法进行加载。
线程上下文类加载器(Thread Context ClassLoader)。这个类加载器能够经过java.lang.Thread类的setContextClassLoader方法进行设置,若是建立线程时还未设置,他将会从父线程中继承一个,若是在应用程序的全局范围内都没有设置过,那这个类加载器默认就是应用程序类加载器。
有了线程上下文类加载器,就能够父类加载器请求子类加载器完成类加载动做,这种行为就是打通了双亲委派模型的层次结构来逆向使用类加载器,实际上已经违背了双亲委派模型的通常性原则。