你知道 Java 类是如何被加载的吗？

时间 2019-11-19

标签知道 java 如何加载栏目 Java 繁體版

原文原文链接

一：前言

最近给一个非Java方向的朋友讲了下双亲委派模型，朋友让我写篇文章深度研究下JVM的ClassLoader，我确实也很久没写JVM相关的文章了，有点手痒痒，涂了皮炎平也抑制不住。java

我在向朋友解释的时候是这么说的：双亲委派模型中，ClassLoader在加载类的时候，会先交由它的父ClassLoader加载，只有当父ClassLoader加载失败的状况下，才会尝试本身去加载。这样能够实现部分类的复用，又能够实现部分类的隔离，由于不一样ClassLoader加载的类是互相隔离的。数据结构

不过贸然的向别人解释双亲委派模型是不妥的，若是在不了解JVM的类加载机制的状况下，又如何能很好的理解“不一样ClassLoader加载的类是互相隔离的”这句话呢？因此为了理解双亲委派，最好的方式，就是先了解下ClassLoader的加载流程。并发

二：Java 类是如何被加载的

2.1：什么时候加载类
咱们首先要清楚的是，Java类什么时候会被加载？dom

《深刻理解Java虚拟机》给出的答案是：jvm

1：遇到new、getstatic、putstatic 等指令时。
2：对类进行反射调用的时候。
3：初始化某个类的子类的时候。
4：虚拟机启动时会先加载设置的程序主类。
5：使用JDK 1.7 的动态语言支持的时候。
其实要我说，最通俗易懂的答案就是：当运行过程当中须要这个类的时候。ide

那么咱们不妨就从如何加载类开始提及。函数

2.2：怎么加载类
利用ClassLoader加载类很简单，直接调用ClassLoder的loadClass（）方法便可，我相信你们都会，可是仍是要举个栗子：工具

public class Test {
    public static void main(String[] args) throws ClassNotFoundException {
        Test.class.getClassLoader().loadClass("com.wangxiandeng.test.Dog");
    }
}

上面这段代码便实现了让ClassLoader去加载 “com.wangxiandeng.test.Dog” 这个类，是否是 so easy。可是JDK 提供的 API 只是冰山一角，看似很简单的一个调用，其实隐藏了很是多的细节，我这我的吧，最喜欢作的就是去揭开 API 的封装，一探究竟。oop

2.3：JVM 是怎么加载类的
JVM 默认用于加载用户程序的ClassLoader为AppClassLoader，不过不管是什么ClassLoader，它的根父类都是java.lang.ClassLoader。在上面那个例子中，loadClass（）方法最终会调用到ClassLoader.definClass1（）中，这是一个 Native 方法。源码分析

static native Class<?> defineClass1(ClassLoader loader, String name, byte[] b, int off, int len,
                                        ProtectionDomain pd, String source);

看到 Native 方法莫心慌，不要急，打开OpenJDK源码，我等继续蜻蜓点水即是！

definClass1（）对应的 JNI 方法为 Java_java_lang_ClassLoader_defineClass1（）

JNIEXPORT jclass JNICALL
Java_java_lang_ClassLoader_defineClass1(JNIEnv *env,
                                        jclass cls,
                                        jobject loader,
                                        jstring name,
                                        jbyteArray data,
                                        jint offset,
                                        jint length,
                                        jobject pd,
                                        jstring source)
{
    ......
    result = JVM_DefineClassWithSource(env, utfName, loader, body, length, pd, utfSource);
    ......
    return result;
}

Java_java_lang_ClassLoader_defineClass1 主要是调用了JVM_DefineClassWithSource（）加载类，跟着源码往下走，会发现最终调用的是 jvm.cpp 中的 jvm_define_class_common（）方法。

static jclass jvm_define_class_common(JNIEnv *env, const char *name,
                                      jobject loader, const jbyte *buf,
                                      jsize len, jobject pd, const char *source,
                                      TRAPS) {
  ......
  ClassFileStream st((u1*)buf, len, source, ClassFileStream::verify);
  Handle class_loader (THREAD, JNIHandles::resolve(loader));
  if (UsePerfData) {
    is_lock_held_by_thread(class_loader,
                           ClassLoader::sync_JVMDefineClassLockFreeCounter(),
                           THREAD);
  }
  Handle protection_domain (THREAD, JNIHandles::resolve(pd));
  Klass* k = SystemDictionary::resolve_from_stream(class_name,
                                                   class_loader,
                                                   protection_domain,
                                                   &st,
                                                   CHECK_NULL);
  ......

  return (jclass) JNIHandles::make_local(env, k->java_mirror());
}

上面这段逻辑主要就是利用 ClassFileStream 将要加载的class文件转成文件流，而后调用SystemDictionary::resolve_from_stream（），生成 Class 在 JVM 中的表明：Klass。对于Klass，你们可能不太熟悉，可是在这里必须得了解下。说白了，它就是JVM 用来定义一个Java Class 的数据结构。不过Klass只是一个基类，Java Class 真正的数据结构定义在 InstanceKlass中。

class InstanceKlass: public Klass {
 
 protected:
 
  Annotations*    _annotations;
  ......
  ConstantPool* _constants;
  ......
  Array<jushort>* _inner_classes;
  ......
  Array<Method*>* _methods;
  Array<Method*>* _default_methods;
  ......
  Array<u2>*      _fields;
}

可见 InstanceKlass 中记录了一个 Java 类的全部属性，包括注解、方法、字段、内部类、常量池等信息。这些信息原本被记录在Class文件中，因此说，InstanceKlass就是一个Java Class 文件被加载到内存后的形式。

再回到上面的类加载流程中，这里调用了 SystemDictionary::resolve_from_stream（），将 Class 文件加载成内存中的 Klass。

resolve_from_stream（）即是重中之重！主要逻辑有下面几步：

1：判断是否容许并行加载类，并根据判断结果进行加锁。

bool DoObjectLock = true;
if (is_parallelCapable(class_loader)) {
  DoObjectLock = false;
}
ClassLoaderData* loader_data = register_loader(class_loader, CHECK_NULL);
Handle lockObject = compute_loader_lock_object(class_loader, THREAD);
check_loader_lock_contention(lockObject, THREAD);
ObjectLocker ol(lockObject, THREAD, DoObjectLock);

若是容许并行加载，则不会对ClassLoader进行加锁，只对SystemDictionary加锁。不然，便会利用 ObjectLocker 对ClassLoader 加锁，保证同一个ClassLoader在同一时刻只能加载一个类。ObjectLocker 会在其构造函数中获取锁，并在析构函数中释放锁。

容许并行加载的好处即是精细化了锁粒度，这样能够在同一时刻加载多个Class文件。

2：解析文件流，生成 InstanceKlass。

InstanceKlass* k = NULL;

k = KlassFactory::create_from_stream(st,
                                         class_name,
                                         loader_data,
                                         protection_domain,
                                         NULL, // host_klass
                                         NULL, // cp_patches
                                         CHECK_NULL);

3：利用SystemDictionary注册生成的 Klass。

SystemDictionary 是用来帮助保存 ClassLoader 加载过的类信息的。准确点说，SystemDictionary并非一个容器，真正用来保存类信息的容器是 Dictionary，每一个ClassLoaderData 中都保存着一个私有的 Dictionary，而 SystemDictionary 只是一个拥有不少静态方法的工具类而已。

咱们来看看注册的代码：

if (is_parallelCapable(class_loader)) {
  InstanceKlass* defined_k = find_or_define_instance_class(h_name, class_loader, k, THREAD);
  if (!HAS_PENDING_EXCEPTION && defined_k != k) {
    // If a parallel capable class loader already defined this class, register 'k' for cleanup.
    assert(defined_k != NULL, "Should have a klass if there's no exception");
    loader_data->add_to_deallocate_list(k);
    k = defined_k;
  }
} else {
  define_instance_class(k, THREAD);
}

若是容许并行加载，那么前面就不会对ClassLoader加锁，因此在同一时刻，可能对同一Class文件加载了屡次。可是同一Class在同一ClassLoader中必须保持惟一性，因此这里会先利用 SystemDictionary 查询 ClassLoader 是否已经加载过相同 Class。

若是已经加载过，那么就将当前线程刚刚加载的InstanceKlass加入待回收列表，并将 InstanceKlass* k 从新指向利用SystemDictionary查询到的 InstanceKlass。
若是没有查询到，那么就将刚刚加载的 InstanceKlass 注册到 ClassLoader的 Dictionary 中中。
虽然并行加载不会锁住ClassLoader，可是会在注册 InstanceKlass 时对 SystemDictionary 加锁，因此不须要担忧InstanceKlass 在注册时的并发操做。

若是禁止了并行加载，那么直接利用SystemDictionary将 InstanceKlass 注册到 ClassLoader的 Dictionary 中便可。

resolve_from_stream（）的主要流程就是上面三步，很明显，最重要的是第二步，从文件流生成InstanceKlass。

生成InstanceKlass 调用的是 KlassFactory::create_from_stream（）方法，它的主要逻辑就是下面这段代码。

ClassFileParser parser(stream,
                       name,
                       loader_data,
                       protection_domain,
                       host_klass,
                       cp_patches,
                       ClassFileParser::BROADCAST, // publicity level
                       CHECK_NULL);

InstanceKlass* result = parser.create_instance_klass(old_stream != stream, CHECK_NULL);

原来 ClassFileParser 才是真正的主角啊！它才是将Class文件升华成InstanceKlass的幕后大佬！

2.4：不得不说的ClassFileParser
ClassFileParser 加载Class文件的入口即是 create_instance_klass（）。顾名思义，用来建立InstanceKlass的。

create_instance_klass（）主要就干了两件事：

(1)：为 InstanceKlass 分配内存

InstanceKlass* const ik =
    InstanceKlass::allocate_instance_klass(*this, CHECK_NULL);

(2)：分析Class文件，填充 InstanceKlass 内存区域

fill_instance_klass(ik, changed_by_loadhook, CHECK_NULL);
咱们先来讲道说道第一件事，为 InstanceKlass 分配内存。

内存分配代码以下：

const int size = InstanceKlass::size(parser.vtable_size(),
                                       parser.itable_size(),
                                       nonstatic_oop_map_size(parser.total_oop_map_count()),
                                       parser.is_interface(),
                                       parser.is_anonymous(),
                                       should_store_fingerprint(parser.is_anonymous()));
ClassLoaderData* loader_data = parser.loader_data();
InstanceKlass* ik;
ik = new (loader_data, size, THREAD) InstanceKlass(parser, InstanceKlass::_misc_kind_other);

这里首先计算了InstanceKlass在内存中的大小，要知道，这个大小在Class 文件编译后就被肯定了。

而后便 new 了一个新的 InstanceKlass 对象。这里并非简单的在堆上分配内存，要注意的是Klass 对 new 操做符进行了重载：

void* Klass::operator new(size_t size, ClassLoaderData* loader_data, size_t word_size, TRAPS) throw() {
  return Metaspace::allocate(loader_data, word_size, MetaspaceObj::ClassType, THREAD);
}

分配 InstanceKlass 的时候调用了 Metaspace::allocate（）：

MetaspaceObj::Type type, TRAPS) {
  ......
  MetadataType mdtype = (type == MetaspaceObj::ClassType) ? ClassType : NonClassType;
  ......
  MetaWord* result = loader_data->metaspace_non_null()->allocate(word_size, mdtype);
  ......
  return result;
}

因而可知，InstanceKlass 是分配在 ClassLoader的 Metaspace（元空间）的方法区中。从 JDK8 开始，HotSpot 就没有了永久代，类都分配在 Metaspace 中。Metaspace 和永久代不同，采用的是 Native Memory，永久代因为受限于 MaxPermSize，因此当内存不够时会内存溢出。

分配完 InstanceKlass 内存后，便要着手第二件事，分析Class文件，填充 InstanceKlass 内存区域。

ClassFileParser 在构造的时候就会开始分析Class文件，因此fill_instance_klass（）中只须要填充便可。填充结束后，还会调用 java_lang_Class::create_mirror（）建立 InstanceKlass 在Java 层的 Class 对象。

void ClassFileParser::fill_instance_klass(InstanceKlass* ik, bool changed_by_loadhook, TRAPS) {
  .....
  ik->set_class_loader_data(_loader_data);
  ik->set_nonstatic_field_size(_field_info->nonstatic_field_size);
  ik->set_has_nonstatic_fields(_field_info->has_nonstatic_fields);
  ik->set_static_oop_field_count(_fac->count[STATIC_OOP]);
  ik->set_name(_class_name);
  ......

  java_lang_Class::create_mirror(ik,
                                 Handle(THREAD, _loader_data->class_loader()),
                                 module_handle,
                                 _protection_domain,
                                 CHECK);
}

顺便提一句，对于Class文件结构不熟悉的同窗，能够看下我两年前写的一篇文章：

《汪先生：Jvm之用java解析class文件》

到这儿，Class文件已经完成了华丽的转身，由冷冰冰的二进制文件，变成了内存中充满生命力的InstanceKlass。

三：再谈双亲委派

若是你耐心的看完了上面的源码分析，你必定对 “不一样ClassLoader加载的类是互相隔离的” 这句话的理解又上了一个台阶。

咱们总结下：每一个ClassLoader都有一个 Dictionary 用来保存它所加载的InstanceKlass信息。而且，每一个 ClassLoader 经过锁，保证了对于同一个Class，它只会注册一份 InstanceKlass 到本身的 Dictionary 。

正式因为上面这些缘由，若是全部的 ClassLoader 都由本身去加载 Class 文件，就会致使对于同一个Class文件，存在多份InstanceKlass，因此即便是同一个Class文件，不一样InstanceKlasss 衍生出来的实例类型也是不同的。

举个栗子，咱们自定义一个 ClassLoader，用来打破双亲委派模型：

public class CustomClassloader extends URLClassLoader {

    public CustomClassloader(URL[] urls) {
        super(urls);
    }

    @Override
    protected Class<?> loadClass(String name, boolean resolve) throws ClassNotFoundException {
        if (name.startsWith("com.wangxiandeng")) {
            return findClass(name);
        }
        return super.loadClass(name, resolve);
    }
}

再尝试加载Studen类，并实例化：

public class Test {

    public static void main(String[] args) throws Exception {
        URL url[] = new URL[1];
        url[0] = Thread.currentThread().getContextClassLoader().getResource("");

        CustomClassloader customClassloader = new CustomClassloader(url);
        Class clazz = customClassloader.loadClass("com.wangxiandeng.Student");

        Student student = (Student) clazz.newInstance();
    }
}

运行后便会抛出类型强转异常：

Exception in thread "main" java.lang.ClassCastException:
      com.wangxiandeng.Student cannot be cast to com.wangxiandeng.Student

为何呢？

由于实例化的Student对象所属的 InstanceKlass 是由CustomClassLoader加载生成的，而咱们要强转的类型Student.Class 对应的 InstanceKlass 是由系统默认的ClassLoader生成的，因此本质上它们就是两个毫无关联的InstanceKlass，固然不能强转。

有同窗问到：为何“强转的类型Student.Class 对应的 InstanceKlass 是由系统默认的ClassLoader生成的”？
其实很简单，咱们反编译下字节码：

public static void main(java.lang.String[]) throws java.lang.Exception;
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=4, locals=5, args_size=1
         0: iconst_1
         1: anewarray     #2                  // class java/net/URL
         4: astore_1
         5: aload_1
         6: iconst_0
         7: invokestatic  #3                  // Method java/lang/Thread.currentThread:()Ljava/lang/Thread;
        10: invokevirtual #4                  // Method java/lang/Thread.getContextClassLoader:()Ljava/lang/ClassLoader;
        13: ldc           #5                  // String
        15: invokevirtual #6                  // Method java/lang/ClassLoader.getResource:(Ljava/lang/String;)Ljava/net/URL;
        18: aastore
        19: new           #7                  // class com/wangxiandeng/classloader/CustomClassloader
        22: dup
        23: aload_1
        24: invokespecial #8                  // Method com/wangxiandeng/classloader/CustomClassloader."<init>":([Ljava/net/URL;)V
        27: astore_2
        28: aload_2
        29: ldc           #9                  // String com.wangxiandeng.Student
        31: invokevirtual #10                 // Method com/wangxiandeng/classloader/CustomClassloader.loadClass:(Ljava/lang/String;)Ljava/lang/Class;
        34: astore_3
        35: aload_3
        36: invokevirtual #11                 // Method java/lang/Class.newInstance:()Ljava/lang/Object;
        39: checkcast     #12                 // class com/wangxiandeng/Student
        42: astore        4
        44: return

能够看到在利用加载的Class初始化实例后，调用了 checkcast 进行类型转化，checkcast 后的操做数 #12 即为Student这个类在常量池中的索引：

#12 = Class #52 // com/wangxiandeng/Student
下面咱们能够看看 checkcast 在HotSpot中的实现。
HotSpot 目前有三种字节码执行引擎，目前采用的是模板解释器，能够看下我这篇文章：《汪先生：JVM之模板解释器》。
早期的HotSpot采用的是字节码解释器。模板解释器对于指令的执行都是用汇编写的，而字节码解释器采用的C++进行的翻译，为了看起来比较舒服，咱们就不看汇编了，直接看字节码解释器就好了。若是你的汇编功底很好，固然也能够直接看模板解释器，我以前写的文章《汪先生：JVM之建立对象源码分析》这里就是分析模板解释器对于 new 指令的实现。

废话很少说，咱们来看看字节码解释器对于checkcast的实现，代码在 bytecodeInterpreter.cpp 中

CASE(_checkcast):
    if (STACK_OBJECT(-1) != NULL) {
      VERIFY_OOP(STACK_OBJECT(-1));
      // 拿到 checkcast 指令后的操做数，本例子中即 Student.Class 在常量池中的索引：#12
      u2 index = Bytes::get_Java_u2(pc+1);
      
      // 若是常量池尚未解析，先进行解析，即将常量池中的符号引用替换成直接引用，
      //此时就会触发Student.Class 的加载
      if (METHOD->constants()->tag_at(index).is_unresolved_klass()) {
        CALL_VM(InterpreterRuntime::quicken_io_cc(THREAD), handle_exception);
      }
      // 获取上一步系统加载的Student.Class 对应的 InstanceKlass
      Klass* klassOf = (Klass*) METHOD->constants()->resolved_klass_at(index);
      // 获取要强转的对象的实际类型，即咱们本身手动加载的Student.Class 对应的 InstanceKlass
      Klass* objKlass = STACK_OBJECT(-1)->klass(); // ebx
     
      // 如今就比较简单了，直接看看上面的两个InstanceKlass指针内容是否相同
      // 不一样的状况下则判断是否存在继承关系
      if (objKlass != klassOf && !objKlass->is_subtype_of(klassOf)) {
        // Decrement counter at checkcast.
        BI_PROFILE_SUBTYPECHECK_FAILED(objKlass);
        ResourceMark rm(THREAD);
        char* message = SharedRuntime::generate_class_cast_message(
          objKlass, klassOf);
        VM_JAVA_ERROR(vmSymbols::java_lang_ClassCastException(), message, note_classCheck_trap);
      }
      // Profile checkcast with null_seen and receiver.
      BI_PROFILE_UPDATE_CHECKCAST(/*null_seen=*/false, objKlass);
    } else {
      // Profile checkcast with null_seen and receiver.
      BI_PROFILE_UPDATE_CHECKCAST(/*null_seen=*/true, NULL);
    }

经过对上面代码的分析，我相信你们已经理解了 “强转的类型Student.Class 对应的 InstanceKlass 是由系统默认的ClassLoader生成的” 这句话了。

双亲委派的好处是尽可能保证了同一个Class文件只会生成一个InstanceKlass，可是某些状况，咱们就不得不去打破双亲委派了，好比咱们想实现Class隔离的时候。

回复下箫陌同窗的问题：

// 若是常量池尚未解析，先进行解析，即将常量池中的符号引用替换成直接引用，
//此时就会触发Student.Class 的加载
if (METHOD->constants()->tag_at(index).is_unresolved_klass()) {
CALL_VM(InterpreterRuntime::quicken_io_cc(THREAD), handle_exception);
}
请问，为什么这里会从新加载Student.Class？jvm是否是有本身的class加载链路，而后系统循着链路去查找class是否已经被加载？那该怎么把自定义的CustomClassloader 加到这个查询链路中去呢？

第一种方法：设置启动参数 java -Djava.system.class.loader

第二种方法：利用Thread.setContextClassLoder

这里就有点技巧了，看下代码：

public class Test {

    public static void main(String[] args) throws Exception {
        URL url[] = new URL[1];
        url[0] = Thread.currentThread().getContextClassLoader().getResource("");
        final CustomClassloader customClassloader = new CustomClassloader(url);
        Thread.currentThread().setContextClassLoader(customClassloader);
        Class clazz = customClassloader.loadClass("com.wangxiandeng.ClassTest");
        Object object = clazz.newInstance();
        Method method = clazz.getDeclaredMethod("test");
        method.invoke(object);
    }
}
public class ClassTest {

    public void test() throws Exception{
        Class clazz = Thread.currentThread().getContextClassLoader().loadClass("com.wangxiandeng.Student");
        Student student = (Student) clazz.newInstance();
        System.out.print(student.getClass().getClassLoader());

    }
}

要注意的是在设置线程的ClassLoader后，并非直接调用 new ClassTest().test()。为何呢？由于直接强引用的话，会在解析Test.Class的常量池时，利用系统默认的ClassLoader加载了ClassTest，从而又触发了ClassTest.Class的解析。为了不这种状况的发生，这里利用CustomClassLoader去加载ClassTest.Class，再利用反射机制调用test（），此时在解析ClassTest.Class的常量池时，就会利用CustomClassLoader去加载Class常量池项，也就不会发生异常了。

四：总结

写完这篇文章，手也不痒了，甚爽！这篇文章从双亲委派讲到了Class文件的加载，最后又绕回到双亲委派，看似有点绕，其实只有理解了Class的加载机制，才能更好的理解相似双亲委派这样的机制，不然只死记硬背一些空洞的理论，是没法起到由内而外的理解的。

本文做者：中间件小哥

原文连接

本文为云栖社区原创内容，未经容许不得转载。