浅谈CLR

1.什么是CLR算法

  CLR(Common Language Runtime)公共语言运行时,是一个可由多种编程语言使用的“运行时”。CLR的核心功能(好比内存管理、程序集加载、安全性、异常处理和线程同步)可由面向CLR的全部语言使用。CLR不关心开发人员使用哪一种语言进行编程,只要编译器面向CLR就能够了,全部,开发人员应该使用本身最适合和熟悉的语言进行编程。全部的编程语言在面向CLR编译器的编译都生成了一个托管模块。托管模块是一个标准的32位的Microsoft Windows可移植执行体(PE32)文件,或者是一个标准的64位Windows可移植的PE32+文件,他们都须要CLR才能执行。编程

2.托管模块的各个组成部分安全

  PE32或PE32+头 标准Windows PE文件头,相似于“公共对象文件格式”。数据结构

  CLR头 包含使用这个模块成为一个托管模块的信息(可由CLR和一些实用程序进行解释)。头中包含了须要的CLR版本,一些标志,托管模块人口方法(Main方法)的MethodDef元数据标记(token),以及模块的元数据、资源、强名称、一些flag以及其余不过重要的数据项的位置/大小编程语言

  元数据 每一个托管模块都包含元数据表。主要有两种类型的表:一种类型的表描述源代码中定义的类型和成员:另外一种类型的表描述源代码引用类型和成员ide

  IL(中间语言)代码 编译器编译源代码时生成的代码。在运行时,CLR将将IL编译成本地的CPU指令函数

元数据的用途:ui

  编译时,元数据消除了对本地C/C++头和库文件的需求,由于在负责实现类型/成员的IL代码中,已包和引用的类型/成员有关的所有信息。编译器可直接从托管模块读取元数据线程

  Microsoft Visual Studio 使用元数据帮助你写代码。也就是“智能感知(IntelliSense)技术”能够解析元数据,指出一个类型提供了那些方法、属性、事件和字段等等。版本控制

  CLR的代码验证过程使用元数据确保代码只执行“类型安全”的操做。

  元数据容许将一个对象的字段序列化到一个内存中,将其发送给另外一台机器,而后反序列化,在远程机器上重建对象的状态

  元数据容许垃圾回收器跟踪对象的生存期。垃圾回收器能判断任何对象的类型,并从元数据知道那个对象中的哪些字段引用了其余对象。

3.程序集

  其实,CLR不和托管模块一块儿工做。它和程序集(assembly)一块工做。程序集是一个或多个模块/资源文件的逻辑分组。程序集是重用、安全性已经版本控制的最小单元。程序集是自描述的(self-describing)

4 执行程序集的代码

  托管程序集同时包含元数据和IL。为了执行程序,首先必须把它的IL转换成本地CPU指令。这是CLR的JIT(just-in-time)编译器的职责。

下面我将复述一下一个书的例子来讲明一个程序集中的代码是如何执行的。

  在Main方法执行以前,CLR会检测出Main的代码引用的全部类型。这将致使CLR分配一个内部数据结构,它用来管理对所用引用的类型的访问。例如上图,Main方法引用了一Console类型,这致使CLR分配一个内部结构。在这个内部结构中,Console类型定义的每一个方法都有一个对应的记录项。每一个记录项都容纳一个地址,根据此地址既能够找到方法的实现。对这个结构进行初始时,CLR将每一个记录项都设置成(指向)包含在CLR内部的一个未文档化的函数。我将这个函数成为JITCompiler。

  Main首次调用WriteLine时,JITCompiler函数会被调用。JITCompiler函数负责将一个方法IL代码编译成本地CPU指令。因为IL是“即时”(just in time)编译的,因此一般CLR的这个组件称为JITter或者JIT编译器。

  JITCompiler函数被调用时,它知道要调用的是哪一个方法,以及具体是什么类型定义了该方法。而后,JITCompiler会在定义程序集的元数据中查找被调用的方法的IL。接着,JITCompiler验证IL代码,并将IL代码编译成本地CPU指令。本地CPU指令被保存到一个动态分配的内存块中。而后,JITCompiler返回CLR为类型建立的内部数据结构,找到与被调用的方法对象的那一条记录,修改最初对JITCompiler的引用,让它如今指向内存块中的地址。最后,JITCompiler函数跳转到内存块中的代码。

  第二次调用WriteLine。这一次,因为对WriteLine的代码进行了验证和编译,因此直接执行内存块中的代码,彻底跳过JITCompiler函数。

第二次调用WriteLine的状况

 5.通用类型系统

  为了经过类型,用一种编程语言写的代码能与用另外一种语言写的代码沟通,Microsoft指定了一正式的规范,即“通用类型系统”(Common Type System,CTS),它描述了类型的定义和行为。

  CTS规范规定,一个类型能够包含零个或多个成员。

  字段(Field) 一个数据变量

  方法(Method) 一个函数

  属性(Property) 对于调用者,该成员看起来像是一个字段

  事件(Event) 事件在对象以及其余相关对象之间实现了一通用机制。

  CTS 还指定了类型可视性规则以及类型成员的访问规则,例如private,family等

  CTS还为类型继承。虚方法、对象生存期等定义了相应的规则

  特比说一下CTS中的一条规则:全部类型最终必须从预约义的System.Object类型继承。System.Object能够作的事情以下:

  比较两个实例的相等性

  获取实例的哈希码

  查询一个实例的真正类型

  执行实例的浅拷贝

  获取视实例对象的当前状态的一个字符串表示

6.公共语言规范

  为了建立很容易从其余编程语言中访问的类型,只能从本身的编程语言中挑选其余全部语言都肯定支持的那些功能,Microsoft定义了一个“公共语言规范”(Common Language Specifiaction,CLS),它详细定义了一个最小功能集。

 7.元数据

  上面已经提到托管的PE文件由4个部分构成:PE32(+)头、CLR头、元数据以及IL。

  这里咱们主要说一下元数据。

  元数据是一个二进制数据块,由几个表构成。这些表分为三个类别:定义表(definiton talbe)、引用表(reference table)和清单表(mainfest table)。

  经常使用元数据定义表(编译器编译源代码时,代码定义的任何同样东西都会致使定义表中的表中建立一个记录项):

  ModuleDef 老是包含一个用于标示模块的记录项。

  TypeDef 模块中定义的每一个类型都在这个定义表中有一个对应的记录项。

  MethodDef 模块中定义的每一个方法都在这个定义表中有一个对应的记录项。

  FieldDef 模块中定义的每一个字段都在这个定义表中有一个对应的记录项

  ParamDef 模块中定义的每一个参数都在这个定义表中有一个对应的记录项

  PropertyDef 模块中定义的每一个属性都在这个定义表中有一个对应的记录项

  EventDef 模块中定义的每一个事件都在这个定义表中有一个对应的记录项

   经常使用的引用元数据表:

  AssemblyRef 模块中引用的每一个程序集在这个表中都有一个对应的记录项

  ModuleRef 模块引用的每一个类型多是由别的PE模块实现的,全部那些模块在这个表都有一个记录项

  TypeDef 模块引用的每一个类型在这个表中都有一个对应的记录项

  MemberRef 模块引用的每一个成员都在这个表中有一个对应的记录项

  清单元数据表:

  AssemblyDef 若是该模块标示的是一个程序集,就在这个元数据表中包含单个记录项。该记录项列出了程序集名称(不含路径和扩展名)、版本(major,minor,build和revision)、语言文化(culture)、一些标志(flag)、哈希算法以及发布者的公钥。

  FileDef 做为程序集一部分的每一个PE文件和资源文件在这个表中都有一个对应的记录项。

  MainifestResourceDef 做为程序集一部分的每一个资源在这个表中都有一个对应的记录项

  ExportedTypesDef 从程序集的全部PE模块中导出的每一个public类型中在这个表中都有一个对应的记录项。

相关文章
相关标签/搜索