ILBC 规范 2

时间 2019-11-18

标签 ilbc 规范繁體版

原文原文链接

接上篇《ILBC 规范》 http://www.javashuo.com/article/p-hsmtjoox-s.html ，html

ILBC 的目标是跨平台跨设备。java

D# / ILBC 能够编写操做系统内核层以上的各类应用，程序员

其实除了进程调度虚拟内存文件系统外，其它的内核模块能够用 D# 编写，好比 Socket 。docker

D# / ILBC 的设计目标是保持简单，好比 D# 支持 Lambda 表达式，可是 LinQ 应该由库来支持，与语言无关。数组

另外一方面， ILBC 不打算发展一个庞大的优化体系。 C++ , .Net / C# 的优化体系已经庞大复杂到成为大公司也很难承受之重了。安全

咱们不会这么干。数据结构

ILBC 认为 “简单就是优化” 。架构

保持简单设计和模块化，模块化会带来一些性能损耗，这些性能损耗是合理的。ide

保持简单设计和模块化，对于 ILBC / D# / c3 / …… 以及应用程序都是有益的。模块化

ILBC 的目标是创建一个基础设施平台。

就像容器（好比 docker, kubernetes），容器打算在操做系统之上创建一个基础设施平台，

咱们的作法不一样，

ILBC 是用语言创建一个基础设施平台。

为了避开 “优化陷阱”，我决定仍是启用以前的 “ValueBox” 的想法。 ValueBox 的想法以前想过，但后来又放弃了。

ValueBox 相似 java C# 里的 “装箱” 、 “拆箱” 。

ValueBox 就是对于 int long float double char 等值类型（或者说简单类型），用一个对象（ValueBox）装起来，用于须要按照对象的方式处理的场合。

原本我以前是放弃了这个想法，以为仍是按照 C# 的 “一切都是对象” 的作法，让值类型也做为对象，继承 Object 类，而后让编译器在不须要做为对象，只是对值计算的场合把值类型对象优化回值类型（C 语言里的 int long float double char 等）。

但如今既然谈到优化陷阱，上面说的 “一切都是对象” 的架构就有点呵呵了。

这有一个问题，把值对象优化回值类型，这个优化是放在 C 中间代码里仍是 InnerC 编译器里，

放在 C 中间代码是指由高级语言（D# c3 等）编译器来优化，这样高级语言编译生成的 C 中间代码里面就已是优化过的代码，好比在值计算的地方就是 C 语言的 int long float double char 等，而不是值对象。

但这样要求高级语言的编译器都按照这个标准进行优化，否则在各高级语言写的库之间动态连接时会发生问题。

好比 D# 调用 c3 写的库的 Foo(int a) 方法， c3 作过优化，因此须要的 a 参数是一个 C 语言里的 int 类型，而 D# 未做优化，传给 Foo(int a) 的 a 参数是一个 int 对象，这就出错了，这是不安全的。

但要求高级语言的编译器都按照标准优化，这是一个比较糟糕的事情。

这会让高级语言编译器变得麻烦和作重复工做，且 ILBC 会因规则累赘而缺少活力。

若是把优化放在 InnerC 编译器里优化，那会和咱们的一些想法不符。咱们但愿 InnerC 是一个单纯的 C 编译器，不要把 IL 层的东西掺杂到里面。

InnerC 是一个单纯的 C 编译器，这也是 ILBC 的初衷和本意。

因此，咱们采用这样的设计，值类型就是值类型，对应到 C 语言里的基础类型（int long float double char 等），值类型不是对象，也不继承 Object 类，对象是引用类型，继承 Object 类。

当须要以对象的方式来处理时，把值类型包到 ValueBox 里。

每一个值类型会对应一个 ValueBox，好比 int 对应 IntBox， long 对应 LongBox， float 对应 FloatBox， double 对应 DoubleBox， char 对应 CharBox， bool 对应 BoolBox 等等。

ValueBox 的使用代码好比：

IntBox i = new IntBox( 10 ); // 10 就是 IntBox 包装的 Value

或者，

int i = 10;

IntBox iBox = new IntBox( i ); // 把 int 类型的变量 i 的值包装到 IntBox

何时须要把值类型包到 ValueBox 里？或者说，何时须要以对象的方式来处理值类型？

通常是在须要动态传递参数的时候，

好比， Foo ( object o ) 方法的 o 参数可能传入各类类型，那么能够把 o 参数声明为 object 类型，这样在 Foo() 方法内部判断 o 参数的类型，根据类型执行相关操做。

又好比，反射，经过反射调用方法，参数是经过 object [ ] 数组传入，

这 2 种状况对于参数都是以对象的方式处理，若是参数是值类型的话，就须要包装成 ValueBox 再传入。

D# / ILBC 支持值类型数组、值类型泛型容器。

值类型数组就是数组元素就是值类型，假设 int 类型占 4 个字节，那么 int [ ] 数组的每一个元素占用空间也是 4 个字节，这和 C 语言是同样的。

值类型泛型容器好比 List<int> ， List<int> 的内部数组就是 int [ ] 。

值类型数组，值类型泛型容器直接存取值类型，不须要对值类型装箱。

可是要注意，好比 Dictionary<TKey, TValue> ， value 能够是值类型，但 key 须要是对象类型，由于会调用 key.GetHashCode() 方法。

因此，若是 key 是值类型，须要装箱成 ValueBox 。

好比

Dictionary < string , int > ， value 能够是值类型，

Dictionary < IntBox , object > ， key 须要是对象类型，若是是 int ，须要装箱成 IntBox

若是声明 Dictionary < int , object > ，则编译器会对 key 的类型报错，提示应声明为引用类型（对象类型）。

值类型又称简单类型，

引用类型又称对象类型，

（这有点呵呵）

编译器是依据什么检查 key 类型应为引用类型呢？

咱们能够在 D# 里加入一个语法，好比， Dictionary 的定义是这样：

public class Dictionary < object TKey , TValue >

{

……

public void Add ( TKey key , TValue value )

{

int hash = key.GetHashCode() ;

……

}

能够看到， TKey 的前面加了一个 object ，这表示 TKey 的类型应该是 object 类型或者 object 的子类，

这个 object 能够换成其它的类型，好比其它的类或者接口。

这样的话，若是 TKey 被声明为值类型，好比 Dictionary < int , object > ，因为 int 不是引用类型，固然也就不是 object 或者 object 的子类，因而不知足 TKey 的类型约束，因而编译器就报错了。

若是 TKey 的前面不声明 object ，会怎么样？仍是会报错。

由于在 Add ( TKey key , TValue value ) 方法里调用了 key.GetHashCode() 方法，调用方法意味着必须是引用类型（对象类型），因此编译器会要求 Dictionary 的定义里要声明 TKey 的类型，且 TKey 的类型必须是引用类型（对象类型）。

这也有点呵呵。

IntBox override（重写）了 Object 类的 GetHashCode() 方法，用于返回 IntBox 包装的 int 值的 HashCode，不过 int 类型的 GetHashCode() 方法多是最简单的了，直接返回 int 值就能够。 ^^

String 类会 override（重写） Object 类的 Equals(object o) 方法，而且会增长一个 Equals(string s) 方法， Equals( object o ) 方法内部会调用 Equals( string s ) 方法。 Equals ( object o ) 方法先判断 o 是否是 String 类型，若是不是，则返回 false，若是是，则调用 Equals( string s ) 判断是否相等。

D# 里用 “ == ” 号比较 2 个 String 的代码会被编译器处理成调用 Equals( string s ) 方法。

除了最底层的模块用 C 编写， D# / ILBC 能够编写各个层次各个种类的软件，

用 C 写能够用 InnerC 写，只要符合 ILBC 规范， InnerC 写的代码就能够和 ILBC 程序集同质连接。

从这个意义来看， ILBC / InnerC 能够编写包括操做系统在内的各个层次各个种类的软件，

从这个意义来看， ILBC 是一个软件基础设施平台。

今天看了 C# 8.0 新特性 https://mp.weixin.qq.com/s?__biz=MzAwNTMxMzg1MA==&mid=2654074187&idx=1&sn=e0a6d9c963c3405dcae232a70434f225&chksm=80dbd11eb7ac58085d5357785cae13bbd4a3ccf92e876cd12c1f8faa9ada7629e5f8b2ff030e&mpshare=1&scene=23&srcid=#rd ，

能够看出， C# 8.0 标志着 C# 开始成为 “保姆型” 语言，而不是程序员的语言。

D# 将一直会是程序员的语言，这是 D# 的设计目标和使命。

补充一点， ValueBox 的使用小技巧，

在一段代码中， ValueBox 能够只 new 一个，而后重复使用。

ValueBox 有一个 public value 字段，就是 ValueBox 包装的值，对 value 字段赋上新值就能够从新使用了。

好比， IntBox ，有 public int value 字段，

IntBox i = new IntBox( 1 );

i.value = 2;

i.value = 3;

i.value = 4;

重复使用 ValueBox 能够减小 new ValueBox 和 GC 回收的开销。

有网友提议 D# 的名字能够叫 Dava ，这名字挺好听，挺美丽的，和女神（Diva）相近，好吧，就叫 Dava 吧， D# 又名 Dava 。

接下来咱们讨论泛型原理 / 规范，

泛型在 ILBC 里和 C++ 相似，由高级语言编译器生成具体类型，

假设有一个 List<T> 类，这个类的 C 中间代码以下：

struct List<T>

{

T arr [ 20 ] ; // 20 是内部数组的初始化长度

int length = 0 ;

}

void List<T><>Add<>T ( List<T> * this , T element )

{

this -> arr [ this -> length ] = element ;

this -> length ++ ;

}

T List<T><>Get<>T ( List<T> * this , int index )

{

return this -> arr [ index ] ;

}

若是在代码中使用了

List<int> list1 = new List<int>();

List<string> list2 = new List<string>();

那么编译器会为 List<int> 生成一个具体类型 List~int 类，也会为 List<string> 生成一个 List~string 类，代码以下：

struct List~int

{

int arr [ 20 ] ; // 20 是内部数组的初始化长度

int length = 0 ;

}

void List~int<>Add<>int ( List~int * this , int element )

{

this -> arr [ this -> length ] = element ;

this -> length ++ ;

}

int List~int<>Get<>int ( List~int * this , int index )

{

return this -> arr [ index ] ;

}

struct List~string

{

string * arr [ 20 ] ; // 20 是内部数组的初始化长度

int length = 0 ;

}

void List~string<>Add<>string ( List~int * this , string * element )

{

this -> arr [ this -> length ] = element ;

this -> length ++ ;

}

int List~string<>Get<>int ( List~int * this , int index )

{

return this -> arr [ index ] ;

}

能够看出来，把泛型类型里的 List<T> 替换成具体类型（List<int>, List<string>），把 T 替换成泛型参数类型（int , string *）就是具体类型。

注意，值类型把 T 替换为值类型就能够，好比 int，引用类型要把 T 替换成引用（指针），好比 string * 。

这部分由高级语言编译器完成。

复杂一点的状况是，跨程序集的状况，假设有程序集 A , B ， A 引用了 B 里的 List<T> ，那 …… ？

这个须要把 List<T> 的 C 中间代码放在 B 的元数据文件（B.ild）里， A 引用 B.ild ，编译器会从 B.ild 中获取到 List<T> 的 C 中间代码，根据 List<T> 的 C 中间代码生成具体类型的 C 中间代码。

这好像又有点呵呵了。

不过这样看来的话，上文关于泛型对值类型和引用类型的不一样处理好像不必了。

上文举例的 Dictionary<object TKey , TValue> 要把 TKey 声明为 object ，

这其实已经不必了。

public class Dictionary < TKey , TValue >

{

……

public void Add ( TKey key , TValue value )

{

int hash = key.GetHashCode() ;

……

}

若是在代码中写了

Dictionary< int , object > dic ;

则编译器会报错 “TKey 的具体类型 int 不包含 GetHashCode() 方法， int 是值类型，值类型不支持方法，建议改成引用类型。”

假设有 class Foo<T> ，代码以下：

class Foo<T>

{

void M1 ( T t )

{

t.Add();

}

Foo<A> foo = new Foo<A>();

A a = new A();

foo.M1 ( a ) ;

A 是引用类型（对象类型），若是 A 没有 Add() 方法，编译器会报错 “泛型参数类型 A 不包含 Add() 方法。”

咱们还能够把代码改为：

class Foo<T>

{

T M1 ( T t )

{

return t ++ ;

}

Foo<int> foo = new Foo<int>();

int i = 0 ;

int p = foo.M1 ( i ) ;

这能够编译经过，由于 int 支持 ++ 运算符，实际上，只要支持 ++ 运算符的类型均可以使用 Foo<T> ，或者说，只要支持 ++ 运算符的类型都能够做为 Foo<T> 的泛型参数类型 T 。

其实说白了，你按照 C++ 模板来理解 ILBC 泛型就能够了。哈哈哈哈

接下来讨论继承，继承就是继承基类的字段和方法，进一步是重写虚方法。

咱们先来看继承基类的字段和方法，

假设

class A1

{

int f1;

}

class A2 : A1

{

int f2;

}

那么， A2 占用的内存空间就是 A1 的空间加上 A2 的空间，就是 f1 和 f2 的空间，

由于 f1, f2 都是 int ，假设 int 是 4 个字节，那么 f1 , f2 共占用 8 个字节的空间，这就是 A2 占用的空间。

因此 new A2() 的时候，就是先从堆里申请 8 个字节的空间，而后再调用 A2 的构造函数初始化， A2 的构造函数会先调用 A1 的构造函数初始化。

假设 A3 继承 A2， A2 继承 A1 ，那么 new A3() 时会先申请 A3 的空间，而后调用 A3 的构造函数， A3 的构造函数是这样：

A3( A3 * this)

{

A2( this );

A3 的初始化工做

}

A2( A2 * this)

{

A1( this );

A2 的初始化工做

}

A1( A1 * this)

{

A1 的初始化工做

}

能够看出，会沿继承链依次调用基类的构造函数。

若是基类在另外一个程序集里，那么对基类构造函数的调用会编译成动态连接的方式，和普通方法的动态连接同样。

对于方法的继承，编译器会把调用基类方法的地方直接编译成调用基类方法，传入子类对象的 this 指针，这个跟基类对象调用自己的方法同样。

若是是基类在另外一个程序集里，就会编译成动态连接的方式，跟基类对象调用自己的方法仍然同样。

对于虚方法，假设有程序集 A , B， B 里有 A1 , A2 类， A2 是 A1 的子类，并 override（重写）了 M1() , M2() 方法。

虚方法经过引用实现，引用里有一个字段是虚函数表。

因此，咱们要对引用作一点改进，

以前咱们在 C 中间代码里写的引用都是指针，但为了实现虚方法，须要把引用改进成一个结构体：

struct ILBC<>Reference

{

void * objPtr ; // 对象指针

void * virtualMethods ; // 虚函数表指针

}

A 里的代码：

A1 a = new A2();

a.M1();

这段代码会编译成：

ILBC<>Reference a ; // 建立引用 a

a.objPtr = ILBC_gcNew( sizeof(ILBC<>Class<>A2 ) ) ; // 给 A2 对象分配空间

(* ILBC<>Class<>A2<>Constructor) ( a.objPtr ) ; // 调用 A2 构造函数初始化 a

a.virtualMethods = ILBC_GetVirtualMethods( "B.A2", "B.A1" ); // 写入 A2 对于 A1 虚函数表指针

( * ( a.virtualMethods [ ILBC<>Class<>A1<>VirtualMethodNo<>M1 ] ) ) ( ) ; // 调用 a.M1() ;

// ILBC<>Class<>A1<>VirtualMethodNo<>M1 是一个全局变量，保存 A1.M1() 方法的虚方法号，虚方法号由 ILBC 在加载 A1 类时产生并写入这个全局变量

以上就是编译器产生的代码。

ILBC_GetVirtualMethods( "B.A2", "B.A1" ) 方法返回 A2 对于 A1 的虚函数表指针，

参数 "B.A2" 表示 A2 的全名， "B.A1" 表示 A1 的全名，全名包含了名字空间。

ILBC_GetVirtualMethods( subClassFullName, baseClassFullName ) 方法是 ILBC 调度程序提供的 ILBC 系统方法，

这个方法会先根据 subClassFullName, baseClassFullName 查找子类对于父类的虚函数表是否存在，若是不存在，则生成一份，下次直接返回。

虚函数表是一个数组，数组元素是子类对于父类虚函数重写的函数的地址， ILBC 在加载类时会对类的虚函数排一个序，而后对于该类的每一个子类的虚函数表，都按照这个顺序把相应的虚函数重写的函数的地址放到数组（虚函数表）里。

若是子类没有重写函数，则存放基类的函数地址。

虚函数排序的序号（从 0 开始）就是虚方法号（VirtualMethodNo），

以虚方法号做为下标（index）从虚函数表里取出的就是这个虚方法的函数地址。

加载类是在 ILBC_GetType( assemblyName, className ) 方法里进行的，实际上应该改为 ILBC_GetType( classFullName ) ，由于 classFullName 已经包含了名字空间，不须要 assemblyName 了，事实上在 ILBC 运行时对于类（Class）的识别就是用 Full Name，不须要涉及 assemblyName ，也能够说，在一个运行时内，不能有相同 Full Name 的 2 个类，无论这 2 个类是否是在一个程序集里。

ILBC_Type( classFullName ) 方法会检查类是否已加载，若是已加载就直接返回 ILBC_Type * ，若是没有则加载并返回 ILBC_Type * 。

ILBC_GetVirtualMethods( “B.A2”, "B.A1" ) 方法会查找 A1 中全部的虚方法，排一个序，并建立一个长度等于虚方法个数的数组（虚方法表），而后从 A2 中按名称逐个查找 A2 对虚方法的重写实现的函数地址，按顺序填入虚方法表中，若是未重写，则直接使用基类的实现，即填入基类的函数地址。

好比 A2 继承 A1， A1 继承 Object ， A2 重写了 Object.GetHashCode() 方法，那么 A2 对于 A1 的虚函数表中 GetHashCode() 方法对应的位置就会写入 A2.GetHashCode() 的函数地址，

若是 A1 重写了 Object.GetHashCode() 而 A2 未重写，则会填入 A1.GetHashCode() 的函数地址，

若是 A1 A2 都没有重写 Object.GetHashCode() ，则会填入 Object.GetHashCode() 的函数地址。

也就是说， ILBC 会沿着继承链向上查找虚函数的重写实现。

好比有如下继承关系：

A3 -> A2 -> A1 -> Object

又有这样的代码：

A1 a1 = new A3();

A2 a2 = new A3();

A3 a3 = new A3();

对于引用 a1 ， a1.virtualMethods 应该是 “A3 对于 A1 的虚函数表”，

什么是 “A3 对于 A1 的虚函数表”，就是 “A3 对象以 A1 的身份运行” 的虚函数表。

因此 a1.virtualMethods 指向的虚函数表应包含 A1 的所有虚方法，

a2.virtualMethods 指向的虚函数表应包含 A2 的所有虚方法，

a3.virtualMethods 指向的虚函数表应包含 A2 的所有虚方法，

A1 的所有虚方法包括 A1 本身声明的虚方法和 Object 的虚方法，

A2 的所有虚方法包括 A2 本身声明的虚方法和 A1 的虚方法和 Object 的虚方法。

A3 的所有虚方法包括 A3 本身声明的虚方法和 A2 的虚方法和 A1 的虚方法和 Object 的虚方法。

因此，虚函数表里的方法也是沿着继承链向上查找的。

接口也是同样的处理方式。

好比

IFoo foo = new A();

表示 A 对象 foo 以 IFoo 的身份运行。

接口能够区分显示实现和隐式实现，这在元数据中能够区分，在建立虚函数表查找元数据的时候能够判断出来。

能够看出，查找和建立虚函数表用到较多根据名字查找成员的操做，因此前文在动态连接的篇幅也提到能够用 HashTable 来实现快速查找，提高反射和动态连接的效率。

查找和建立虚函数表也是反射和动态连接。

咱们还能够顺便看一下 Object 类的结构：

struct Object

{

ILBC_Type * type ; // 类型信息

char lock ; // 用于 IL Lock ，当锁定该对象时， lock 字段写入 1，未锁定时 lock 字段是 0

}

昨天一群网友嚷嚷着 “没有结构体（Struct）是如何如何的糟糕，，” ，

ILBC 能够支持结构体，这很容易，结构体有方法，能够继承，但不能多态。

不能多态是指结构体不能声明虚方法，子类结构体也不能重写基类结构体的方法。

加入结构体能够让程序员本身选择栈存储数据仍是堆存储数据，能够由程序员本身决定这个设计策略或者说架构。

这很清晰。

目前不打算让 Struct 支持可为空（Nullable）类型，即 Struct ? 类型，能够用一个字段来表示初始等状态，

若是实在想要 null ，那就用 Class 吧， Oh ……

Struct 经过关键字 struct 声明，不继承 ValueType，也不继承 Struct，实际上也没有 ValueType , Struct 这样的基类。

在 ILBC 里， “一切都是对象是不成立的” ，对象（Class）只是数据类型的一种。

DateTime 能够用 Struct 来实现，由于 DateTime 可能就是一个 64 位整数，表示公元元年到某时的 Ticks 数，

若是是这样的话，如网友所说 “引用都比 Struct（DateTime）大” 。

讨论到这里，能够看出来， C# 为了实现 “一切都是对象” 付出了多大的代价，

并且 C# 还支持 Struct 能够是可为空（Nullable）类型，这让人无语，只想呵呵。 ^^ ^^ ^^

到目前为止， ILBC 里的数据类型有 3 种：

1 简单类型（值类型）， int long float double char 等等

2 结构体 Struct （值类型）

3 对象 Class （引用类型）

值类型的优势是：

1 一次寻址，不须要经过引用二次寻址

2 只包含值，不包含类型信息等数据，不冗余

3 存储在栈空间，分配快不须要回收，事实上对于静态分配的栈变量，函数入栈的时候修改了栈顶，则该函数中全部的栈变量都被分配了。

如今有个问题是，一个参数是值类型的方法，若是要经过反射调用，怎么调用？

反射须要把参数放到 object[ ] 数组， object[ ] 数组的元素是引用。

我怀疑 C# 中把 Struct 放到 object[ ] 里时，会对 Struct 装箱。

因此咱们也能够对 Struct 进行装箱，能够用 ValueBox 对 Struct 装箱，好比：

[ ValueBox( typeof ( ABox ) ) ] // 告诉 ILBC 运行时 A Struct 对应的 ValueBox 是 ABox

struct A

{

}

class ABox : ValueBox<A>

{

}

ValueBox 是一个泛型类，由 ILBC 基础库提供，代码以下：

class ValueBox<T>

{

T value ;

}

那么，在动态传递参数的场合，好比：

void Foo( object o )

{

……

}

能够这样写：

void Foo ( object o )

{

Type type = o.GetType();

if ( type.IsValueBox ) // IsValueBox 是 Type 的属性，若是 Type 表示的类型是 ValueBox 或者 ValueBox 的子类，则 IsValueBox 返回 true

{

Type valueType = type.GetValueType() ; // GetValueType() 方法是 Type 的方法，若是 Type 表示的类型是 ValueBox 或者 ValueBox 的子类，则返回 ValueBox 包装的值的类型，即 value 字段的类型

if ( valueType == typeof(int) ) // typeof(int) 返回的 Type 对象由编译器生成

// do something for int

else if ( valueType == typeof(A) ) // typeof(A) 返回的 Type 对象由编译器生成

// do something for A Struct

else if ( …… )

……

return ;

}

// do something for Object （引用类型）

}

咱们能够这样调用 Foo() 方法：

Foo ( 1 );

A a = new A() ; // A 是 Struct

Foo ( a );

Foo ( "a string" ) ;

Person person = new Person() ; // Person 是 Class

Foo ( person ) ;

对于反射的状况，能够这样写：

class Class1

{

void Foo ( Struct1 s1 )

{

……

}

MethodInfo mi = typeof ( Class1 ).GetMethod( "Foo" ) ;

Struct1 s1 = new Struct1() ;

Struct1Box s1Box = new Struct1Box( s1 ) ;

mi.Invoke ( new object [ ] { s1Box } ) ;

把 s1 装箱到 s1Box 里，再把 s1Box 放到 object [ ] 里，这样 MethodInfo 内部会 “拆箱” 把 s1 传给 Foo() 方法。

若是直接把 s1 放到 object [ ] 里，好比 new object [] { s1 } 会怎么样？会编译报错 “s1 不是对象，不能转换为 object 类型，请考虑用 ValueBox 装箱。” 。

把反射调用方法的参数放到 object [ ] 数组里传入，这一方面是为了统一处理，另外一方面也是为了安全，引用是一个固定格式的 Struct，因此 ILBC 能够安全规范的从 object [ ] 中访问每一个引用。若是能够直接传递值的话， object [ ] 就会变成 C 的 void * 的状况， void * 容易致使访问内存错误，好比方法访问的地址已经超过了对象的地址范围，或者访问了错误的地址（好比访问 A 字段可能变成了访问 B 字段，或者是把 B 字段中的某个字节的地址做为 A 字段的首地址）。这会形成意想不到的错误或者程序崩溃。也可能被用于攻击。

而在上面 Foo( object o ) 方法里，若是 o 参数实际传入的是 IntBox 的话，

那么，会这样取出里面的 int 值：

Type type = o.GetType () ;

if ( type.IsValueBox )

{

Type valueType = type.GetValueType() ;

if ( valueType == typeof ( int ) )

{

IntBox iBox = ( IntBox ) o ;

int i = iBox.value ; // 取出 int 值

}

值类型（int long float double char 结构体）在内存空间里是不包括类型信息的，只单纯的存储值，这是为了执行效率。

可是，没有类型信息的运行期类型转换是不安全的，由于不能检查类型，跟上面假设的反射参数经过 void * 传入的情形同样，会形成内存的错误访问，

可是， ILBC 巧妙的避开了这一点。

首先，编译期类型转换，这个能够由编译器检查，这没有问题。

运行期类型转换，就像上面的代码，

IntBox iBox = ( IntBox ) o ;

int i = iBox.value ; // 取出 int 值

是把 object o 转换成 IntBox ， IntBox 是对象，有类型信息，能够类型检查，因此 IntBox iBox = ( IntBox ) o ; 是安全的。

这其实就是一个正常的引用类型的类型转换。

转换为 IntBox iBox 后， iBox.value 是明确的 int 型，这就能够安全的使用了。

那若是把 o 转换成 ValueBox 会怎样？

ValueBox vBox = ( ValueBox ) o ;

int i = vBox.value ; // 取出 int 值

这样编译时会报错 “不能把泛型参数 T 类型的 vBox.value 字段赋值给 int 类型的 i 变量。” ，

若是对 vBox.value 转型，转型成 int ：

ValueBox vBox = ( ValueBox ) o ;

int i = ( int ) vBox.value ; // 取出 int 值

这样编译时会报错 “不能把泛型参数 T 类型的 vBox.value 字段转型为 int 类型。” 。

我忽然以为 D# Dava 还能够叫 D++ 。哈哈哈哈

上面提到用 ValueBoxAttribute [ ValueBox ( typeof ( ABox ) ) ] 来声明 ABox 做为 A Struct 的 ValueBox，

实际上这不必， ILBC 能够提供一个 ValueBox 基类， ValueBox<T> 继承 ValueBox 类，那么 ValueType<T> 的具体类型也继承于 ValueBox，

因此， ILBC 只要判断 ABox 是不是 ValueBox 的子类，就能够知道 ABox 是否是 ValueBox，

同时，经过 ValueBox<T> 的泛型参数 T 能够知道 value 的类型。

在反射调用方法的时候，若是传给 MethodInfo 的 Invoke( object [ ] args ) 的 args 数组里包含了 ValueBox 类型的参数，

ILBC 会取出 ValueBox<T> 的 T value 字段的值传给 MethodInfo 包含的方法，

那么，怎么从不一样的 ValueBox 里来取出 value 字段的值呢？

好比 IntBox, ABox, DateTimeBox ，

这须要在元数据 ILBC_Type 增长 2 个字段：

struct ILBC_Type

{

……

int valueOffset ; // value 字段的偏移量

int valueSize ; // value 字段的大小

}

对应的 ValueType 的 classLoader 里要增长一段代码，取得当前类型的 value 字段的偏移量和大小，写入当前类型的 ILBC_Type 结构体的 valueOffset , valueSize 字段。

好比，以 IntBox 为例， IntBox 的 classLoader 里会增长这样一段代码：

ILBC_Type * type = ILBC_gcNew( sizeof ( ILBC_Type ) ) ;

……

type -> valueOffset = offsetOf ( IntBox, value ) ; // offsetOf 是 InnerC 提供的关键字，用于取得结构体字段的偏移量

type -> valueSize = sizeOf ( IntBox ) ;

当加载 IntBox 类时，会调用 classLoader，这段代码也会执行，这样就把 IntBox 的 value 字段的偏移量和大小都记录到 IntBox 的元数据 ILBC_Type 中了。

ILBC 的 MethodInfo.Invoke( object [ ] args ) 方法里的代码是这样：

ILBC_Reference o = object [ 0 ] ;

……

int offset = o.type -> valueOffset ; // value 字段在 ValueBox 里的偏移量

int size = o.type -> valueSize ; // value 字段在 ValueBox 里的大小

// 根据 offset 和 size 取出 value 字段的值

以上是代码。

能够看出，以上过程比在代码中

IntBox iBox = new IntBox( 1 );

int i = iBox.value;

强类型直接取得 value 要多 2 次寻址，会增长一些性能损耗。

经过上述设计，程序员能够自由的定义 ValueBox，一个 Value 类型能够有任意多个 ValueType ，

好比 ILBC 基础库提供了 IntBox, DateTimeBox，开发者还能够本身定义任意个 int , DateTiime 的 ValueBox 。

这样一来， ILBC 的数据类型数据结构的架构就打通了。

还有一个问题， ILBC_Type 是元数据，因此每一个程序集编译的时候都要 include struct ILBC_Type 所在的头文件（.h 文件），

为何每一个程序集都要引用 ILBC_Type 的头文件？

由于 ILBC 调度程序在加载 Class 时是调用 classLoader 返回 ILBC_Type * ，就是说， ILBC_Type 结构体是在 classLoader 里建立和构造的。

而 classLoader 是属于程序集的，是高级语言编译器编译产生的，

若是程序集和调度程序之间，或者程序集之间的 ILBC_Type 的定义不同，就会发生错误。

什么是定义不同，好比 ILBC 2.0 的 ILBC_Type 比 ILBC 1.0 增长了一些字段，或者改变了字段的顺序。

这样，若是把 1.0 的程序集放到 2.0 的调度程序（运行时）里运行就会有问题，或者 2.0 和 1.0 的程序集放在一块儿使用，也会有问题。

一般，若是 2.0 增长了 ILBC_Type 的字段，那 1.0 的程序集放到 2.0 的调度程序（运行时）会有问题，由于 2.0 的调度程序可能越界访问内存，由于 1.0 的 ILBC_Type 没有 2.0 新增的字段， 2.0 调度程序对 1.0 的 ILBC_Type Struct 方法访问新增的字段就会越界。

若是 2.0 没有新增字段，可是改变了 C 源代码里 ILBC_Type 字段的顺序，那会形成 1.0 中 ILBC_Type 的字段偏移量和 2.0 的字段偏移量不一致，一样会形成字段数据的错误访问。

因此，为了解决这个问题，须要对 ILBC_Type 也进行动态连接，就是把当前调度程序（运行时）的各字段的偏移量告诉各程序集。

可是 ILBC 不会使用加载程序集和类时候的动态连接，而是会用一段专门的代码进行元数据对象好比 ILBC_Type 的动态连接。

ILBC 调度程序会提供 2 个方法：

iint ILBC_GetTypeSize() // 返回 ILBC_Type 的大小（Size）

ILBC_Type * ILBC_GetTypeFieldOffset ( fieldName ) // 返回 ILBC_Type 的名为 fieldName 的字段的偏移量

程序集能够调用这 2 个方法来得到当前 ILBC 调度程序（运行时）的 ILBC_Type 的大小（Size）和字段偏移量。

这会不会有点过分设计了？