我发起并创立了一个 C 语言编译器开源项目 InnerC

时间 2019-11-18

标签发起创立一个语言编译器开源项目 innerc 栏目 C&C++ 繁體版

原文原文链接

本文是 VMBC / D# 项目的系列文章，html

有关 VMBC / D# ，见《我发起并创立了一个 VMBC 的子项目 D#》（如下简称《D#》） http://www.javashuo.com/article/p-zziqptgy-s.html 。java

VMBC 须要一个内置的 C 编译器，想来想去，以为仍是本身写一个，数组

计划用 C 语言写，由于 VMBC 的 C 编译器要求是一个本地库，若是不要求是本地库，我就用 C# 写了，呵呵呵。函数

为何是库呢？由于这是一个内置编译器，是由 ILBC 运行时来调用的（ILBC 见《D#》），因此是一个库。spa

这个库最好能尽量的小。操作系统

C 语言写的代码是最贴近底层（汇编）的，因此 C 语言写的库应该是最紧凑的，因此用 C 语言来写。指针

还有一个缘由是，我会的语言很少， C 算是相对更熟一点的， So 。htm

有网友说 C 语言不适合写编译器， C 的抽象过低了，建议用函数式语言写，对象

又举例 Rust 最先是用 OCaml 写的，而后又用 Rust 写了一遍。blog

好吧，但 Rust 、OCaml 这些语言的名字我都没怎么听过，仍是用 C 吧。

另外用 C 的话，应该不用担忧操做系统的支持的问题。

这个项目我只实现语法分析和类型检查的部分，语法分析包含了语法检查。

生成目标代码连接（连接外部库）这 2 个部分你们若是有兴趣，对汇编和操做系统了解的话，能够来补充。

InnerC 是 ansi C 的子集 + 扩展，只支持 ansi C 的部分特性，同时还会加入一些新特性。

总的来讲， InnerC 会比 ansi C 简单。

好比， InnerC 不支持结构体（Struct），由于 InnerC 是做为中间语言，只须要是一种 “高级汇编语言” 就能够。

不用 Struct，那用什么？

用数组，包括静态数组和从堆里分配的数组。

根据偏移量向数组的相应位置写入字段的值，这就是 Struct，也是对象。

去掉 Struct 能够省掉很多语法分析的开销和人力上的研发成本。

但 C 语言里好像没有按值传递数组的特性，因此 InnerC 须要加入按值传递数组（拷贝传递数组）的特性。

好比， InnerC 应该增长 T [ n ] 类型，用于参数和返回值，

T [ n ] 类型表示按值传递数组（拷贝传递数组），

假设 A() 方法调用 B() 方法， B() 方法有一个 T [ n ] arr 参数，那么 A() 方法传给 T [ n ] arr 参数的是一个数组的首地址 arr，编译器会处理成把 A() 里的 arr 数组以长度 n 拷贝到 B() 的 arr 里，因此 B() 的 arr 也是数组的首地址，可是是拷贝到 B() 的堆栈里的数组的首地址。

T [ n ] arr 表示 arr 参数是长度为 n 的数组，编译器会为 arr 在 B 的堆栈里分配长度为 n * sizeof(T) 的内存空间。这个空间是编译器分配的，是静态分配的，等价于声明一个 T arr[ n ] 这样的静态数组。

同理，假设 B() 的返回值是 T [ n ] 类型， B() 实际返回的是一个数组的首地址 arr， A() 里用来接收 B() 的返回值的是一个 T arr[ n ] arr ; 静态数组变量，编译器会处理成把 B() 里的 arr 数组以长度 n 拷贝到 A() 的 arr 里。

InnerC 也不支持对函数指针进行类型检查，

不对函数指针类型检查是指函数指针能够调用任意的参数列表，固然，出了错是调用者本身负责。^^

不过对于中间语言来讲，基本上不用担忧这个问题。

InnerC 的语法分析能够生成一个表达式对象树，把表达式对象树序列化获得一个 byte [] （byte 数组），

这个 byte[] 就至关于 .Net 的 Op Code，或者 java 的 Byte Code，咱们能够把这个 byte[] 称为 ILBC Byte Code （简称 Byte Code）。

这样一来，问题就明朗了，

若是开发期编译生成的目标代码就是 ILBC Byte Code，那 JIT 速度较慢的问题就解决了。

这就是说，能够把 C 语言做为第一级中间代码， Byte Code 做为第二级中间代码。

这样， InnerC 就能够由 2 个模块组成：

1 InnerC to Byte Code

2 Byte Code to Native Code

固然，能够在开发期编译直接生成 Native Code （本地代码），这是 AOT 。

我发起并创立了一个 C 语言编译器 开源项目 InnerC

我发起并创立了一个 C 语言编译器开源项目 InnerC