天然,咱们仍是先从 tao 语言的编译器下手吧。在动手写编译器以前,得容我将编译器的结构进行进一步的划分。编译器可视为一个黑盒,从其一端输入源代码,另外一端产出目标代码。此过程进一步拆分便有了以下形式。html
首先是 Tokenizer (词法分析器),它读入一个一个字符,并将其合并成一个一个Token(单词)。这些 Token 将被 Parser(语法分析器)接收并进行进一步处理。Parser 处理结果称之为 Syntax Tree (语法树),此时产物再也不是线性结构,而转为变成树形结构了。spa
一旦获得了 Syntax Tree 便可进行语义分析,以后即可生成代码,至此,整个编译的流程就此走完。能够见以下图。3d
因为本系列将着重于“写”出编译器,必要的理论和概念仍是会交代的。不过会有所侧重,若非与我要写的代码紧密相关,概念和理论也不会作过多着墨。htm