LLVM是一个构建编译器的开源项目,其中Clang是其中一个比较典型的子项目。html
LLVM的核心架构思想以下图前端
上图关键是LLVM IR,LLVM IR 把这个编译流程分为前端-中间优化-后端三个部分。后端
前端是把某种语言编译为LLVM IR,中间优化是LLVM的固定优化管线,后端是针对LLVM IR 生成各类目标框架支持的汇编语言。架构
LLVM IR有三种形式:二进制文件.bc、人类可阅读文件.ll、内存的表达;框架
相似 clang -emit-llvm -c hello.c -o hello.bc 生成bc文件优化
相似 llvm-dis hello.bc 生成.ll文件htm
.ll文件结构以下:语法接近C语言,比汇编语言抽象,比C语言底层而繁杂。blog
IR的结构简单分为Module、body内存
其中全局变量用@,局部变量用%,%1指的是第一个寄存器(抽象意义上的寄存器,不一样于CPU的寄存器), alloca 是声明, align是字节对齐位数,store是存储,load是加载文档
经过LLVM源码还能够定制本身的编译器和编译流程,咱们留待下篇解答。