[编译原理读书笔记][第2章一个简单的语法制导程序

时间 2019-12-08

标签编译原理读书笔记一个简单语法制导程序繁體版

原文原文链接

[编译原理读书笔记][第2章一个简单的语法制导程序]

标签（空格分隔）：未分类前端

本章内容是对本书第3章至第六章中介绍的编译技术的综合介绍.web

经过将一个语句转换为三地址代码的过程来说解
重点是:词法分析,语法分析和中间代码生成.
第7章,第8章将讲述如何将三地址代码转换为机器指令

2.1 引言

2.2:给出一个普遍使用的表示方法来描述语法,叫作上下文无关法或者BNF(Backus-Naur范式).api
2.3:面向文法的编译技术:语法指导翻译数组
2.4:语法分析数据结构
2.5:一个中缀转后缀的过程app
2.6:词法分析koa
2.8:构造语法树ssh

2.2 语法定义

介绍一种用于描述程序设计语言语法的表示方法---"上下文无关法"或简称文法.被用于组织编译器前端.函数

何为上下文无关文法?
- V 总能够被字符w 自由替换,而无需考虑字符V出现的上下文
Java的if-else工具
文法

2.2.1 文法定义

一个上下文无关法(context-free grammar)由4个元素组成:

一个终结符号集合,有时也称作"词法单元".
一个非终结符号集合,有时也称作"语法变量"
- 每一个非终结符号表示一个终结符号串的结合.(后面介绍)
一个产生式集合:表示某个构造的某种书写形式.
- 产生式头或左部: 非终结符号 .
- 一个箭头
- 产生式体或右部: 终结符号与非终结符号组成的序列
- 若是产生式头表明一个构造,那么产生式体表明该构造的一种书写形式.
指定一个非终结符号为开始符号

2.2.2 推导

根据文法推倒符号串时.首先从开始符号出发,不断地将某个非终结符号替换为该非终结符号的某个产生式的体.直到所有为终结符号.

能够从开始符号推倒获得的全部终结符号串的集合称为该文法定义的语言.

语法分析的任务

parsing的任务是: 接受一个终结符号串做为输入,找出从文法的开始符号推倒出该串的方法.
若是不能推倒出,则报告语法错误.
主要语法分析方法,在第四章中介绍

2.2.3 语法分析树

语法分析树用图形方法展示了从文法的开始符号推倒出对应语言中的符号串的过程.

parse tree有如下性质

根节点的标号为文法的开始字符.
叶子节点为一个终结符号或 e
内部节点为一个非终结符号
若是非终结符号A它的子节点从左至右有X1,X2..XN,那么必然有产生式A->X1X2X3..XN.

例子

文法:

须要推倒的语句: 9 - 5 + 2

语法树:

一个文法的语言的另外一个定义是任何可以由某颗语法分析树生成的符号串的集合.

为一个给点的终结符号串构建一颗语法分析树的过程称为对该符号穿进行语法分析

2.2.4 二义性

某些语法若是不严谨会产生二义性.好比将上述例子的语法改为

那么对以前的终结符号串的解释能够用两种语法树

前者的结果是6, 后者是2

显然有问题.因此一个好的文法不该该有二义性.

2.2.5 运算符结合性

左结合运算向左下端延伸
右结合运算向右下端延伸

等号的文法:

2.2.6 运算符的优先级

结合性规则只能做用于同一级别的运算

当具备+,-,*,\,(,)时的文法

factor不可被分开.
一个(不是因子)的term可能被高优先级的运算符*和/分开
一个expr能够被任意优先级分开
根据这种思想,咱们能够用多个非终结字符来肯定n个优先级的语法.

2.2.7 2.2节的练习

从如下代码能看出如何增长一个优先级.

2.3 语法指导翻译

语法制导翻译是经过向一个文法的产生式附加一些规则或程序片断而获得的.

看不懂

2.3.1 后缀表示

2.3.2 综合属性

语法制导定义(syntax-directed definition)把每一个文法符号和一个属性集合相关联,而且把每一个产生式和一组语义规则(semantic rule)相关联,这些规则用于计算与该产生式相关联的属性值.
注释语法分析树:若是一颗语法分析树的各个结点上标记了相应的属性值,那么这颗语法分析树就称为注释语法分析树,简称注释分析树.
综合属性:若是某个属性在语法分析树结点N上的值由N的子节点和N自己的属性值肯定,那么这个属性叫作综合属性
- 性质: 只须要对语法分析树进行一次自底向上的遍历,既能够算出属性的值.
5.1.1节将会讲述一种继承属性:继承属性在某个语法分析树的结点的值由其自己,兄弟,父节点属性值决定.

##关于语法制导一个十分不错的例子

2.3.3 简单语法制导定义

上述例子的语法制导定义具备如下重要性质:

2.3.4 树的遍历

关于树的遍历就再也不赘述了

若是只有综合属性,和继承属性单一一种,那么求值问题很好解决,不然很难求值.

2.3.5 翻译方案(语法制导翻译方案)

以前上述的语法翻译的例子将字符串做为属性值附加在结点上,从而获得翻译结果.

咱们来考虑一种不须要操做字符串的方法,经过运行程序片断,逐步生成相同的翻译结果.

语义动做

例子

2.4 语法分析

语法分析是决定如何使用一个文法生成一个终结符号串的过程.
本书将会介绍一种叫作递归降低的语法分析方法,该方法用于语法分析和实现语法制导翻译器.
- 下一节会给出一个完整实现例子的JAVA程序
- 4.9会介绍一种Yacc的工具直接根据方案生成一个翻译器.
对于任何上下文无关法,都能构造出一个O(n^3)的语法分析器,可是对于实际的语言设计,基本都是线性时间构造出来的.
大部分的语法分析方法能够分为两类: 自顶向上,自底向上.
- 这两个术语指的是语法分析节点的构造顺序.
- 在自顶向上语法,构造过程从根节点开始,逐步向叶子节点进行.
  - 更容易手工构造出高效的语法分析器
- 自底向上语法则相反
  - 能够处理更多种文法和翻译方案,因此文法生成语法分析器的软件工具经常使用这种.

2.4.1 自顶向下分析方法

向前看(lookahead)

输入中当前被扫描的终结符号一般称为向前看(lookahead)符号.
- 在开始时,向前看符号是输入串的第一个终结符号.

例子

为一个非终结符号选择产生式是一个尝试并犯错的过程,咱们首先选择一个产生式,若是这个产生式不合适将会进行回溯,再尝试另外一个产生式.
预测语法分析的特殊状况不须要回溯.

2.4.2 预测分析法

递归降低分析方法(recursive-descent parsing)是一种自顶向下的语法分析方法,他使用一组递归过程来处理输入.

这里咱们考虑递归降低方法的一个简单形式,称为预测分析法(predictive parsing)

在预测分析法中,各个非终结符对应的过程当中的控制流能够由向前看无二义的肯定.在分析输入串时出现的过程调用序列隐式地定义了该输入串的一颗语法分析树.

FIRST(α)

关于计算的方法在4.2.2中介绍
预测分析法要求时

2.4.3 什么时候使用ε 产生式

若是向前看符号不在其余产生式中,就用ε 产生式
更加深刻了解什么时候使用ε 产生式,参见4.4.3节中关于 LL(1)文法的讨论.

2.4.4 设计一个预测分析器

当知足可以使用预测分析器时:

对于语法动做如何处理

2.4.5 左递归

左递归:

右递归:

右递归对于左结合运算的翻译会变得困难
4.3.3节将考虑更通常的左递归形式

2.4.6 练习

(1)

void S(){
    swithch( lookahead )
    {
        case +:
        match(+);S();S();break;
        case -:
        match(-);S();S();break;
        case a;
        match(a);break;
        default: report("syntax error");
    }
}

(2)要注意最终的结果,并消除左递归

void S(){
if(lookahead == "("){
match("("); S(); match(")"); S();
}
}

(3)两个产生式的FIRST都是0，须要注意

void S()  
{  
    if(lookahead==0)  
    {  
         match(0);  
         if(lookahead!=1)  
            S();  
         match(1);  
    }  
    else  
    report("syntax error");  
}

2.5 简单表达式的翻译器

使用前三节技术,咱们将使用Java语言编写一个语法制导翻译器.

如今咱们处于矛盾中:

一方面,咱们须要一个可以支持翻译规约的文法;
另外一方面,咱们须要一个明显不一样的可以支持语法分析过程的文法;
因此先使用易于翻译的文法,而后当心的转换,使之可以语法分析.

咱们将消除2-21的左递归,获得一个适用于预测递归降低翻译器的文法.

2.5.1 抽象语法和具体语法

设计一个翻译器是,名为抽象语法树(abstract syntax tree)的数据结构是一个很好的起点.
语法分析树叫作具体语法树(concrete syn-tax tree),相应的文法叫作该语言的具体文法(concrete syntax)

2.5.2 调整翻译方案

2个左递归产生式和一个非左递归产生式

咱们要转换的不仅是终结符号和非终结符号,还包括内嵌动做.
嵌入在产生式中的语义动做在转换时被当作终结符号直接进行复制.

例子

2.5.3 非终结符号的过程

2.5.4 翻译器的简化

2.5.5 完整代码

2.6 词法分析

2.6.1 剔除空白和注释

统计行号有利于定位错误

2.6.2 预读

通常都会预读一些字符放在缓冲区.有两个好处

缓冲区的效率问题,csapp有介绍就很少说了
有利于词法分析,判断是>仍是>=等
一般在简单的状况,只须要预读一个

本节的词法分析器会预读一个字符,本节中的词法分析器不变式断言以下:
当词法分析器返回一个词法单元时:

变量peek要么保存当前词法单元词素后的那个字符,要么保存空白

2.6.3 常量

当在输入流出现一个数位序列时,词法分析器将向语法分析器传送一个词法单元.

该词法单元包括终结符num和根据数位计算出来的值如:<num,31>

2.6.4 识别关键词和标识符

关键词(keyword):大多数程序使用for,do,if这样的固定字符串做为标点符号,或者用于某种构造,这些字符串加作关键词.
字符串还能做为标识符为变量,数组,函数等命名.
- 为了简化语法分析器,语言的文法一般把标识符当作终结符号处理.
关键词一般也知足标识符的组成规则,当将关键词做为保留字时,相对容易解决.

对于本节中的词法分析器

使用一个字符串表来保存字符串.

2.6.5 词法分析器

2.7 符号表

符号表(symbol table)是一种供编译器用于保存有关源程序构造的各类信息的数据结构.

在编译器分析阶段逐步收集
在综合阶段用于生成目标代码
标识符的字符串,词素,类型,存储位置,其余相关信息.

2.7.1 为每一个做用域设置一个符号表

类Env

一颗有前向边的树

支持三种操做

建立一个新符号表
加入新条目
获得标识符的条目

2.7.2 符号表的使用

2.8 生成中间代码

2.8.1 两种中间表现形式

两种最重要的中间表现形式

树形结构,包括语法分析树和(抽象)语法树
线性表现形式,特别是"三地址代码".

2.8.2 语法树的构造

能够发现从下到上的运算,运算级从高到低

语句的抽象语法树

在抽象语法树中表示语句块

表达式的语法树

2.8.3 静态检查

左值右值问题

类型检查

指望<=,>=以后的结构是boolean

自动类型转换
重载

2.8.4 三地址码

咱们将说明如何经过遍历语法树来生成三地址代码.

具体来讲,咱们将显示如何编写一个抽象语法树的函数,并同时生成必要的三地址代码.

三地址指令

语句的翻译

类If是类Stmt的一个子类.
Stmt的子类都有一个构造函数和一个gen
gen是一个生成三地址代码的函数.

表达式的翻译

咱们将考虑包含二目运算符op,数组访问,和赋值运算,并包含常量及标识符的表达式,以此来讲明对表达式的翻译.

[编译原理读书笔记][第2章 一个简单的语法制导程序

[编译原理读书笔记][第2章 一个简单的语法制导程序]