编译器是一个程序,做用是将一门语言翻译成另外一门语言。git
通常的程序,CPU 是没法直接执行的,由于 CPU 只能识别机器指令。因此要想执行一个程序,首先要将高级语言编写的程序翻译为汇编代码,再将汇编代码翻译为机器指令,这样 CPU 才能识别并执行。程序员
示例:github
// CPU 没法识别 10 + 5 // 翻译成汇编语言 push 10 push 5 add // 最后翻译为机器指令 汇编代码和机器指令一一对应 // 机器指令由 1 和 0 组成,如下指令非真实指令,只作演示用 0011101001010101 1101010011100101 0010100111100001
学会编译原理有什么好处?express
对编译过程内部原理的掌握将会使你成为更好的高级程序员。翻译
程序其实就是保存在文本文件中的一系列字符,词法分析的做用是将这一系列字符按照某种规则分解成一个个字元(token,也称为终结符),忽略空格和注释。code
示例:token
// 程序代码 10 + 5 + 6 // 词法分析后获得的 token 10 + 5 + 6
终结符就是语言中用到的基本元素,通常不能再被分解。ip
四则运算中的终结符包括符号和整数常量(暂不支持一元操做符)。get
符号:+ - * / ( )
编译器
整数常量:十二、1000、111...
function lexicalAnalysis(expression) { const symbol = ['(', ')', '+', '-', '*', '/'] const re = /\d/ const tokens = [] const chars = expression.trim().split('') let token = '' chars.forEach(c => { if (re.test(c)) { token += c } else if (c == ' ' && token) { tokens.push(token) token = '' } else if (symbol.includes(c)) { if (token) { tokens.push(token) token = '' } tokens.push(c) } }) if (token) { tokens.push(token) } return tokens } console.log(lexicalAnalysis('100 + 23 + 34 * 10 / 2')) // ["100", "+", "23", "+", "34", "*", "10", "/", "2"]