我认可,我再一次地当了标题党。可是不能否认,这必定是一篇精华随笔。在这一篇中,我将探讨Bash脚本语言中的美学与哲学。 这不是一篇Bash脚本编程的教程,可是却能让人更加深刻地了解Bash脚本编程,更加快速地学习Bash脚本编程。 阅读这篇随笔,不须要你有Bash编程的经验,但必定要和我同样热衷于探索各类编程语言的本质,感悟它们的魅力。html
其实早就想写关于Bash的东西了。 咱们平时喜欢对编程语言进行分类,好比面向过程的编程语言、面向对象的编程语言、函数式编程语言等等。在我心中,我认为Bash就是一个面向字符串的编程 语言。Bash脚本语言的本质:一切皆是字符串。 Bash脚本语言的一切哲学都围绕着字符串:它们从哪里来?到哪里去?使命是什么? Bash脚本语言的一切美学都源自字符串: 由键盘上几乎全部的符号 “ $ ~ ! # & ( ) [ ] { } | > < - . , ; * @ ' " ` \ ^” 排列组合而成的极富视觉冲击力的、功能极其复杂的字符串。linux
Linux Bash Shell入门教程 http://www.linuxidc.com/Linux/2013-08/8848.htm正则表达式
Bash是一个Shell,Shell出现的初衷是为了将系统中的各类工具粘合在一块儿,因此它最根本的功能是调用各类命令。 可是Bash又提供了丰富的编程功能。 咱们常常对编程语言进行分类,好比面向过程的语言、面向对象的语言、面向函数的语言等等。 能够把Bash脚本语言当作是一个面向字符串的语言。 Bash语言的本质就是:一切都是字符串。 看看下图中的这些变量:编程
上图是我在交互式的Bash命令行中作的一些演示。在上图中,我对变量分别赋值,无论等号右边是一个没有引号的字符串,仍是带有引号的字符串, 甚至数字,或者数学表达式,最终的结果,变量里面存储的都是字符串。我使用一个for循环显示全部的变量,能够看到数学表达式也只是以字符串的形式储存, 没有被求值。数组
若是一切都是没有特殊功能的平凡的字符串,那就没法构成一门编程语言。在Bash中,有不少符号具备特殊含义,好比“ $ ”符号被用于字符串展开,“&”符号用于让命令在后台执行, “|”用做管道, “>” “<”用于输入输出重定向等等。因此在Bash中,虽然一样是字符串,可是被引号包围的字符串和不被引号包围的字符串使用起来是不同的,被单引号 包围的字符串和被双引号包围起来的字符串也是不同的。bash
究竟带引号的字符串和不带引号的字符串使用起来有什么不同呢?下图是我构建的一些比较典型的例子:编程语言
在上图中,我展现了Bash中生成字符串的7种方法:大括号展开、波浪符展开、参数展开、命令替换、算术展开、单词分割和文件路径展开。还有两 种生成字符串的方式没有讲(Process substitution和历史命令展开)。在使用Bash脚本编程的时候,了解以上7种字符串生成的方式就够了。在交互式使用Bash命令行的时候,还 须要了解历史命令展开,熟练使用历史命令展开可让人事半功倍。ide
在上面的图片中能够看到,有一些展开方式在被双引号包围的字符串中是不起做用的,好比大括号展开、波浪符展开、单词分割、文件路径展开,而只有参数展开、命令替换和算术展开是起做用的。从图片中还能够看出,字符串中的参数展开、命令替换和算术展开都是由“ $ ”符号引导,命令替换还能够由“`”引导。因此,能够进一步总结为,在双引号包围的字符串中,只有“ $ 、`、\”这三个字符具备特殊含义。函数式编程
若是想让任何一个字符都不具备特殊含义,可使用单引号将字符串包围。好比使用正则表达式的时候,还好比使用sed、awk等工具的时候,因为sed和 awk本身执行的命令中每每包含有不少特殊字符,因此它们的命令最好用单引号包围。 好比使用awk命令显示/etc/passwd文件中的每一个用户的用户名和全名,可使用这个命令 awk -e ' {print$ 1, $ 5} ' ,其中,传递给awk的命令用单引号包围,说明bash不执行其中的任何替换或展开。函数
另一个特殊的字符是“\”,它也是引用的一种。它能够解除紧跟在它后面的一个特殊字符的特殊含义(引用)。之因此须要“\”的存在,是因 为在Bash中,有些字符称为元字符,这些字符一旦出现,就会将一个字符串分割为多个子串。若是须要在一个字符串中包含这些元字符自己,就必须对它们进行 引用。以下图:
最多见的元字符就是空格。 从上面几张图片能够看出,若是要将一个含有空格的字符串赋值给一个变量,要么把这个字符串用双引号包围,要么使用“\”对空格进行引用。 从上图中能够看出,Bash中只有9个元字符,它们分别是“| & ( ) ; < > space tab”,而在其它编程语言中常常出现的元字符“. { } [ ]”以及做为数学运算的加减乘除,在Bash中都不是元字符。
介绍完字符串、介绍完引用和元字符,下一个目标就是来探讨这一个哲学问题:字符串从哪里来、到哪里去?经过该哲学问题的探讨,能够推导出 Bash脚本语言的整个语法。字符串从哪里来?很显然,其中一个很直接的来源就是咱们从键盘上敲上去的。除此以外,就是我前面提到的七八九种字符串展开的 方法了。
字符串展开的流程以下:
1.先用元字符将一个字符串分割为多个子串;
2.若是字符串是用来给变量赋值,则无论它是否被双引号包围,都认为它被双引号包围;
3.若是字符串不被单引号和双引号包围,则进行大括号展开,即将{a,b}c展开为ab ac;
以上三个流程能够经过下图证实:
4.若是字符串不被单引号或双引号包围,则进行波浪符展开,即将~/展开为用户的主目录,将~+/展开为当前工做目录(PWD),将~-/展开为上一个工做目录(OLDPWD);
5.若是字符串不被单引号包围,则进行参数和变量展开;这一类的展开全都以“ $ ”开头,这是整个Bash字符串展开中最复杂的,其中包括用户定义的变量,包括全部的环境变量,以上两种展开方式都是“ $ ”后跟变量名,还包括位置变量“ $ 一、 $ 二、 ...、 $ 九、 ... ”,其它特殊变量:“ $ @、 $ *、 $ #、 $ -、 $ !、 $ 0、 $ ?、 $ _ ”,甚至还有数组:“ $ {var[i]}”, 还能够在展开的过程当中对字符串进行各类复杂的操做,如:“ $ {parameter:-word}、 ${parameter:=word}、 $ {parameter:+word}、 ; $ {parameter:?word}、 $ {parameter:offset}、 ${parameter:offset:length}、 $ {!prefix*}、 $ {!prefix@}、 $ {name[@]}、 $ {!name[*]}、 $ {#parameter}、 ${parameter#word}、 $ {parameter##word}、 $ {parameter%word}、 $ {parameter%%word}、 ${parameter/pattern/string}、 $ {parameter^pattern}、 $ {parameter^^pattern}、 $ {parameter,pattern}、 ${parameter,,pattern}”;
6.若是字符串不被单引号包围,则进行命令替换;命令替换有两种格式,一种是 $ (...),一种是`...`;也就是将命令的输出做为字符串的内容;
7.若是字符串不被单引号包围,则进行算术展开;算术展开的格式为 $ ((...));
8.若是字符串不被单引号或双引号包围,则进行单词分割;
9.若是字符串不被单引号或双引号包围,则进行文件路径展开;
10.以上流程所有完成后,最后去掉字符串外面的引号(若是有的话)。以上流程只按以上顺序进行一遍。好比不会在变量展开后再进行大括号展开,更不会在第10步去除引用后执行前面的任何一步。若是须要将流程再走一遍,请使用eval。
探讨完了字符串从哪里来,下面来看看字符串到哪里去。也就是怎么使用这些字符串。使用字符串有如下几种方式:
1.把它当命令执行;这是Bash中的最根本的用法,毕竟Shell的存在就是为了粘合各类命令。若是一个字符串出如今本该命令出现的地方(好比一行的开头,或者关键字then、do等的后面),它将会被当成命令执行,若是它不是个合法的命令,就会报错;
2.把它当成表达式;Bash中本没有表达式,可是有了((...))和``.``.``.``,就有了表达式;((...))能够把它里面的字符串当成算术表达式,而``.``.``.``会把它里面的字符串当逻辑表达式,仅此两个特例;
3.给变量赋值;这也是一个特例,有点破坏Bash编程语言语法哲学的完整性。为何这么说呢?由于“=”即不是一个元字符,也不容许两边有空格,并且只有第1个等号会被当成赋值运算符。
下面图片为以上观点给出证据:
本文来自:Linux学习网