清单 1 演示了最多见的 UNIX 坏习惯之一:一次定义一个目录树。 html
清单 1. 坏习惯 1 的示例:单独定义每一个目录树 正则表达式
~ $ mkdir tmp shell
~ $ cd tmp bash
~/tmp $ mkdir a 服务器
~/tmp $ cd a curl
~/tmp/a $ mkdir b 编辑器
~/tmp/a $ cd b 函数
~/tmp/a/b/ $ mkdir c 工具
~/tmp/a/b/ $ cd c 测试
~/tmp/a/b/c $
使用 mkdir 的 -p 选项并在单个命令中建立全部父目录及其子目录要容易得多。可是即便对于知道此选项的管理员,他们在命令行上建立子目录时也仍然束缚于逐步建立每级子目录。花时间有意识地养成这个好习惯是值得的.
清单 2. 好习惯 1 的示例:使用一个命令来定义目录树
~ $ mkdir -p tmp/a/b/c
您可使用此选项来建立整个复杂的目录树(在脚本中使用是很是理想的),而不仅是建立简单的层次结构。
清单 3. 好习惯 1 的另外一个示例:使用一个命令来定义复杂的目录树
~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
过去,单独定义目录的惟一借口是您的 mkdir 实现不支持此选项,可是在大多数系统上再也不是这样了。IBM、AIX®、mkdir、GNU mkdir 和其余遵照单一 UNIX 规范 (Single UNIX Specification) 的系统如今都具备此选项。
对于仍然缺少该功能的少数系统,您可使用 mkdirhier 脚本(请参见参考资料),此脚本是执行相同功能的 mkdir 的包装:
~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
另外一个不良的使用模式是将 .tar 存档文件移动到某个目录,由于该目录刚好是您但愿在其中提取 .tar 文件的目录。其实您根本不须要这样作。您能够为所欲为地将任何 .tar 存档文件解压缩到任何目录——这就是 -C 选项的用途。在解压缩某个存档文件时,使用 -C 选项来指定要在其中解压缩该文件的目录:
清单 4. 好习惯 2 的示例:使用选项 -C 来解压缩 .tar 存档文件
~ $ tar xvf -C tmp/a/b/c newarc.tar.gz
相对于将存档文件移动到您但愿在其中解压缩它的位置,切换到该目录,而后才解压缩它,养成使用 -C 的习惯则更加可取——当存档文件位于其余某个位置时尤为如此。
您可能已经知道,在大多数 Shell 中,您能够在单个命令行上经过在命令之间放置一个分号 (;) 来组合命令。该分号是 Shell 控制操做符,虽然它对于在单个命令行上将离散的命令串联起来颇有用,但它并不适用于全部状况。例如,假设您使用分号来组合两个命令,其中第二个命令的正确执行彻底依赖于第一个命令的成功完成。若是第一个命令未按您预期的那样退出,第二个命令仍然会运行——结果会致使失败。相反,应该使用更适当的控制操做符(本文将描述其中的部分操做符)。只要您的 Shell 支持它们,就值得养成使用它们的习惯。
使用 && 控制操做符来组合两个命令,以便仅当 第一个命令返回零退出状态时才运行第二个命令。换句话说,若是第一个命令运行成功,则第二个命令将运行。若是第一个命令失败,则第二个命令根本就不运行。例如:
清单 5. 好习惯 3 的示例:将命令与控制操做符组合使用
~ $ cd tmp/a/b/c && tar xvf ~/archive.tar
在此例中,存档的内容将提取到 ~/tmp/a/b/c 目录中,除非该目录不存在。若是该目录不存在,则 tar 命令不会运行,所以不会提取任何内容。
相似地,|| 控制操做符分隔两个命令,而且仅当第一个命令返回非零退出状态时才运行第二个命令。换句话说,若是第一个命令成功,则第二个命令不会运行。若是第一个命令失败,则第二个命令才会 运行。在测试某个给定目录是否存在时,一般使用此操做符,若是该目录不存在,则建立它:
清单 6. 好习惯 3 的另外一个示例:将命令与控制操做符组合使用
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c
您还能够组合使用本部分中描述的控制操做符。每一个操做符都影响最后的命令运行:
清单 7. 好习惯 3 的组合示例:将命令与控制操做符组合使用
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar
始终要谨慎使用 Shell 扩展和变量名称。通常最好将变量调用包括在双引号中,除非您有不这样作的足够理由。相似地,若是您直接在字母数字文本后面使用变量名称,则还要确保将该变量名称包括在方括号 ([]) 中,以使其与周围的文本区分开来。不然,Shell 将把尾随文本解释为变量名称的一部分——而且极可能返回一个空值。清单 8 提供了变量的各类引用和非引用及其影响的示例。
清单 8. 好习惯 4 的示例:引用(和非引用)变量
~ $ ls tmp/
a b
~ $ VAR="tmp/*"
~ $ echo $VAR
tmp/a tmp/b
~ $ echo "$VAR"
tmp/*
~ $ echo $VARa
~ $ echo "$VARa"
~ $ echo "${VAR}a"
tmp/*a
~ $ echo ${VAR}a
tmp/a
~ $
您或许看到过使用反斜杠 (\) 来将较长的行延续到下一行的代码示例,而且您知道大多数 Shell 都将您经过反斜杠联接的后续行上键入的内容视为单个长行。然而,您可能没有在命令行中像一般那样利用此功能。若是您的终端没法正确处理多行回绕,或者您的命令行比一般小(例如在提示符下有长路经的时候),反斜杠就特别有用。反斜杠对于了解键入的长输入行的含义也很是有用,如如下示例所示:
清单 9. 好习惯 5 的示例:将反斜杠用于长输入
~ $ cd tmp/a/b/c || \
> mkdir -p tmp/a/b/c && \
> tar xvf -C tmp/a/b/c ~/archive.tar
或者,也可使用如下配置:
清单 10. 好习惯 5 的替代示例:将反斜杠用于长输入
~ $ cd tmp/a/b/c \
> || \
> mkdir -p tmp/a/b/c \
> && \
> tar xvf -C tmp/a/b/c ~/archive.tar
然而,当您将输入行划分到多行上时,Shell 始终将其视为单个连续的行,由于它老是删除全部反斜杠和额外的空格。
注意:在大多数 Shell 中,当您按向上箭头键时,整个多行输入将重绘到单个长输入行上。
大多数 Shell 都具备在列表中对命令分组的方法,以便您能将它们的合计输出向下传递到某个管道,或者将其任何部分或所有流重定向到相同的地方。您通常能够经过在某个 Subshell 中运行一个命令列表或经过在当前 Shell 中运行一个命令列表来实现此目的。
使用括号将命令列表包括在单个组中。这样作将在一个新的 Subshell 中运行命令,并容许您重定向或收集整组命令的输出,如如下示例所示:
清单 11. 好习惯 6 的示例:在 Subshell 中运行命令列表
~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \
> VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \
> | mailx admin -S "Archive contents"
在此示例中,该存档的内容将提取到 tmp/a/b/c/ 目录中,同时将分组命令的输出(包括所提取文件的列表)经过邮件发送到地址 admin。
当您在命令列表中从新定义环境变量,而且您不但愿将那些定义应用于当前 Shell 时,使用 Subshell 更可取。
将命令列表用大括号 ({}) 括起来,以在当前 Shell 中运行。确保在括号与实际命令之间包括空格,不然 Shell 可能没法正确解释括号。此外,还要确保列表中的最后一个命令以分号结尾,如如下示例所示:
清单 12. 好习惯 6 的另外一个示例:在当前 Shell 中运行命令列表
~ $ { cp ${VAR}a . && chown -R guest.guest a && \
> tar cvf newarchive.tar a; } | mailx admin -S "New archive"
使用 xargs 工具做为筛选器,以充分利用从 find 命令挑选的输出。find 运行一般提供与某些条件匹配的文件列表。此列表被传递到 xargs 上,后者而后使用该文件列表做为参数来运行其余某些有用的命令,如如下示例所示:
清单 13. xargs 工具的经典用法示例
~ $ find some-file-criteria some-file-path | \
> xargs some-great-command-that-needs-filename-arguments
然而,不要将 xargs 仅看做是 find 的辅助工具;它是一个未获得充分利用的工具之一,当您养成使用它的习惯时,将会但愿进行全部试验,包括如下用法。
在最简单的调用形式中,xargs 就像一个筛选器,它接受一个列表(每一个成员分别在单独的行上)做为输入。该工具将那些成员放置在单个空格分隔的行上:
清单 14. xargs 工具产生的输出示例
~ $ xargs
a
b
c
Control-D
a b c
~ $
您能够发送经过 xargs 来输出文件名的任何工具的输出,以便为其余某些接受文件名做为参数的工具得到参数列表,如如下示例所示:
清单 15. xargs 工具的使用示例
~/tmp $ ls -1 | xargs
December_Report.pdf README a archive.tar mkdirhier.sh
~/tmp $ ls -1 | xargs file
December_Report.pdf: PDF document, version 1.3
README: ASCII text
a: directory
archive.tar: POSIX tar archive
mkdirhier.sh: Bourne shell script text executable
~/tmp $
xargs 命令不仅用于传递文件名。您还能够在须要将文本筛选到单个行中的任什么时候候使用它:
清单 16. 好习惯 7 的示例:使用 xargs 工具来将文本筛选到单个行中
~/tmp $ ls -l | xargs
-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \
root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \
16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \
joe joe 3239 Sep 30 12:40 mkdirhier.sh
~/tmp $
从技术上讲,使用 xargs 不多遇到麻烦。缺省状况下,文件结束字符串是下划线 (_);若是将该字符做为单个输入参数来发送,则它以后的全部内容将被忽略。为了防止这种状况发生,可使用 -e 标志,它在不带参数的状况下彻底禁用结束字符串 。
避免经过管道将 grep 发送到 wc -l 来对输出行数计数。grep 的 -c 选项提供了对与特定模式匹配的行的计数,而且通常要比经过管道发送到 wc 更快,如如下示例所示:
清单 17. 好习惯 8 的示例:使用和不使用 grep 的行计数
~ $ time grep and tmp/a/longfile.txt | wc -l
2811
real 0m0.097s
user 0m0.006s
sys 0m0.032s
~ $ time grep -c and tmp/a/longfile.txt
2811
real 0m0.013s
user 0m0.006s
sys 0m0.005s
除了速度因素外,-c 选项仍是执行计数的好方法。对于多个文件,带 -c 选项的 grep 返回每一个文件的单独计数,每行一个计数,而针对 wc 的管道则提供全部文件的组合总计数。
然而,无论是否考虑速度,此示例都代表了另外一个要避免地常见错误。这些计数方法仅提供包含匹配模式的行数——若是那就是您要查找的结果,这没什么问题。可是在行中具备某个特定模式的多个实例的状况下,这些方法没法为您提供实际匹配实例数量 的真实计数。归根结底,若要对实例计数,您仍是要使用 wc 来计数。首先,使用 -o 选项(若是您的版本支持它的话)来运行 grep 命令。此选项仅 输出匹配的模式,每行一个模式,而不输出行自己。可是您不能将它与 -c 选项结合使用,所以要使用 wc -l 来对行计数,如如下示例所示:
清单 18. 好习惯 8 的示例:使用 grep 对模式实例计数
~ $ grep -o and tmp/a/longfile.txt | wc -l
3402
~ $
在此例中,调用 wc 要比第二次调用 grep 并插入一个虚拟模式(例如 grep -c)来对行进行匹配和计数稍快一点。
当您只但愿匹配输出行中特定字段 中的模式时,诸如 awk 等工具要优于 grep。下面通过简化的示例演示了如何仅列出 12 月修改过的文件。
清单 19. 坏习惯 9 的示例:使用 grep 来查找特定字段中的模式
~/tmp $ ls -l /tmp/a/b/c | grep Dec
-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf
-rw-r--r-- 1 root root 238 Dec 03 08:19 README
-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar
~/tmp $
在此示例中,grep 对行进行筛选,并输出其修改日期和名称中带 Dec 的全部文件。所以,诸如 December_Report.pdf 等文件是匹配的,即便它自从一月份以来还未修改过。这可能不是您但愿的结果。为了匹配特定字段中的模式,最好使用 awk,其中的一个关系运算符对确切的字段进行匹配,如如下示例所示:
清单 20. 好习惯 9 的示例:使用 awk 来查找特定字段中的模式
~/tmp $ ls -l | awk '$6 == "Dec"'
-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar
-rw-r--r-- 1 root root 238 Dec 03 08:19 README
~/tmp $
grep 的一个常见的基本用法错误是经过管道将 cat 的输出发送到 grep 以搜索单个文件的内容。这绝对是没必要要的,纯粹是浪费时间,由于诸如 grep 这样的工具接受文件名做为参数。您根本不须要在这种状况下使用 cat,如如下示例所示:
清单 21. 好习惯和坏习惯 10 的示例:使用带和不带 cat 的 grep
~ $ time cat tmp/a/longfile.txt | grep and
2811
real 0m0.015s
user 0m0.003s
sys 0m0.013s
~ $ time grep and tmp/a/longfile.txt
2811
real 0m0.010s
user 0m0.006s
sys 0m0.004s
~ $
此错误存在于许多工具中。因为大多数工具都接受使用连字符 (-) 的标准输入做为一个参数,所以即便使用 cat 来分散 stdin 中的多个文件,参数也一般是无效的。仅当您使用带多个筛选选项之一的 cat 时,才真正有必要在管道前首先执行链接。
若是不须要在命令提示符处键入长的、使人费解的文件名,这是否是很棒呢?的确,您不须要这样作。相反,您能够配置最流行的 UNIX Shell 以使用文件名完成。该功能在各个 Shell 中的工做方式略有不一样,所以我将向您展现如何在最流行的 Shell 中使用文件名完成。文件名完成使您能够更快地输入并避免错误。懒惰?也许吧。效率更高?固然!
经常使用首字母缩写词
1) MB:兆字节
2) HTTP:超文本传输协议
3) HTTPS:HTTP over Secure Sockets Layer
4) FTP:文件传输协议
5) FTPS:FTP over Secure Sockets Layer
6) LDAP:轻型目录访问协议
我正在运行哪一种 Shell?
若是您不知道目前使用的是哪种 Shell,会怎么样?虽然这个诀窍不是另外 10 个好习惯的正式组成部分,但它仍然颇有用。可使用 echo $0 或 ps -p $$ 命令显示您正在使用的 Shell。对于我来讲,运行的是 Bash Shell。
清单 1. 肯定您的 Shell
$ echo $0
-bash
$ ps –p $$
PID TTY TIME CMD
6344 ttys000 0:00.02 –bash
C Shell
C Shell 支持最直接文件名完成功能。设置 filec 变量可启用该功能。(您可使用命令 set filec。)在您开始键入文件名后,能够按 Esc 键,Shell 将完成文件名,或完成尽量多的部分。例如,假设您拥有名为 file一、file2 和 file3 的文件。若是您键入 f,而后按 Esc 键,将填充 file,而您必须键入 一、2 或 3 来完成相应的文件名。
Bash
Bash Shell 也提供了文件名完成,但使用 Tab 键代替 Esc 键。您在 Bash Shell 中不须要设置任何选项便可启用文件名完成,该选项是缺省设置的。Bash 还实现了其余功能。键入文件名的一部分后,按 Tab 键,若是有多个文件知足您的请求,而且您须要添加文本以选择其中一个文件,那么您能够多按 Tab 键两次,以显示与您目前键入的内容相匹配的文件的列表。使用以前名为 file一、file2 和 file3 的文件示例,首先键入 f。当您按一次 Tab 键时,Bash 完成 file;再按一次 Tab 键时,将展开列表 file1 file2 file3。
Korn Shell
对于 Korn Shell 用户,文件名完成取决于 EDITOR 变量的值。若是 EDITOR 设置为 vi,那么您键入部分名称,而后按 Esc 键,后跟反斜杠 (\) 字符。若是 EDITOR 设置为 emacs,那么您键入部分名称,而后按两次 Esc 键以完成文件名。
若是您为一系列命令使用相同的文件名,会发生什么状况?固然,有一种快捷方式能够快速得到您上次使用的文件名。如清单 2 所示,!$ 命令返回前一个命令使用的文件名。从文件 this-is-a-long-lunch-menu-file.txt 中搜索单词 pickles 的出现位置。搜索结束后,使用 vi 命令来编辑 this-is-a-long-lunch-menu-file.txt 文件,而不须要从新键入文件名。您使用感叹号 (!) 来访问历史,而后使用美圆符号 ($) 返回前一命令的最后字段。若是您反复用到长文件名,那么这是一个很是好的工具。
清单 2. 使用 !$ 得到前一个命令使用的文件名
$ grep pickles this-is-a-long-lunch-menu-file.txt
pastrami on rye with pickles and onions
$ vi !$
!$ 命令返回某个命令使用的上一个文件名参数。但若是某个命令使用多个文件名,而您只但愿重用其中一个文件名,该如何作?!:1 操做符返回某个命令使用的第一个文件名。清单 3 中的示例显示能够如何将此操做符与 !$ 运算符组合使用。在第一个命令中,将一个文件从新命名为更有意义的名称,但为了保持原始文件名可用,建立了一个符号连接。从新命名文件 kxp12.c 以提升可读性,而后使用 link 命令来建立到原始文件名的符号连接,以防在其余位置使用该文件名。!$ 操做符返回 file_system_access.c 文件名,而 !:1 操做符返回 kxp12.c 文件名,该文件名是上个命令的第一个文件名。
清单 3. 组合使用 !$ 和 !:1
$ mv kxp12.c file_system_access.c
$ ln –s !$ !:1
UNIX 支持各类目录导航工具。最喜欢的两款提升工做效率的工具是 pushd 和 popd。您固然了解 cd 命令用于更改您的当前目录。若是您要在多个目录中导航,但但愿可以快速返回某个位置,该如何作?pushd 和 popd 命令建立一个虚拟目录堆栈,pushd 命令用来更改您的当前目录并将其存储在堆栈中,而 popd 命令用来从堆栈的顶部移除目录并使您返回该位置。您可使用 dirs 命令来显示当前目录堆栈,而不会压入或弹出新目录。清单 4 显示如何使用 pushd 和 popd 命令在目录树中快速导航。
清单 4. 使用 pushd 和 popd 在目录树中导航
$ pushd .
~ ~
$ pushd /etc
/etc ~ ~
$ pushd /var
/var /etc ~ ~
$ pushd /usr/local/bin
/usr/local/bin /var /etc ~ ~
$ dirs
/usr/local/bin /var /etc ~ ~
$ popd
/var /etc ~ ~
$ popd
/etc ~ ~
$ popd
~ ~
$ popd
pushd 和 popd 命令还支持使用参数处理目录堆栈。使用 +n 或 -n 参数,其中 n 是一个数字,您能够向左或向右移动堆栈,如清单 5 所示。
清单 5. 旋转目录堆栈
$ dirs
/usr/local/bin /var /etc ~ ~
$ pushd +1
/var /etc ~ ~ /usr/local/bin
$ pushd -1
~ /usr/local/bin /var /etc ~
是否须要找出您的全部空闲磁盘空间被什么占用了?您可使用如下几个工具来管理您的存储设备。如清单 6 所示,df 命令为您显示每一个可用卷上已使用的块的总数,以及空闲空间的百分比。
清单 6. 肯定卷的使用状况
$ df
Filesystem 512-blocks Used Available Capacity Mounted on
/dev/disk0s2 311909984 267275264 44122720 86% /
devfs 224 224 0 100% /dev
fdesc 2 2 0 100% /dev
map -hosts 0 0 0 100% /net
map auto_home 0 0 0 100% /home
是否但愿查找大型文件?使用 find 命令时附带 -size 参数。清单 7 显示了如何使用 find 命令来查找大于 10MB 的文件。请注意,-size 参数以 KB 为单位计量大小。
清单 7. 查找大于 10MB 的全部文件
$ find / -size +10000k –xdev –exec ls –lh {}\;
如下是一个简单示例:您须要快速建立一个简单临时文件,但不但愿启动您的编辑器。使用带有 > 文件重定向操做符的 cat 命令。如清单 8 所示,使用不带文件名的 cat 命令只回显向标准输入键入的任何内容;> 重定向将该输入捕获到指定的文件中。请注意,您在结束键入时必须提供文件结束字符,一般为 Ctrl-D。
清单 8. 快速建立临时文件
$ cat > my_temp_file.txt
This is my temp file text
^D
$ cat my_temp_file.txt
This is my temp file text
须要执行相同操做,可是附加到现有文件而不是建立新文件。如清单 9 所示,改用 >> 操做符。>> 文件重定向操做符向现有文件附加内容。
清单 9.快速向文件附加内容
$ cat >> my_temp_file.txt
More text
^D
$ cat my_temp_file.txt
This is my temp file text
More text
curl 命令使您可使用 HTTP、HTTPS、FTP、FTPS、Gopher、DICT、TELNET、LDAP 或 FILE 协议从服务器检索数据。如清单 10 所示,我可使用 curl 命令从美国国家气象局了解我所在位置(纽约州布法罗市)的当前天气情况。当与 grep 命令组合使用时,我能够检索布法罗市的天气情况。使用 -s 命令行选项来禁止 curl 处理输出。
清单 10. 使用 curl 检索当前天气情况
$ curl –s http://www.srh.noaa.gov/data/ALY/RWRALY | grep BUFFALO
BUFFALO MOSUNNY 43 22 43 NE13 30.10R
如清单 11 所示,您也可使用 curl 命令来下载 HTTP 托管的文件。使用 -o 参数来指定保存输出的位置。
清单 11. 使用 curl 下载 HTTP 承载的文件
$ curl -o archive.tar http://www.somesite.com/archive.tar
这实际上只是您使用 curl 命令能够完成的操做的提示。您只需在命令提示符处键入 man curl 显示 curl 命令的完整使用信息,就能够开始了解更多内容。
大量 UNIX 命令使用正则表达式做为参数。从技术角度而言,正则表达式 是表示某种模式的字符串(也就是说,由字母、数字和符号组成的字符序列),用于定义零或更长的字符串。正则表达式使用元字符(例如,星号 [*] 和问号 [?])来匹配其余字符串的部分或所有内容。正则表达式不必定包含通配符,但通配符可使正则表达式在搜索模式和处理文件时发挥更大的做用。表 1 显示了一些基本正则表达式序列。
表 1. 正则表达式序列
清单 12 显示了与 grep 命令一块儿使用的一些基本正则表达式。
清单 12. 使用正则表达式和 grep
$ # Lists your mail
$ grep '^From: ' /usr/mail/$USER
$ # Any line with at least one letter
$ grep '[a-zA-Z]' search-file.txt
$ # Anything not a letter or number
$ grep '[^a-zA-Z0-9] search-file.txt
$ # Find phone numbers in the form 999-9999
$ grep '[0-9]\{3\}-[0-9]\{4\}' search-file.txt
$ # Find lines with exactly one character
$ grep '^.$' search-file.txt
$ # Find any line that starts with a period "."
$ grep '^\.' search-file.txt
$ # Find lines that start with a "." and 2 lowercase letters
$ grep '^\.[a-z][a-z]' search-file.txt
有关命令行正则表达式的深刻描述,阅读 developerWorks 文章"对话 UNIX,第 9 部分:正则表达式。"
有时,您可能但愿肯定某个特定用户是否运行过您的管理脚本。为找出答案,您可使用 whoami 命令来返回当前用户的名称。清单 13 显示了独自运行的 whoami 命令;清单 14 显示了使用 whoami 确保当前用户不是根用户的 Bash 脚本的摘录。
清单 13. 从命令行使用 whoami
$ whoami
John
清单 14. 在脚本中使用 whoami
if [ $(whoami) = "root" ]
then
echo "You cannot run this script as root."
exit 1
fi
awk 命令彷佛始终处在 Perl 的阴影下,但它对于简单、基于命令行的数据处理来讲是一个快速、实用的工具。清单 15 显示了如何开始使用 awk 命令。若要获取文件中每行文本的长度,请使用 length() 函数。若要查看字符串 ing 是否出如今文件文本中,请使用 index() 函数,该函数返回 ing 首次出现的位置,这样您就可使用它来进行进一步的字符串处理。若要 tokenize(也就是说,将一行拆分为单词长度的片断)某个字符串,请使用 split() 函数。
清单 15. 基本 awk 处理
$ cat text
testing the awk command
$ awk '{ i = length($0); print i }' text
23
$ awk '{ i = index($0,"ing"); print i}' text
5
$ awk 'BEGIN { i = 1 } { n = split($0,a," "); while (i <= n) {print a[i]; i++;} }' text
testing
the
awk
command
打印文本文件中的指定字段是一项简单的 awk 任务。在清单 16 中,sales 文件包含每一个销售人员的姓名,后跟每个月销售数字。您可使用 awk 命令来快速得到每月的销售总额。缺省状况下,awk 将每一个以逗号分隔的值视为不一样的字段。您使用 $n 操做符来访问每一个字段。
清单 16. 使用 awk 对数据进行汇总
$cat sales
Gene,12,23,7
Dawn,10,25,15
Renee,15,13,18
David,8,21,17
$ awk -F, '{print $1,$2+$3+$4}' sales
Gene 42
Dawn 50
Renee 46
David 46
成为命令行高手须要进行一些实践。按照相同的方式处理问题很简单,由于您已经习惯了。扩展您的命令行资源能够显著提升您的工做效率,并促使您朝着 UNIX 命令行高手的方向前进!