引言html
当您常用某个系统时,每每会陷入某种固定的使用模式。有时,您没有养成以尽量最好的方式作事的习惯。有时,您的不良习惯甚至会致使出现混乱。纠正此类缺点的最佳方法之一,就是有意识地采用抵制这些坏习惯的好习惯。本文提出了 10 个值得采用的 UNIX 命令行习惯——帮助您克服许多常见使用怪癖,并在该过程当中提升命令行工做效率的好习惯。下面列出了这 10 个好习惯,以后对进行了更详细的描述。shell
要采用的十个好习惯为:工具
find
以外使用 xargs
。grep
应该执行计数——什么时候应该绕过。cat
使用管道。清单 1 演示了最多见的 UNIX 坏习惯之一:一次定义一个目录树。测试
~ $ mkdir tmp ~ $ cd tmp ~/tmp $ mkdir a ~/tmp $ cd a ~/tmp/a $ mkdir b ~/tmp/a $ cd b ~/tmp/a/b/ $ mkdir c ~/tmp/a/b/ $ cd c ~/tmp/a/b/c $
使用 mkdir
的 -p
选项并在单个命令中建立全部父目录及其子目录要容易得多。可是即便对于知道此选项的管理员,他们在命令行上建立子目录时也仍然束缚于逐步建立每级子目录。花时间有意识地养成这个好习惯是值得的:命令行
~ $ mkdir -p tmp/a/b/c
您可使用此选项来建立整个复杂的目录树(在脚本中使用是很是理想的),而不仅是建立简单的层次结构。例如:unix
~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
过去,单独定义目录的惟一借口是您的 mkdir
实现不支持此选项,可是在大多数系统上再也不是这样了。IBM、AIX®、mkdir
、GNU mkdir
和其余遵照单一 UNIX 规范 (Single UNIX Specification) 的系统如今都具备此选项。code
对于仍然缺少该功能的少数系统,您可使用 mkdirhier
脚本(请参见参考资料),此脚本是执行相同功能的 mkdir
的包装:htm
~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
另外一个不良的使用模式是将 .tar 存档文件移动到某个目录,由于该目录刚好是您但愿在其中提取 .tar 文件的目录。其实您根本不须要这样作。您能够为所欲为地将任何 .tar 存档文件解压缩到任何目录——这就是 -C
选项的用途。在解压缩某个存档文件时,使用 -C
选项来指定要在其中解压缩该文件的目录:three
-C
来解压缩 .tar 存档文件~ $ tar xvf -C tmp/a/b/c newarc.tar.gz
相对于将存档文件移动到您但愿在其中解压缩它的位置,切换到该目录,而后才解压缩它,养成使用 -C
的习惯则更加可取——当存档文件位于其余某个位置时尤为如此。ip
您可能已经知道,在大多数 Shell 中,您能够在单个命令行上经过在命令之间放置一个分号 (;) 来组合命令。该分号是 Shell 控制操做符,虽然它对于在单个命令行上将离散的命令串联起来颇有用,但它并不适用于全部状况。例如,假设您使用分号来组合两个命令,其中第二个命令的正确执行彻底依赖于第一个命令的成功完成。若是第一个命令未按您预期的那样退出,第二个命令仍然会运行——结果会致使失败。相反,应该使用更适当的控制操做符(本文将描述其中的部分操做符)。只要您的 Shell 支持它们,就值得养成使用它们的习惯。
使用 &&
控制操做符来组合两个命令,以便仅当 第一个命令返回零退出状态时才运行第二个命令。换句话说,若是第一个命令运行成功,则第二个命令将运行。若是第一个命令失败,则第二个命令根本就不运行。例如:
~ $ cd tmp/a/b/c && tar xvf ~/archive.tar
在此例中,存档的内容将提取到 ~/tmp/a/b/c 目录中,除非该目录不存在。若是该目录不存在,则 tar
命令不会运行,所以不会提取任何内容。
相似地,||
控制操做符分隔两个命令,而且仅当第一个命令返回非零退出状态时才运行第二个命令。换句话说,若是第一个命令成功,则第二个命令不会运行。若是第一个命令失败,则第二个命令才会 运行。在测试某个给定目录是否存在时,一般使用此操做符,若是该目录不存在,则建立它:
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c
您还能够组合使用本部分中描述的控制操做符。每一个操做符都影响最后的命令运行:
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar
始终要谨慎使用 Shell 扩展和变量名称。通常最好将变量调用包括在双引号中,除非您有不这样作的足够理由。相似地,若是您直接在字母数字文本后面使用变量名称,则还要确保将该变量名称包括在方括号 ([]) 中,以使其与周围的文本区分开来。不然,Shell 将把尾随文本解释为变量名称的一部分——而且极可能返回一个空值。清单 8 提供了变量的各类引用和非引用及其影响的示例。
~ $ ls tmp/ a b ~ $ VAR="tmp/*" ~ $ echo $VAR tmp/a tmp/b ~ $ echo "$VAR" tmp/* ~ $ echo $VARa ~ $ echo "$VARa" ~ $ echo "${VAR}a" tmp/*a ~ $ echo ${VAR}a tmp/a ~ $
您或许看到过使用反斜杠 (\) 来将较长的行延续到下一行的代码示例,而且您知道大多数 Shell 都将您经过反斜杠联接的后续行上键入的内容视为单个长行。然而,您可能没有在命令行中像一般那样利用此功能。若是您的终端没法正确处理多行回绕,或者您的命令行比一般小(例如在提示符下有长路经的时候),反斜杠就特别有用。反斜杠对于了解键入的长输入行的含义也很是有用,如如下示例所示:
~ $ cd tmp/a/b/c || \ > mkdir -p tmp/a/b/c && \ > tar xvf -C tmp/a/b/c ~/archive.tar
或者,也可使用如下配置:
~ $ cd tmp/a/b/c \ > || \ > mkdir -p tmp/a/b/c \ > && \ > tar xvf -C tmp/a/b/c ~/archive.tar
然而,当您将输入行划分到多行上时,Shell 始终将其视为单个连续的行,由于它老是删除全部反斜杠和额外的空格。
注意:在大多数 Shell 中,当您按向上箭头键时,整个多行输入将重绘到单个长输入行上。
大多数 Shell 都具备在列表中对命令分组的方法,以便您能将它们的合计输出向下传递到某个管道,或者将其任何部分或所有流重定向到相同的地方。您通常能够经过在某个 Subshell 中运行一个命令列表或经过在当前 Shell 中运行一个命令列表来实现此目的。
使用括号将命令列表包括在单个组中。这样作将在一个新的 Subshell 中运行命令,并容许您重定向或收集整组命令的输出,如如下示例所示:
~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \ > VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \ > | mailx admin -S "Archive contents"
在此示例中,该存档的内容将提取到 tmp/a/b/c/ 目录中,同时将分组命令的输出(包括所提取文件的列表)经过邮件发送到地址 admin
。
当您在命令列表中从新定义环境变量,而且您不但愿将那些定义应用于当前 Shell 时,使用 Subshell 更可取。
将命令列表用大括号 ({}) 括起来,以在当前 Shell 中运行。确保在括号与实际命令之间包括空格,不然 Shell 可能没法正确解释括号。此外,还要确保列表中的最后一个命令以分号结尾,如如下示例所示:
~ $ { cp ${VAR}a . && chown -R guest.guest a && \ > tar cvf newarchive.tar a; } | mailx admin -S "New archive"
使用 xargs
工具做为筛选器,以充分利用从 find
命令挑选的输出。find
运行一般提供与某些条件匹配的文件列表。此列表被传递到 xargs
上,后者而后使用该文件列表做为参数来运行其余某些有用的命令,如如下示例所示:
xargs
工具的经典用法示例~ $ find some-file-criteria some-file-path | \ > xargs some-great-command-that-needs-filename-arguments
然而,不要将 xargs
仅看做是 find
的辅助工具;它是一个未获得充分利用的工具之一,当您养成使用它的习惯时,将会但愿进行全部试验,包括如下用法。
在最简单的调用形式中,xargs
就像一个筛选器,它接受一个列表(每一个成员分别在单独的行上)做为输入。该工具将那些成员放置在单个空格分隔的行上:
xargs
工具产生的输出示例~ $ xargsabcControl-D a b c ~ $
您能够发送经过 xargs
来输出文件名的任何工具的输出,以便为其余某些接受文件名做为参数的工具得到参数列表,如如下示例所示:
xargs
工具的使用示例~/tmp $ ls -1 | xargs December_Report.pdf README a archive.tar mkdirhier.sh ~/tmp $ ls -1 | xargs file December_Report.pdf: PDF document, version 1.3 README: ASCII text a: directory archive.tar: POSIX tar archive mkdirhier.sh: Bourne shell script text executable ~/tmp $
xargs
命令不仅用于传递文件名。您还能够在须要将文本筛选到单个行中的任什么时候候使用它:
xargs
工具来将文本筛选到单个行中~/tmp $ ls -l | xargs -rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \ root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \ 16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \ joe joe 3239 Sep 30 12:40 mkdirhier.sh ~/tmp $
xargs
从技术上讲,使用 xargs
不多遇到麻烦。缺省状况下,文件结束字符串是下划线 (_);若是将该字符做为单个输入参数来发送,则它以后的全部内容将被忽略。为了防止这种状况发生,可使用 -e
标志,它在不带参数的状况下彻底禁用结束字符串。
避免经过管道将 grep
发送到 wc -l
来对输出行数计数。grep
的 -c
选项提供了对与特定模式匹配的行的计数,而且通常要比经过管道发送到 wc
更快,如如下示例所示:
~ $ time grep and tmp/a/longfile.txt | wc -l 2811 real 0m0.097s user 0m0.006s sys 0m0.032s ~ $ time grep -c and tmp/a/longfile.txt 2811 real 0m0.013s user 0m0.006s sys 0m0.005s ~ $
除了速度因素外,-c
选项仍是执行计数的好方法。对于多个文件,带 -c
选项的 grep
返回每一个文件的单独计数,每行一个计数,而针对 wc
的管道则提供全部文件的组合总计数。
然而,无论是否考虑速度,此示例都代表了另外一个要避免地常见错误。这些计数方法仅提供包含匹配模式的行数——若是那就是您要查找的结果,这没什么问题。可是在行中具备某个特定模式的多个实例的状况下,这些方法没法为您提供实际匹配实例数量 的真实计数。归根结底,若要对实例计数,您仍是要使用 wc
来计数。首先,使用 -o
选项(若是您的版本支持它的话)来运行 grep
命令。此选项仅 输出匹配的模式,每行一个模式,而不输出行自己。可是您不能将它与 -c
选项结合使用,所以要使用 wc -l
来对行计数,如如下示例所示:
~ $ grep -o and tmp/a/longfile.txt | wc -l 3402 ~ $
在此例中,调用 wc
要比第二次调用 grep
并插入一个虚拟模式(例如 grep -c
)来对行进行匹配和计数稍快一点。
当您只但愿匹配输出行中特定字段 中的模式时,诸如 awk
等工具要优于 grep
。
下面通过简化的示例演示了如何仅列出 12 月修改过的文件。
~/tmp $ ls -l /tmp/a/b/c | grep Dec -rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 root root 238 Dec 03 08:19 README -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar ~/tmp $
在此示例中,grep
对行进行筛选,并输出其修改日期和名称中带 Dec
的全部文件。所以,诸如 December_Report.pdf 等文件是匹配的,即便它自从一月份以来还未修改过。这可能不是您但愿的结果。为了匹配特定字段中的模式,最好使用 awk
,其中的一个关系运算符对确切的字段进行匹配,如如下示例所示:
awk
来查找特定字段中的模式~/tmp $ ls -l | awk '$6 == "Dec"' -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rw-r--r-- 1 root root 238 Dec 03 08:19 README ~/tmp $
有关如何使用 awk
的更多详细信息,请参见参考资料。
grep
的一个常见的基本用法错误是经过管道将 cat
的输出发送到 grep
以搜索单个文件的内容。这绝对是没必要要的,纯粹是浪费时间,由于诸如 grep
这样的工具接受文件名做为参数。您根本不须要在这种状况下使用 cat
,如如下示例所示:
cat
的 grep~ $ time cat tmp/a/longfile.txt | grep and 2811 real 0m0.015s user 0m0.003s sys 0m0.013s ~ $ time grep and tmp/a/longfile.txt 2811 real 0m0.010s user 0m0.006s sys 0m0.004s ~ $
此错误存在于许多工具中。因为大多数工具都接受使用连字符 (-) 的标准输入做为一个参数,所以即便使用 cat
来分散 stdin
中的多个文件,参数也一般是无效的。仅当您使用带多个筛选选项之一的 cat
时,才真正有必要在管道前首先执行链接。
最好检查一下您的命令行习惯中的任何不良的使用模式。不良的使用模式会下降您的速度,而且一般会致使意外错误。本文介绍了 10 个新习惯,它们能够帮助您摆脱许多最多见的使用错误。养成这些好习惯是增强您的 UNIX 命令行技能的积极步骤。
原文连接:
英文版: http://www.ibm.com/developerworks/aix/library/au-badunixhabits.html?S_CMP=cn-a-aix&S_TACT=105AGX52
中文版: http://www.ibm.com/developerworks/cn/aix/library/au-badunixhabits.html