外部过滤器, 程序和命令

时间 2019-11-18

标签外部过滤器程序命令繁體版

原文原文链接

基本命令node

ls ： "列出"文件的基本命令. 可是每每就是由于这个命令太简单, 因此咱们老是低估它. 好比, 使用-R选项, 递归选项, ls将会以目录树的形式列出全部文件. 另外一个颇有用的选项-S, 将会按照文件尺寸列出全部文件, -t, 将会按照修改时间来列出文件, -i选项会显示文件的inode。正则表达式

cat, tac ： cat, 是单词concatenate的缩写, 把文件的内容输出到stdout. 当与重定向操做符(>或>>), 通常都是用来将多个文件链接起来.shell

cat命令的-n选项是为了在目标文件中的全部行前边插入行号. -b也是用来加行号的, 可是不对空行进行编号. -v选项可使用^标记法来echo出不可打印字符. -s选项能够把多个空行压缩成一个空行. 在一个管道中, 有一种把stdin重定向到一个文件中更有效的方法, 这种方法比使用cat文件的方法更高效.数据库

cat filename | tr a-z A-Z tr a-z A-Z < filename # 效果相同, 可是处理更少,而且连管道都省掉了express

tac命令, 就是cat命令的反转, 这个命令将会从文件结尾部分列出文件的内容.反向cat。编程

rev ：把每一行中的内容反转, 而且输出到stdout上. 这个命令与tac命令的效果是不一样的, 由于它并不反转行序, 而是把每行的内容反转.安全

cp ：这是文件拷贝命令. cp file1 file2把文件file1拷贝到file2, 若是file2存在的话, 那么file2将被覆盖。特别有用的选项就是-a选项, 这是归档标志(目的是为了copy一个完整的目录树), -u是更新选项, -r和-R选项是递归标志.bash

cp -u source_dir/* dest_dir # 把源目录"同步"到目标目录上, 也就是拷贝全部更新的文件和以前不存在的文件.服务器

mv ：这是文件移动命令. 它等价于cp和rm命令的组合. 它能够把多个文件移动到目录中,甚至将目录重命名.当使用非交互脚本时, 可使用mv的-f(强制)选项来避免用户的输入.当一个目录被移动到一个已存在的目录时, 那么它将成为目标目录的子目录.网络

rm ：删除(清除)一个或多个文件. -f选项将强制删除文件, 即便这个文件是只读的. 而且能够用来避免用户输入(在非交互脚本中使用). 当使用递归参数-r时, 这个命令将会删除整个目录树. 若是不慎的使用rm -rf *的话, 那整个目录树就真的完了.

rm将没法删除以破折号开头的文件.解决这个问题的一个方法就是在要删除的文件的前边加上./。另外一种解决的方法是在文件名前边加上" -- ". rm ./-badname 。 rm -- -badname

rmdir ：删除目录. 可是只有这个目录中没有文件的时候 -- 固然会包含"不可见的"点文件 -- 这个命令才会成功.

mkdir ：生成目录, 建立一个空目录. 好比, mkdir -p project/programs/December将会建立指定的目录,即便project目录和programs目录都不存在. -p选项将会自动产生必要的父目录, 这样也就同时建立了多个目录.

chmod ：修改一个现存文件的属性。 chmod +x filename , chmod 644 filename

ln : 建立文件连接, 前提是这个文件是存在的. "连接"就是一个文件的引用, 也就是这个文件的另外一个名字. ln命令容许对同一个文件引用多个连接, 而且是避免混淆的一个很好的方法。 ln对于文件来讲只不过是建立了一个引用, 一个指针而已, 由于建立出来的链接文件只有几个字节.

绝大多数使用ln命令时, 使用的是-s选项, 能够称为符号连接, 或"软"连接. 使用-s标志的一个优势是它能够穿越文件系统来连接目录. 关于使用这个命令的语法仍是有点小技巧的. 好比: ln -s oldfile newfile将对以前存在的oldfile产生一个新的链接, newfile.若是以前newfile已经存在的话, 将会产生一个错误信息.

不管是那种类型的连接, 都提供了一种双向引用的手段 -- 也就是说, 无论你用文件的哪一个名字对文件内容进行修改, 你修改的效果都即会影响到原始名字的文件, 也会影响到连接名字的文件. 当你工做在更高层次的时候, 才会发生软硬连接的不一样. 硬连接的优势是, 原始文件与连接文件之间是相互独立的 -- 若是你删除或者重命名旧文件, 那么这种操做将不会影响硬连接的文件, 硬连接的文件讲仍是原来文件的内容. 然而若是你使用软连接的话, 当你把旧文件删除或重命名后, 软连接将再也找不到原来文件的内容了. 而软连接的优势是它能够跨越文件系统(由于它只不过是文件名的一个引用, 而并非真正的数据). 与硬连接的另外一个不一样是, 一个符号连接能够指向一个目录.

man, info ：这两个命令用来查看系统命令或安装工具的手册和信息. 当二者均可用时, info页通常会比man页包含更多的细节描述.

复杂命令

find
-exec COMMAND \; 在每个find匹配到的文件执行COMMAND命令. 命令序列以;结束(";"是转义符以保证shll传递到find命令中的字符不会被解释为其余的特殊字符).若是COMMAND中包含{}, 那么find命令将会用全部匹配文件的路径名来替换"{}". find命令的-exec选项不该该与shell中的内建命令exec相混淆.

find ~/ -name 'core*' -exec rm {} \; # 从用户的 home 目录中删除全部的 core dump文件.

find /home/bozo/projects -mtime 1 # 列出最后一天被修改的 # mtime = 目标文件最后修改的时间 # ctime = 修改后的最后状态(经过'chmod'或其余方法) # atime = 最后访问时间

find "$DIR" -type f -atime +5 -exec rm {} \; 删除至少5天内没被访问过的 "/home/bozo/junk_files" 中的全部文件.

expr ： 通用求值表达式: 经过给定的操做(参数必须以空格分开)链接参数, 并对参数求值. 可使算术操做, 比较操做, 字符串操做或者是逻辑操做.

expr 5 \* 3 #返回15，在算术表达式expr中使用乘法操做时, 乘法符号必须被转义.

y=`expr $y + 1` 增长变量的值, 与let y=y+1和y=$(($y+1))的效果相同. 这是使用算术表达式的一个例子.

z=`expr substr $string $position $length` 在位置$position上提取$length长度的子串.

:操做能够替换match命令. 好比, b=`expr $a : [0-9]*`与b=`expr match $a [0-9]*`彻底等价.

时间/日期命令

date ： 直接调用date命令就会把日期和时间输出到 stdout上. 这个命令有趣的地方在于它的格式化和分析选项上. 须要在调用格式的前边加上一个'+'号.

date +%j # %j用来给出今天是本年度的第几天.

%s将产生从"UNIX 元年"到如今为止的秒数。suffix=$(date +%s) ， filename=$prefix.$suffix # 这是一种很是好的产生"惟一"临时文件的办法,甚至比使用$$都强.

SixDaysAgo=$(date --date='6 days ago')
OneWeekAgo=$(date --date='1 week ago')
OneMonthAgo=$(date --date='1 month ago') # 四周前(不是一个月).
OneYearAgo=$(date --date='1 year ago')

touch ：这是一个用来更新文件被访问或修改的时间的工具, 这个时间能够是当前系统的时间,也能够是指定的时间, 这个命令也用来产生一个新文件. 命令touch zzz将产生一个zzz为名字的0字节长度文件, 固然前提是zzz文件不存在. 为了存储时间信息, 就须要一个时间戳为空的文件, 好比当你想跟踪一个工程的修改时间的时候, 这就很是有用了.

at ： at命令是一个做业控制命令, 用来在指定时间点上执行指定的命令集合. 它有点像cron命令, 然而, at命令主要仍是用来执行那种一次性执行的命令集合. 你可使用-f选项或者使用(<)重定向操做符, 来让at命令从一个文件中读取命令集合. 这个文件其实就一个可执行的的脚本, 虽然它是一个不可交互的脚本。 at 2:30 am Friday < at-jobs.list

cal ：从stdout中输出一个格式比较整齐的日历. 既能够指定当前年度, 也能够指定过去或未来的某个年度.

sleep ：这个命令与一个等待循环的效果同样. 你能够指定须要暂停的秒数, 这段时间将什么都不干。 sleep 3 # 暂停3秒。sleep默认是以秒为单位, 可是你也能够指定分钟, 小时, 或者天数为单位. sleep 3 h # 暂停3小时! 若是你想每隔一段时间来运行一个命令的话, 那么watch命令将比sleep命令好得多.

文本处理命令

sort ：文件排序, 一般用在管道中当过滤器来使用. 这个命令能够依据指定的关键字或指定的字符位置, 对文件行进行排序. 使用-m选项, 它将会合并预排序的输入文件. 想了解这个命令的所有参数请参考这个命令的info页.

tsort ：拓扑排序, 读取以空格分隔的有序对, 而且依靠输入模式进行排序.

uniq ：这个过滤器将会删除一个已排序文件中的重复行. 这个命令常常出如今sort命令的管道后边.　

cat list-1 list-2 list-3 | sort | uniq > final.list　# 将3个文件链接起来, 将它们排序, 删除其中重复的行,最后将结果重定向到一个文件中.

-c用来统计每行出现的次数, 并把次数做为前缀放到输出行的前面.

sort INPUTFILE | uniq -c | sort -nr 命令先对INPUTFILE文件进行排序, 而后统计每行出现的次数(sort命令的-nr选项会产生一个数字的反转排序). 这种命令模板通常都用来分析log文件或者用来分析字典列表, 或者用在那些须要检查文本词汇结构的地方.

sed -e 's/\.//g' -e 's/\,//g' -e 's/ /\
/g' "$1" | tr 'A-Z' 'a-z' | sort | uniq -c | sort -nr　　　# 过滤掉句号和逗号, 而且把单词间的空格转化为换行, 而后转化为小写, 最后统计单词出现的频率并按频率排序.

expand, unexpand　：　expand命令将会把每一个tab转化为一个空格. 这个命令常常用在管道中.unexpand命令将会把每一个空格转化为一个tab. 效果与expand命令相反.

cut　：　一个从文件中提取特定域的工具. 这个命令与awk中使用的print $N命令很类似, 可是更受限. 在脚本中使用cut命令会比使用awk命令来得容易一些. 最重要的选项就是-d(字段定界符)和-f(域分隔符)选项.

cut -d ' ' -f1,2 /etc/mtab

paste　：　将多个文件, 以每一个文件一列的形式合并到一个文件中, 合并后文件中的每一列就是原来的一个文件.与cut结合使用, 常常用于建立系统log文件.

join　：　这个命令与paste命令属于同类命令. 可是它可以完成某些特殊的目地. 这个强力工具可以以一种特殊的形式来合并两个文件, 这种特殊的形式本质上就是一个关联数据库的简单版本.join命令只可以操做两个文件. 它能够将那些具备特定标记域(一般是一个数字标签)的行合并起来, 而且将结果输出到stdout. 被加入的文件应该事先根据标记域进行排序以便于可以正确的匹配.　

head　：　把文件的头部内容打印到stdout上(默认为10行, 能够本身修改). 这个命令有一些比较有趣的选项.

tail　：　将一个文件结尾部分的内容输出到stdout中(默认为10行). 一般用来跟踪一个系统logfile的修改状况,若是使用-f选项的话, 这个命令将会继续显示添加到文件中的行.

为了列出一个文本文件中的指定行的内容, 能够将head命令的输出经过管道传递到tail -1中. 好比head -8 database.txt | tail -1将会列出database.txt文件第8行的内容.

var=$(head -$m $filename | tail -$n)　 # filename = 文件名　# m = 从文件开头到块结尾的行数　# n = 想保存到变量中的指定行数(从块结尾开始截断)

grep　：　使用正则表达式的一个多用途文本搜索工具. 这个命令原本是ed行编辑器中的一个命令/过滤器:　g/re/p -- global - regular expression - print.

grep pattern [file...]　在文件中搜索全部pattern出现的位置, pattern既能够是要搜索的字符串, 也能够是一个正则表达式.

grep '[rst]ystem.$' osinfo.txt　＃Linux operating system.　　＃若是没有指定文件参数, grep一般用在管道中对stdout进行过滤.

-i 选项在搜索时忽略大小写.　-w 选项用来匹配整个单词.　-l 选项仅列出符合匹配的文件, 而不列出匹配行.　-r (递归) 选项不只在当前工做目录下搜索匹配, 并且搜索子目录.　-n 选项列出全部匹配行, 并显示行号.　-v (或者--invert-match)选项将会显示全部不匹配的行.　　-c (--count) 选项将只会显示匹配到的行数的总数,而不会列出具体的匹配.

grep -n Linux osinfo.txt　＃6: Linux operating system.

若是存在一个成功的匹配, 那么grep命令将会返回0做为退出状态码, 这样就能够将grep命令的结果放在脚本的条件测试中来使用, 尤为和-q(禁止输出)选项组合时特别有用.　grep -q "$word" "$filename" # "-q"选项将使得什么都不输出到stdout上.

egrep - 扩展的grep - 这个命令与grep -E等价. 这个命令用起来有些不一样, 因为使用正则表达式的扩展集合, 将会使得搜索更具灵活性. 它也容许逻辑|(或)操做.　egrep 'matches|Matches' file.txt

fgrep - 快速的grep - 这个命令与grep -F等价. 这是一种按照字符串字面意思进行的搜索(即不容许使用正则表达式), 这样有时候会使搜索变得容易一些.

look　：look命令与grep命令很类似, 可是这个命令只能作"字典查询", 也就是它所搜索的文件必须是已经排过序的单词列表. 默认状况下, 若是没有指定搜索哪一个文件, look命令就默认搜索/usr/dict/words(译者:感受好像应该是/usr/share/dict/words), 固然也能够指定其余目录下的文件进行搜索.

sed, awk ：这个两个命令都是独立的脚本语言, 尤为适合分析文本文件和命令输出. 既能够单独使用, 也能够结合管道和在shell脚本中使用.

sed　：　非交互式的"流编辑器", 在批处理模式下, 容许使用多个ex命令. 你会发现它在shell脚本中很是有用.

awk　：　可编程的文件提取器和文件格式化工具, 在结构化的文本文件中, 处理或提取特定域(特定列)具备很是好的表现. 它的语法与C语言很相似.

wc　：　wc能够统计文件或I/O流中的"单词数量":　

wc -w 统计单词数量.　wc -l 统计行数量.　wc -c 统计字节数量.wc -m 统计字符数量.wc -L 给出文件中最长行的长度.

ls *.txt | wc -l　#由于列出的文件名都是以换行符区分的, 因此使用-l来统计.

tr : 字符转换过滤器. 必须使用引用或中括号, 这样作才是合理的. 引用能够阻止shell从新解释出如今tr命令序列中的特殊字符. 中括号应该被引用起来防止被shell扩展.

不管tr "A-Z" "*" <filename仍是tr A-Z \* <filename均可以将filename中的大写字符修改成星号(写到stdout). 可是在某些系统上可能就不能正常工做了, 而tr A-Z '[**]'在任何系统上均可以正常工做.

-d选项删除指定范围的字符. echo "abcdef" | tr -d b-d # aef . tr -d 0-9 <filename # 删除"filename"中全部的数字.

--squeeze-repeats (或-s)选项用来在重复字符序列中除去除第一个字符之外的全部字符. 这个选项在删除多余空白的时候很是有用. echo "XXXXX" | tr --squeeze-repeats 'X' # X

-c"complement"选项将会反转匹配的字符集. 经过这个选项, tr将只会对那些不匹配的字符起做用. echo "acfdeb123" | tr -c b-d + # +c+d+b++++

tr a-z A-Z <"$1" , tr '[:lower:]' '[:upper:]' <"$1" 所有转换为大写.

tr 'a-zA-Z' 'n-za-mN-ZA-M' # "a"变为"n", "b"变为"o", 等等.

fold : 将输入按照指定宽度进行折行. 这里有一个很是有用的选项-s, 这个选项可使用空格进行断行(译者:事实上只有外文才须要使用空格断行, 中文是不须要的)

fmt : 一个简单的文件格式器, 一般用在管道中, 将一个比较长的文本行输出进行"折行". fmt -w $WIDTH

col : 这个命令用来滤除标准输入的反向换行符号. 这个工具还能够将空白用等价的tab来替换. col工具最主要的应用仍是从特定的文本处理工具中过滤输出, 好比groff和tbl.

column : 列格式化工具. 经过在合适的位置插入tab, 这个过滤工具会将列类型的文本转化为"易于打印"的表格式进行输出.

ls -l | sed 1d) | column -t # 管道中的"sed 1d"删除输出的第一行, "column"中的-t选项用来转化为易于打印的表形式.

colrm : 列删除过滤器. 这个工具将会从文件中删除指定的列(列中的字符串)而且写到文件中, 若是指定的列不存在, 那么就回到stdout. colrm 2 4 <filename将会删除filename文件中每行的第2到第4列之间的全部字符. 若是这个文件包含tab和不可打印字符, 那将会引发不可预期的行为. 在这种状况下, 应该经过管道的手段使用expand和unexpand来预处理colrm.

nl : 计算行号过滤器. nl filename将会把filename文件的全部内容都输出到stdout上, 可是会在每一个非空行的前面加上连续的行号. 若是没有filename参数, 那么就操做stdin.nl命令的输出与cat -n很是类似, 然而, 默认状况下nl不会列出空行.

通信命令

host ： 经过名字或IP地址来搜索一个互联网主机的信息, 使用DNS.
bash$ host surfacemail.com #host ip
surfacemail.com. has address 202.92.42.236

ipcalc： 显示一个主机IP信息. 使用-h选项, ipcalc将会作一个DNS的反向查询, 经过IP地址找到主机(服务器)名.
bash$ ipcalc -h 202.92.42.236
HOSTNAME=surfacemail.com

nslookup ： 经过IP地址在一个主机上作一个互联网的"名字服务查询". 事实上, 这与ipcalc -h或dig -x等价. 这个命令既能够交互运行也能够非交互运行, 换句话说, 就是在脚本中运行.nslookup命令听说已经被慢慢的"忽视"了, 但事实上它是有必定的做用.
bash$ nslookup -sil 66.97.104.180
nslookup kuhleersparnis.ch
Server: 135.116.137.2
Address: 135.116.137.2#53
Non-authoritative answer:
Name: kuhleersparnis.ch

dig  ： Domain Information Groper(域信息查询). 与nslookup很类似, dig也能够在一个主机上作互联网的"名字服务查询". 这个命令既能够交互运行也能够非交互运行, 换句话说, 就是在脚本中运行.
下面是一些dig命令有趣的选项, +time=N选项用来设置查询超时为N秒, nofail选项用来持续查询服务器直到收到一个响应, -x会作反向地址查询.
比较下边这3个命令的输出, dig -x, ipcalc -h和 nslookup.
dig -x 81.9.6.2

traceroute ： 跟踪包发送到远端主机过程当中的路由信息. 这个命令在LAN, WAN, 或者在Internet上均可以正常工做. 远端主机能够经过IP地址来指定. 这个命令的输出也能够经过管道中的grep或sed命令来过滤.

ping ： 广播一个"ICMP ECHO_REQUEST"包到其余主机上, 既能够是本地网络也能够是远端网络. 这是一个测试网络链接的诊断工具, 应该当心使用.若是ping成功之行, 那么返回的退出状态码为0. 能够用在脚本的测试语句中.

whois ： 执行DNS(域名系统)查询. -h选项容许指定须要查询的特定whois服务器

rcp : 远端拷贝, 在网络上的不一样主机间拷贝文件.

rsync : 远端同步, 在网络上的不一样主机间(同步)更新文件.

ssh : 安全shell, 登录远端主机并在其上运行命令. 这个工具具备身份认证和加密的功能, 能够安全的替换telnet, rlogin, rcp, 和rsh等工具. 

scp : 安全拷贝, 在功能上与rcp很类似, 就是在两个不一样的网络主机之间拷贝文件, 可是要使用鉴权的方式, 而且要使用与ssh相似的安全层.

netstat : 显示当前网络的统计情况和信息, 好比路由表和激活的链接, 这个工具将访问/proc/net(27)中的信息.netstat -r等价于route命令.

route : 显示内核路由表信息, 或者查看内核路由表的修改状况.

du
du的英文为:disk usage,含义是磁盘空间使用状况，功能是逐级进入指定目录的每个子目录并显示该目录占用文件系统数据块的状况，若是没有指定目录，则对当前的目录进行统计。
du的命令各个选项含义以下：

a：显示所有目录和其次目录下的每一个档案所占的磁盘空间
s：只显示各档案大小的总合 
b：大小用bytes来表示
x：跳过在不一样文件系统上的目录不予统计
a：递归地显示指定目录中各文件及子孙目录中各文件占用的数据块数
du -s只展现目录的使用总量（不分别展现各个子目录状况），-m是以MB为单位展现目录的大小（固然-k/-g就是KB/GB了）。

df
于du不一样的是，du是面向文件的命令，只计算被文件占用的空间。不计算文件系统metadata 占用的空间。df则是基于文件系统整体来计算，经过文件系统中未分配空间来肯定系统中已经分配空间的大小。df命令能够获取硬盘占用了多少空间，还剩下多少空间，它也能够显示全部文件系统对i节点和磁盘块的使用状况。

df命令各个选择的含义以下：
a：显示所有的档案系统和各分割区的磁盘使用情形
i：显示i -nodes的使用量
k：大小用k来表示 (默认值)
t：显示某一个档案系统的全部分割区磁盘使用量
x：显示不是某一个档案系统的全部分割区磁盘使用量
T：显示每一个分割区所属的档案系统名称