应该知道的Linux技巧

这篇文章来源于Quroa的一个问答《What are some time-saving tips that every Linux user should know?》—— Linux用户有哪些应该知道的提升效率的技巧。我以为挺好的,总结得比较好,把其转过来,并加了一些本身的理解。 首先,我想告诉你们,在Unix/Linux下,最有效率技巧的不是操做图形界面,而是命令行操做,由于命令行意味着自动化。若是你看过《你可能不知道的Shell》以及《28个Unix/Linux的命令行神器》你就会知道Linux有多强大,这个强大彻底来自于命令行,因而,就算你不知道怎么去作一个环保主义的程序员,至少他们可让你少熬点夜,从而有利于你的身体健康和性生活。下面是一个有点长的列表,正如做者所说,你并不须要知道全部的这些东西,可是若是你还在很沉重地在使用Linux的话,这些东西都值得你看一看。 (注:若是你想知道下面涉及到的命令的更多的用法,你必定要man一点。对于一些命令,你能够须要先yum或apt-get来安装一下,若是有什么问题,别忘了Google。若是你要Baidu的话,我仅表明这个地球上全部的生物包括微生物甚至细菌病毒和小强BS你到宇宙毁灭)html

基础

  • 学习 Bash 。你能够man bash来看看bash的东西,并不复杂也并不长。你用别的shell也行,可是bash是很强大的而且也是系统默认的。(学习zsh或tsch只会让你在不少状况下受到限制)
  • 了解 ssh。明白不须要口令的用户认证(经过ssh-agent, ssh-add),学会用sshFQ,用scp而不是ftp传文件,等等。你知道吗?scp 远端的时候,你能够按tab键来查看远端的目录和文件(固然,须要无口令的用户认证),这都是bash的功劳。

  • 熟悉bash的做业管理,如: &, Ctrl-Z, Ctrl-C, jobs, fg, bg, kill, 等等。固然,你也要知道Ctrl+\(SIGQUIT)和Ctrl+C (SIGINT)的区别。
  • 简单的文件管理 : ls 和 ls -l (你最好知道 “ls -l” 的每一列的意思), less, head, tail 和 tail -f, ln 和 ln -s (你知道明白hard link和soft link的不一样和优缺点), chown, chmod, du (若是你想看看磁盘的大小 du -sk *), df, mount。固然,原做者忘了find命令。
  • 基础的网络管理: ip 或 ifconfig, dig。固然,原做者还忘了如netstat, ping, traceroute, 等
  • 理解正则表达式,还有grep/egrep的各类选项。好比: -o, -A, 和 -B 这些选项是很值得了解的。
  • 学习使用 apt-get 和 yum 来查找和安装软件(前者的经典分发包是Ubuntu,后者的经典分发包是Redhat),我还建议你试着从源码编译安装软件。

平常ios

  • 在 bash 里,使用 Ctrl-R 而不是上下光标键来查找历史命令。
  • 在 bash里,使用 Ctrl-W 来删除最后一个单词,使用 Ctrl-U 来删除一行。请man bash后查找Readline Key Bindings一节来看看bash的默认热键,好比:Alt-. 把上一次命令的最后一个参数打出来,而Alt-* 则列出你能够输入的命令。
  • 回到上一次的工做目录: cd –  (回到home是 cd ~)
  • 使用 xargs。这是一个很强大的命令。你可使用-L来限定有多少个命令,也能够用-P来指定并行的进程数。若是你不知道你的命令会变成什么样,你可使用xargs echo来看看会是什么样。固然, -I{} 也很好用。示例:
1
2
3
find . -name \*.py | xargs grep some_function
 
cat hosts | xargs -I{} ssh root@{} hostname
  • pstree -p 能够帮你显示进程树。(读过个人那篇《一个fork的面试题》的人应该都不陌生)
  • 使用 pgrep 和 pkill 来找到或是kill 某个名字的进程。 (-f 选项颇有用).
  • 了解能够发给进程的信号。例如:要挂起一个进程,使用 kill -STOP [pid]. 使用 man 7 signal 来查看各类信号,使用kill -l 来查看数字和信号的对应表
  • 使用 nohup 或  disown 若是你要让某个进程运行在后台。
  • 使用netstat -lntp来看看有侦听在网络某端口的进程。固然,也可使用 lsof。
  • 在bash的脚本中,你可使用 set -x 来debug输出。使用 set -e 来当有错误发生的时候abort执行。考虑使用 set -o pipefail 来限制错误。还可使用trap来截获信号(如截获ctrl+c)。
  • 在bash 脚本中,subshells (写在圆括号里的) 是一个很方便的方式来组合一些命令。一个经常使用的例子是临时地到另外一个目录中,例如:
1
2
3
# do something in current dir
( cd /some/other/dir ; other- command )
# continue in original dir
  • 在 bash 中,注意那里有不少的变量展开。如:检查一个变量是否存在: ${name:?error message}。若是一个bash的脚本须要一个参数,也许就是这样一个表达式 input_file=${1:?usage: $0 input_file}。一个计算表达式: i=$(( (i + 1) % 5 ))。一个序列: {1..10}。 截断一个字符串: ${var%suffix} 和 ${var#prefix}。 示例: if var=foo.pdf, then echo ${var%.pdf}.txt prints “foo.txt”.
  • 经过 <(some command) 能够把某命令当成一个文件。示例:比较一个本地文件和远程文件 /etc/hosts: diff /etc/hosts <(ssh somehost cat /etc/hosts)
  • 了解什么叫 “here documents” ,就是诸如 cat <<EOF 这样的东西。
  • 在 bash中,使用重定向到标准输出和标准错误。如: some-command >logfile 2>&1。另外,要确认某命令没有把某个打开了的文件句柄重定向给标准输入,最佳实践是加上 “</dev/null”,把/dev/null重定向到标准输入。
  • 使用 man ascii 来查看 ASCII 表。
  • 要来debug Web,试试curl 和 curl -I 或是 wget 。我以为debug Web的利器是firebug,curl和wget是用来抓网页的,呵呵。
  • 把 HTML 转成文本: lynx -dump -stdin
  • 若是你要处理XML,使用 xmlstarlet
  • 对于 Amazon S3, s3cmd 是一个很方便的命令(还有点不成熟)
  • 在 ssh中,知道怎么来使用ssh隧道。经过 -L or -D (还有-R) ,FQ神器。
  • 你还能够对你的ssh 作点优化。好比,.ssh/config 包含着一些配置:避免连接被丢弃,连接新的host时不须要确认,转发认证,之前使用压缩(若是你要使用scp传文件):
1
2
3
4
5
6
TCPKeepAlive= yes
ServerAliveInterval=15
ServerAliveCountMax=6
StrictHostKeyChecking=no
Compression= yes
ForwardAgent= yes
  • 若是你有输了个命令行,可是你改变注意了,但你又不想删除它,由于你要在历史命令中找到它,但你也不想执行它。那么,你能够按下 Alt-# ,因而这个命令关就被加了一个#字符,因而就被注释掉了。

数据处理 程序员

  • 了解 sort 和 uniq 命令 (包括 uniq 的 -u 和 -d 选项).
  • 了解用 cut, paste, 和 join 命令来操做文本文件。不少人忘了在cut前使用join。
  • 若是你知道怎么用sort/uniq来作集合交集、并集、差集能很大地促进你的工做效率。假设有两个文本文件a和b已解被 uniq了,那么,用sort/uniq会是最快的方式,不管这两个文件有多大(sort不会被内存所限,你甚至可使用-T选项,若是你的/tmp目录很小)
1
2
3
4
5
cat a b | sort | uniq > c   # c is a union b 并集
 
cat a b | sort | uniq -d > c   # c is a intersect b 交集
 
cat a b b | sort | uniq -u > c   # c is set difference a - b 差集
  • 了解和字符集相关的命令行工具,包括排序和性能。不少的Linux安装程序都会设置LANG 或是其它和字符集相关的环境变量。这些东西可能会让一些命令(如:sort)的执行性能慢N多倍(注:就算是你用UTF-8编码文本文件,你也能够很安全地使用ASCII来对其排序)。若是你想Disable那个i18n 并使用传统的基于byte的排序方法,那就设置export LC_ALL=C (实际上,你能够把其放在 .bashrc)。若是这设置这个变量,你的sort命令颇有可能会是错的。
  • 了解 awk 和 sed,并用他们来作一些简单的数据修改操做。例如:求第三列的数字之和: awk ‘{ x += $3 } END { print x }’。这可能会比Python快3倍,并比Python的代码少三倍。
  • 使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。
  • 了解sort命令的选项。了解key是什么(-t和-k)。具体说来,你可使用-k1,1来对第一列排序,-k1来对全行排序。
  • Stable sort (sort -s) 会颇有用。例如:若是你要想对两例排序,先是以第二列,而后再以第一列,那么你能够这样: sort -k1,1 | sort -s -k2,2
  • 咱们知道,在bash命令行下,Tab键是用来作目录文件自动完成的事的。可是若是你想输入一个Tab字符(好比:你想在sort -t选项后输入<tab>字符),你能够先按Ctrl-V,而后再按Tab键,就能够输入<tab>字符了。固然,你也可使用$’\t’。
  • 若是你想查看二进制文件,你可使用hd命令(在CentOS下是hexdump命令),若是你想编译二进制文件,你可使用bvi命令(http://bvi.sourceforge.net/ 墙)
  • 另外,对于二进制文件,你可使用strings(配合grep等)来查看二进制中的文本。
  • 对于文本文件转码,你能够试一下 iconv。或是试试更强的 uconv 命令(这个命令支持更高级的Unicode编码)
  • 若是你要分隔一个大文件,你可使用split命令(split by size)和csplit命令(split by a pattern)。

系统调试面试

  • 若是你想知道磁盘、CPU、或网络状态,你可使用 iostat, netstat, top (或更好的 htop), 还有 dstat 命令。你能够很快地知道你的系统发生了什么事。关于这方面的命令,还有iftop, iotop等(参看《28个Unix/Linux的命令行神器》)
  • 要了解内存的状态,你可使用free和vmstat命令。具体来讲,你须要注意 “cached” 的值,这个值是Linux内核占用的内存。还有free的值。
  • Java 系统监控有一个小的技巧是,你可使用kill -3 <pid> 发一个SIGQUIT的信号给JVM,能够把堆栈信息(包括垃圾回收的信息)dump到stderr/logs。
  • 使用 mtr 会比使用 traceroute 要更容易定位一个网络问题。
  • 若是你要找到哪一个socket或进程在使用网络带宽,你可使用 iftop 或 nethogs。
  • Apache的一个叫 ab 的工具是一个颇有用的,用quick-and-dirty的方式来测试网站服务器的性能负载的工做。若是你须要更为复杂的测试,你能够试试 siege。
  • 若是你要抓网络包的话,试试 wireshark 或 tshark。
  • 了解 strace 和 ltrace。这两个命令可让你查看进程的系统调用,这有助于你分析进程的hang在哪了,怎么crash和failed的。你还能够用其来作性能profile,使用 -c 选项,你可使用-p选项来attach上任意一个进程。
  • 学会到 /proc 目录中查看信息。这是一个Linux内核运行时记录的整个操做系统的运行统计和信息,好比: /proc/cpuinfo, /proc/xxx/cwd, /proc/xxx/exe, /proc/xxx/fd/, /proc/xxx/smaps.
  • 若是你调试某个东西为何出错时,sar命令会有用。它可让你看看 CPU, 内存, 网络, 等的统计信息。
  • 使用 dmesg 来查看一些硬件或驱动程序的信息或问题。

做者最后加了一个免责声明:Disclaimer: Just because you can do something in bash, doesn’t necessarily mean you should. ;) (全文完)正则表达式

相关文章
相关标签/搜索