信息安全系统设计基础第一周学习总结

一、Linux简介javascript

学习过程css

  这一节主要是文字性的描述,先介绍了Linux就是一个操做系统,包括系统调用和内核两层,再简介了Linux的发展由来, 商业化的UNIX,低廉的 MINIX( 功能有限的相似 UNIX 的操做系统),Linux 之父从 MINIX 开始入手,开发出Linux,而后逐步发展成如今的Linux。前端

Linux与Windows的不一样:java

Linux:免费,自由软件但质量欠缺,相对安全,命令行操做兼具图形界面操做,可定制性很好。node

Windows:收费,收费软件但质量有保证,不太安全,纯图形界面下操做,可定制性不好。python

Windows没有的:linux

  • 稳定的系统
  • 安全性和漏洞的快速修补
  • 多用户
  • 用户和用户组的规划
  • 相对较少的系统资源占用
  • 可定制裁剪,移植到嵌入式平台(如安卓设备)
  • 可选择的多种图形用户界面(如 GNOME,KDE)

Linux没有的:nginx

  • 没有特定的支持厂商
  • 游戏娱乐支持度不足
  • 专业软件支持度不足

遇到的问题:git

  本节均为文字性描述,太过抽象,且多为专业性词语,并不能深入理解,难免会让人以为乏味,没兴趣。正则表达式

但愿从此会更通俗易懂,如:安全性

  • Windows 平台:三天两头打补丁安装系统安全更新,仍是会中病毒木马;
  • Linux 平台:要说 Linux 没有安全问题,那固然是不可能的,这一点仁者见仁智者见智,相对来讲确定比 Windows 平台要更加安全,使用 Linux 你也不用装某杀毒,某毒霸。

二、基本概念及操做

Linux 的桌面环境:UNIX/Linux 自己是没有图形界面的, xorg(Linux 上的软件) 是 X(窗口系统) 架构规范的一个实现体,也就是说它是实现了 X 协议规范的一个提供图形用户界面服务的服务器,客户端,咱们称为 X Client,实现了客户端功能的桌面环境KDEGNOMEXFCELXDE。

 

终端模拟器的程序(Terminal):gnome-terminal,kconsole,xterm,rxvt,kvt,nxterm 和 eterm,目前咱们的实验中的终端程序是 xfce 桌面环境自带的 xfce-terminal。

Linux 默认提供了 6 个纯命令行界面的 “terminal”来让用户登陆,在物理机系统上你能够经过使用[Ctrl]+[Alt]+[F1]~[F6]进行切换,不过在咱们的在线实验环境中可能没法切换,由于特殊功能按键会被你主机系统劫持。当你切换到其中一个终端后想要切换回图形界面,你能够按下[Ctrl]+[Alt]+[F7]来完成。

 

 Shell(壳),有壳就有核,这里的核就是指的 UNIX/Linux 内核,Shell 是指“提供给使用者使用界面”的软件(命令解析器)。普通意义上的 Shell 就是能够接受用户输入命令的程序。

Unix/Linux 操做系统下的 Shell 既是用户交互的界面,也是控制系统的脚本语言。在Windows 操做系统下,可能有些用户历来都不会直接的使用 Shell,然而在 UNIX 系列操做系统下,Shell 仍然是控制系统启动、X11 启动和不少其余实用工具的脚本解释程序。

在 UNIX/Linux 中比较流行的常见的 Shell 有 bash,zsh,ksh,csh

 

命令行操做体验:

双击桌面上的Xface终端图标,打开终端,打开终端后会自动运行 Shell 程序,而后咱们就能够输入命令让系统来执行了:

快捷键:

使用Tab键来进行命令补全,当你忘记某个命令的全称时你能够只输入它的开头的一部分而后按下Tab键就能够获得提示或者帮助完成。补全命令,补全目录,补全命令参数。

使用Ctrl+c键来强行终止当前程序(你能够放心它并不会使终端退出)。

其余一些经常使用快捷键
按键 做用
Ctrl+d 键盘输入结束或退出终端
Ctrl+s 暂定当前程序,暂停后按下任意键恢复运行
Ctrl+z 将当前程序放到后台运行,恢复到前台为命令fg
Ctrl+a 将光标移至输入行头,至关于Home
Ctrl+e 将光标移至输入行末,至关于End
Ctrl+k 删除从光标所在位置到行末
Alt+Backspace 向前删除一个单词
Shift+PgUp 将终端显示向上滚动
Shift+PgDn 将终端显示向下滚动

学会利用历史输入命令:很简单,你可使用键盘上的方向键,恢复你以前输入过的命令。

 

通配符是一种特殊语句,主要有星号(*)和问号(?),用来对对字符串进行模糊匹配(好比文件名,参数名)。当查找文件夹时,可使用它来代替一个或多个真正字符。它只会出如今命令的“参数值”里(它不用在 命令名称里, 命令不记得,那就用Tab补全)。通配符 实际上就是一种 Shell 实现的路径扩展功能。在 通配符被处理后, Shell 会先完成该命令的重组,而后再继续处理重组后的命令,直至执行该命令。

示例:一、使用通配符寻找文件:先使用 touch 命令建立 2 个文件

二、一次性建立多个文件

Shell 经常使用通配符:

字符 含义
* 匹配 0 或多个字符
? 匹配任意一个字符
[list] 匹配 list 中的任意单一字符
[!list] 匹配 除list 中的任意单一字符之外的字符
[c1-c2] 匹配 c1-c2 中的任意单一字符 如:[0-9] [a-z]
{string1,string2,...} 匹配 sring1 或 string2 (或更多)其一字符串
{c2..c2} 匹配 c1-c2 中所有字符 如{1..10}

 

在 Linux 环境中,若是你遇到困难,可使用man 命令,内容包括计算机程序(包括库和系统调用),正式的标准和惯例,甚至是抽象的概念。用户能够经过执行 man 命令调用手册页。

可使用以下方式来得到某个命令的说明和使用方式的详细介绍:

$ man <command_name>

man 手册里面的内容都是英文的,作了分册(分区段)处理的,在Research UNIX、BSD、OS X 和 Linux 中,手册一般被分为8个区段,安排以下:

区段 说明
1 通常命令
2 系统调用
3 库函数,涵盖了C标准函数库
4 特殊文件(一般是/dev中的设备)和驱动程序
5 文件格式和约定
6 游戏和屏保
7 杂项
8 系统管理命令和守护进程

要查看相应区段的内容,就在 man 后面加上相应区段的数字便可,如:

$ man 3 printf

手册页遵循一个常见的布局

通常包括如下部份内容:

NAME(名称)

SYNOPSIS(概要)

DESCRIPTION(说明)

EXAMPLES(示例)

SEE ALSO(参见)

一般 man 手册中的内容不少,能够在 man 中使用搜索,/<你要搜索的关键字>,查找到后你可使用n键切换到下一个关键字所在处,shift+n为上一个关键字所在处。使用Space(空格键)翻页,Enter(回车键)向下滚动一行,或者使用j,k(vim编辑器的移动键)进行向前向后滚动一行。按下h键为显示使用帮助(由于man使用less做为阅读器,实为less工具的帮助),按下q退出。

想要得到更详细的帮助,你还可使用info命令,不过一般使用man就足够了。若是你知道某个命令的做用,只是想快速查看一些它的某个具体参数的做用,那么你可使用--help参数,大部分命令都会带有这个参数,如:

$ ls --help

做业:

输出图形字符的命令banner

 

先使用以下命令安装:

$ sudo apt-get update;sudo apt-get install sysvbanner

而后:

$ banner shiyanlou

还可使用默认已经安装的一个命令printerbanner

$ printerbanner -w 50 A

'-w'参数指定打印宽度,由于咱们的环境在屏幕中显示比较小,必需要加上宽度限制。

还有两个相似的命令toilet,figlet

 

三、用户及文件权限管理

Linux 是一个能够实现多用户登录的操做系统,因为 Linux 的 用户管理 和 权限机制 ,不一样用户不能够轻易地查看、修改彼此的文件。

一、查看用户:

打开终端,输入命令:

 

第一列表示打开当前伪终端的用户的用户名(要查看当前登陆用户的用户名,去掉空格直接使用  便可)
第二列的  中  表示伪终端,0表示打开的伪终端序号,第三列则表示当前伪终端的启动时间。。

$ who am i 或者 $ who mom likes

whoamipts/0pts

who 命令其它经常使用参数

参数 说明
-a 打印能打印的所有
-d 打印死掉的进程
-m am i,mom likes
-q 打印当前登陆用户数及用户名
-u 打印当前登陆用户登陆信息
-r 打印运行等级

二、建立用户

在 Linux 系统里, root 帐户拥有整个系统至高无上的权利,好比 新建/添加 用户。建立用户须要 root 权限,这里就要用到 sudo 这个命令了。使用这个命令有两个大前提,一是你要知道当前登陆用户的密码,二是当前用户必须在 sudo 用户组。

新建一个叫 lilei 的用户:

 

这个命令不但能够添加用户到系统,同时也会默认为新用户建立 home 目录:

 

$ ls /home 

 

如今你已经建立好一个用户,而且你可使用你建立的用户登陆了,

使用以下命令切换登陆用户:$ su -l lilei



退出当前用户跟退出终端同样可使用 exit 命令或者使用快捷键 Ctrl+d

 

三、用户组

在 Linux 里面每一个用户都有一个归属(用户组),用户组简单地理解就是一组用户的集合,它们共享一些资源和权限,同时拥有私有资源。

查看本身属于哪些用户组:

方法一、使用groups命令

$ groups shiyanlou 

其中冒号以前表示用户,后面表示该用户所属的用户组。这里能够看到 shiyanlou 用户同时属于 shiyanlou 和 sudo 用户组,每次新建用户若是不指定用户组的话,默认会自动建立一个与用户名相同的用户组。默认状况下在sudo用户组里的可使用sudo命令得到root权限。

方法二、查看/etc/group文件

$ cat /etc/group | sort 

这里 cat 命令用于读取指定文件的内容并打印到终端输出,后面会详细讲它的使用。 | sort 表示将读取的文本进行一个字典排序再输出。

可使用命令过滤掉一些你不想看到的结果:

$ cat /etc/group | grep -E "shiyanlou|sudo"
etc/group 文件格式说明

/etc/group 的内容包括用户组(Group)、用户组口令、GID 及该用户组所包含的用户(User),每一个用户组一条记录。格式以下:

group_name:password:GID:user_list

将其它用户加入 sudo 用户组

默认状况下新建立的用户是不具备 root 权限的,也不在 sudo 用户组,可让其加入sudo用户组从而获取 root 权限。

$ su -l lilei $ sudo ls 

会提示 lilei 不在 sudoers 文件中,意思就是 lilei 不在 sudo 用户组中

使用 usermod 命令能够为用户添加用户组,一样使用该命令你必需有 root 权限,你能够直接使用 root 用户为其它用户添加用户组,或者用其它已经在 sudo 用户组的用户使用 sudo 命令获取权限来执行该命令

这里用 shiyanlou 用户执行 sudo 命令将 lilei 添加到 sudo 用户组,让它也可使用 sudo 命令得到 root 权限

$ su shiyanlou $ groups lilei $ sudo usermod -G sudo lilei $ groups lilei 

而后你再切换会 lilei 用户,如今就可使用 sudo 获取 root 权限了。

删除用户

 

查看文件权限

 ls 命令,用它来列出并显示当前目录下的文件,固然这是在不带任何参数的状况下,它能作的固然不止这么多,如今咱们就要用它来查看文件权限。

使用较长格式列出文件:

$ ls -l



文件类型:设备文件( /dev 目录下有各类设备文件,大都跟具体的硬件设备相关)socket(网络套接字)pipe (管道)

连接文件是分为两种的,软连接文件,“硬连接”。

文件权限:

读权限,表示你可使用 cat <file name> 之类的命令来读取某个文件的内容;写权限,表示你能够编辑和修改某个文件; 执行权限,一般指能够运行的二进制程序文件或者脚本文件。一个目录要同时具备读权限和执行权限才能够打开,而一个目录要有写权限才容许在其中建立其它文件。

至于所属用户组权限,是指你所在的用户组中的全部其它用户对于该文件的权限

连接数:

连接到该文件所在的 inode 结点的文件名数目。

文件大小:

以 inode 结点大小为单位来表示的文件大小,你能够给 ls 加上 -lh 参数来更直观的查看文件的大小。

 

关于 ls 命令的一些其它经常使用的用法:

  • 显示除了 '.'(当前目录),'..' 上一级目录以外的全部包含隐藏文件(Linux 下以 '.' 开头的文件为隐藏文件)
$ ls -A 

能够同时使用 '-A' 和 '-l' 参数:

$ ls -Al 

查看某一个目录的完整属性,而不是显示目录里面的文件属性:

$ ls -dl <目录名> 
  • 显示全部文件大小,并以普通人类能看懂的方式呈现:
$ ls -AsSh 

其中小 s 为显示文件大小,大 S 为按文件大小排序,若须要知道如何按其它方式排序,请使用“man”命令查询。

 

变动文件全部者:

新建一个文件,命名为 “iphone6”,可见文件全部者是 lilei 

使用如下命令变动文件全部者为 shiyanlou :

$ cd /home/lilei $ ls iphone6 $ sudo chown shiyanlou iphone6 $ cp iphone6 /home/shiyanlou 

如今查看,发现 文件全部者成功修改成 shiyanlou :

 

修改文件权限:

方式一:二进制数字表示

每一个文件的三组权限(拥有者,所属用户组,其余用户,记住这个顺序是必定的)就对应这一个 "rwx",也就是一个 '7' ,因此若是我要将文件“iphone6”的权限改成只有我本身能够用那么就这样:

先在文件里加点内容:

$ echo "echo \"hello shiyanlou\"" > iphone6 

而后修改权限:

$ chmod 600 iphone6

方式二:加减赋值操做

完成上述相同的效果,你能够:

$ chmod go-rw iphone6
'g''o'还有'u',分别表示group,others,user,'+','-' 就分别表示增长和去掉相应的权限。

 

做业:添加一个用户loutest,使用sudo建立文件/opt/forloutest,设置成用户loutest能够读写。

首先,建立用户:sudo adduser loutest
而后建立文件:sudo touch /opt/forloutest
接着,将文件全部者改成用户loutest:sudo chown loutest /opt/forloutest
最后,修改文件权限,将权限修改成用户loutest能够读写:chmod 600 /opt/forloutest

 

 

四、Linux 目录结构及文件基本操做

Linux 的目录与 Windows 的目录的区别:一种不一样是体如今目录与存储介质(磁盘,内存,DVD 等)的关系上,Windows 一直是以存储介质为主的,主要以盘符(C 盘,D 盘...)及分区的来实现文件管理,而后之下才是目录,目录就显得不是那么重要,使用一段时间后,磁盘上面的文件目录会显得杂乱无章。

UNIX 是以目录为主的,Linux 也继承了这一优良特性。 Linux 是以树形目录结构的形式来构建整个系统的,能够理解为一个用户可操做系统的骨架。虽然本质上不管是目录结构仍是操做系统内核都是存储在磁盘上的,但从逻辑上来讲 Linux 的磁盘是“挂在”(挂载在)目录上的,每个目录不只能使用本地磁盘分区的文件系统,也可使用网络上的文件系统。

 

一、FHS 标准(英文:Filesystem Hierarchy Standard 中文:文件系统层次结构标准)

 

FHS 定义了系统中每一个区域的用途、所须要的最小构成的文件和目录同时还给出了例外处理与矛盾处理。

FHS 定义了两层规范,第一层是, / 下面的各个目录应该要放什么文件数据,例如 /etc 应该要放置设置文件,/bin 与 /sbin 则应该要放置可执行文件等等。 第二层则是针对 /usr 及 /var 这两个目录的子目录来定义。例如 /var/log 放置系统登陆文件、/usr/share 放置共享数据等等。

 

图片描述

sudo apt-get update

sudo apt-get install tree

$ tree /

 

FHS 是根据以往无数 Linux 用户和开发者的经验总结出来的,而且会维持更新,FHS 依据文件系统使用的频繁与否以及是否容许用户随意改动(注意,不是不能,学习过程当中,不要怕这些),将目录定义为四种交互做用的形态,以下表所示:

图片描述

 

2.目录路径

 

路径

 

使用 cd 命令能够切换目录,在 Linux 里面使用 . 表示当前目录,.. 表示上一级目录, - 表示上一次所在目录,~ 一般表示当前用户的"home"目录。使用 pwd 命令能够获取当前所在路径(绝对路径)。

 

(注意,还记得咱们上一节介绍过的,以 开头的文件都是隐藏文件,因此这两个目录必然也是隐藏的,你可使用 ls -a 命令查看隐藏文件)

 

绝对路径

 

以根"/"目录为起点的完整路径,以你所要到的目录为终点,表现形式如: /usr/local/bin表示根目录下的 usr 目录中的 local 目录中的 bin 目录。

 

相对路径

 

相对路径,也就是相对于你当前的目录的路径,相对路径是以当前目录 . 为起点,以你所要到的目录为终点,表现形式如: usr/local/bin (这里假设你当前目录为根目录)。

下面咱们以你的"home"目录为起点,分别以绝对路径和相对路径的方式进入/usr/local/bin 目录:

 

提示:在进行目录切换的过程当中请多使用 Tab 键自动补全,可避免输入错误,连续按两次Tab能够显示所有候选结果

 

2、Linux 文件的基本操做

 

1.新建

 

新建空白文件

 

使用 touch 命令建立空白文件,关于 touch 命令,其主要是来更改已有文件的时间戳的,但其在不加任何参数的状况下,只指定一个文件名,则能够建立一个为指定文件名的空白文件。

 

建立名为 test 的空白文件,由于在其余目录没有权限,因此须要先 cd ~ 切换回用户的/home/shiyanlou 目录:

$ cd ~ $ touch test

 

新建目录

 

使用 mkdir(make directories)命令能够建立一个空目录,也可同时指定建立目录的权限属性。

 

建立名为"mydir"的空目录:mkdir mydir

 

使用 -p 参数,同时建立父目录(若是不存在该父目录),以下咱们同时建立一个多级目录(这在有时候安装软件,配置安装路径时很是有用):

mkdir -p father/son/grandson

 

 

2.复制

 

复制文件

 

使用cp(copy)命令复制一个文件或目录到指定目录。将以前建立的"test"文件复制到"/home/shiyanlou/father/son/grandson"目录中:

 

cp test father/son/grandson

 

复制目录

 

若是直接使用cp命令,复制一个目录的话,会出现以下错误:

 

图片描述

 

要成功复制目录须要加上-r或者-R参数,表示递归复制。

 

cp -r father family

 

 

3.删除

 

删除文件

 

使用rm(remove files or directories)命令,删除一个文件或目录;

 

例如:rm test

 

有时候你会遇到想要删除一些为只读权限的文件,直接使用rm删除会显示一个提示,

就须要用上参数 -f ,可强制删除

 

例如:rm -f test

 

删除目录

 

跟复制目录同样,要删除一个目录,也须要加上-r或-R参

 

例子:rm -r family

 

 

4.移动文件与文件重命名

 

使用mv(move or rename files)命令,移动文件(剪切)。

 

格式:mv 源目录文件 目的目录

 

例子:将文件"file1"移动到"Documents"目录:mv file1 Documents

 

重命名文件

 

格式:mv 旧的文件名 新的文件名

 

例子:mv file1 myfile

rename命令能够批量重命名

# 使用通配符批量建立 5 个文件

$ touch file{1..5}.txt

# 批量将这 5 个后缀为 .txt 的文本文件重命名为以 .c 为后缀的文件

$ rename 's/\.txt/\.c/' *.txt

# 批量将这 5 个文件,文件名改成大写

$ rename 'y/a-z/A-Z/' *.c

 

 

5.查看文件

 

标准输入输出:当咱们执行一个 shell 命令行时一般会自动打开三个标准文件,即标准输入文件(stdin),默认对应终端的键盘; 标准输出文件(stdout)和标准错误输出文件(stderr),这两个文件都对应被重定向到终端的屏幕,以便咱们能直接看到输出内容。进程将从标准输入文件中获得输入数据,将正常输出数据输出到标准输出文件,而将错误信息送到标准错误文件中。

 

使用cat,tacnl命令查看文件

这两个命令都是用来打印文件内容到标准输出(终端),其中cat为正序显示,tac倒序显示。

好比咱们要查看以前从"/etc"目录下拷贝来的passwd文件:

$ cat passwd

能够加上-n参数显示行号:

$ cat -n passwd

nl命令,添加行号并打印,这是个比cat -n更专业的行号打印命令。

这里简单列举它的经常使用的几个参数:

-b : 指定添加行号的方式,主要有两种:

  -b a:表示不管是否为空行,一样列出行号("cat -n"就是这种方式)

  -b t:只列出非空行的编号并列出(默认为这种方式)

-n : 设置行号的样式,主要有三种:

  -n ln:在行号字段最左端显示

  -n rn:在行号字段最右边显示,且不加 0

  -n rz:在行号字段最右边显示,且加 0

-w : 行号字段占用的位数(默认为 6 位)

使用moreless命令分页查看文件

其中more命令比较简单,只能向一个方向滚动,而"less"为基于"more"和"vi"(一个强大的编辑器,咱们有单独的课程来让你学习)开发,功能更强大。

使用more工具打开passwd文件:

$ more passwd

打开后默认只显示一屏内容,终端底部显示当前阅读的进度(百分比)。可使用Enter键向下滚动一行,使用Space键向下滚动一屏,按下h显示帮助,q退出。

使用headtail命令查看文件

只查看的头几行(默认为10行,不足10行则显示所有)和尾几行。

甚至更直接的只看一行, 加上-n参数,后面紧跟行数:

$ tail -n 1 /etc/passwd

关于tail命令,不得不提的还有它一个很牛的参数-f,这个参数能够实现不停地读取某个文件的内容并显示。

 

 

6.查看文件类型

 

在 Linux 下面文件的类型不是根据文件后缀来判断的,咱们一般使用file命令能够查看文件的类型:

$ file /bin/ls 

这表示这是一个可执行文件,运行在 64 位平台,并使用了动态连接文件(共享库)。

 

 

7.编辑文件

 

在 Linux 下面编辑文件一般咱们会直接使用专门的命令行编辑器好比(emacs,vim,nano)

 

做业:

 

 

五、环境变量与文件查找

所谓变量就是计算机中用于记录一个值(不必定是数值,也能够是字符或字符串)的符号。

变量的做用域即变量的有效范围(好比一个函数中、一个源文件中或者全局范围),在该范围内只能有一个同名变量。一旦离开则该变量无效,如同不存在这个变量通常。

一、变量

 

使用declare命令建立一个变量名为 tmp 的变量:

$ declare tmp

使用=号赋值运算符为变量 tmp 赋值为 shiyanlou:

$ tmp=shiyanlou

读取变量的值,使用echo命令和$符号($符号用于表示引用一个变量的值,初学者常常会忘记输入):

$ echo $tmp

 

关于变量名,并非任何形式的变量名都是可用的,变量名只能是英文字母,数字或者下划线,且不能以数字做为开头。

 

二、环境变量

环境变量就是做用域比自定义变量要大,如Shell 的环境变量做用于自身和它的子进程。在全部的 UNIX 和类 UNIX 系统中,每一个进程都有其各自的环境变量设置,且默认状况下,当一个进程被建立时,处理建立过程当中明确指定的话,它将继承其父进程的绝大部分环境设置。Shell 程序也做为一个进程运行在操做系统之上,而咱们在 Shell中运行的大部分命令都将以 Shell 的子进程的方式运行。

一般咱们会涉及到的环境变量有三种:

  • 当前 Shell 进程私有用户自定义变量,如上面咱们建立的 temp 变量,只在当前 Shell 中有效。
  • Shell 自己内建的变量。
  • 从自定义变量导出的环境变量。

也有三个与上述三种环境变量相关的命令,setenvexport。这三个命令很类似,均可以用于打印相关环境变量,区别在于涉及的是不一样范围的环境变量,详见下表:

命令

说明

set

显示当前 Shell 全部环境变量,包括其内建环境变量(与 Shell 外观等相关),用户自定义变量及导出的环境变量

env

显示与当前用户相关的环境变量,还可让命令在指定环境中运行

export

显示从 Shell 中导出成环境变量的变量,也能经过它将自定义变量导出为环境变量

关于环境变量,能够简单的理解成在当前进程的子进程是否有效,有效则为环境变量,不然不是(有些人也将全部变量统称为环境变量,只是以全局环境变量和局部环境变量进行区分,咱们只要理解它们的实质区别便可)。

为了与普通变量区分,一般咱们习惯将环境变量名设为大写

 

3.命令的查找路径与顺序

 咱们在 Shell 中输入一个命令,Shell 是怎么知道在哪去找到这个命令而后执行的呢?这是经过环境变量PATH来进行搜索的

查看PATH环境变量的内容:

$ echo $PATH 

默认状况下你会看到以下输出:

/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games

建立一个 Shell 脚本文件:

$ vim hello_shell.sh

在脚本中添加以下内容,保存并退出(注意不要省掉第一行,这不是注释,论坛有用户反应会有语法错误,就是由于没有了第一行):

#!/bin/zsh for ((i=0; i<10; i++));do echo "hello shell" done exit 0

文件添加可执行权限

$ chmod 755 hello_shell.sh 

执行脚本

$ ./hello_shell.sh 

建立一个 C 语言"hello world"程序:

$ vim hello_world.c 
#include <stdio.h> int main(void) { printf("hello world!\n"); return 0; } 

使用 gcc 生成可执行文件:

$ gcc -o hello_world hello_world.c 

gcc 生成二进制文件默认具备可执行权限,不须要修改

在 shiyanlou 家目录建立一个mybin目录,并将上述 hello_shell.sh 和 hello_world 文件移动到其中:

$ mkdir mybin $ mv hello_shell.sh hello_world mybin/ 

如今你能够在mybin目录中分别运行你刚刚建立的两个程序:

$ cd mybin $ ./hello_shell.sh $ ./hello_world


4.添加自定义路径到“PATH”环境变量

PATH里面的路径是以做为分割符,因此咱们能够这样添加自定义路径:

$ PATH=$PATH:/home/shiyanlou/mybin 

注意这里必定要使用绝对路径

给 PATH 环境变量追加了一个路径,它也只是在当前 Shell 有效,我一旦退出终端,再打开就会发现又失效了。

让它自动执行:在每一个用户的 home 目录中有一个 Shell 每次启动时会默认执行一个配置脚本,以初始化环境,包括添加一些用户自定义环境变量等等。zsh 的配置文件是.zshrc,相应 Bash 的配置文件为.bashrc。它们在etc下还都有一个或多个全局的配置文件,不过咱们通常只修改用户目录下的配置文件。

咱们能够简单的使用下面命令直接添加内容到.zshrc中:

$ echo "PATH=$PATH:/home/shiyanlou/mybin" >> .zshrc 

上述命令中>>表示将标准输出以追加的方式重定向到一个文件中,注意前面用到的>是以覆盖的方式重定向到一个文件中,使用的时候必定要注意分辨。在指定文件不存在的状况下都会建立新的文件。

 

5.修改和删除已有变量

变量修改

变量的修改有如下几种方式:

变量设置方式 说明
${变量名#匹配字串} 从头向后开始匹配,删除符合匹配字串的最短数据
${变量名##匹配字串} 从头向后开始匹配,删除符合匹配字串的最长数据
${变量名%匹配字串} 从尾向前开始匹配,删除符合匹配字串的最短数据
${变量名%%匹配字串} 从尾向前开始匹配,删除符合匹配字串的最长数据
${变量名/旧的字串/新的字串} 将符合旧字串的第一个字串替换为新的字串
${变量名//旧的字串/新的字串} 将符合旧字串的所有字串替换为新的字串

变量删除

可使用unset命令删除一个环境变量:

$ unset temp

6.如何让环境变量当即生效

在上面咱们在 Shell 中修改了一个配置脚本文件以后,每次都要退出终端从新打开甚至重启主机以后其才能生效,咱们可使用source命令来让其当即生效,如:

$ source .zshrc 

source命令还有一个别名就是.,注意与表示当前路径的那个点区分开,虽然形式同样,但做用和使用方式同样,上面的命令若是替换成.的方式就该是

$ . ./.zshrc 

注意第一个点后面有一个空格,并且后面的文件必须指定完整的绝对或相对路径名,source 则不须要。

2、搜索文件

与搜索相关的命令经常使用的有以下几个whereis,which,find,locate

whereis简单快速

$whereis who 

locate快而全

$ locate /etc/sh

注意,它不仅是在 etc 目录下查找并会自动递归子目录进行查找

查找 /usr/share/ 下全部 jpg 文件:

$ locate /usr/share/\*.jpg

注意要添加*号前面的反斜杠转义,不然会没法找到

若是想只统计数目能够加上-c参数,-i参数能够忽略大小写进行查找,whereis 的-b,-m-s一样能够是使用。

which小而精

which自己是 Shell 内建的一个命令,咱们一般使用which来肯定是否安装了某个指定的软件,由于它只从PATH环境变量指定的路径中去搜索命令:

$ which man

find精而细

find应该是这几个命令中最强大的了,它不但能够经过文件类型、文件名进行查找并且能够根据文件的属性(如文件的时间戳,文件的权限等)进行搜索。find命令强大到,要把它将明白至少须要单独好几节课程才行,咱们这里只介绍一些经常使用的内容。

在指定目录下搜索指定文件名的文件:

注意 find 命令的路径是做为第一个参数的, 基本命令格式为 find [path] [option] [action]$ find /etc/ -name interfaces

与时间相关的命令参数:

参数 说明
-atime 最后访问时间
-ctime 建立时间
-mtime 最后修改时间

下面以-mtime参数举例:

  • -mtime n: n 为数字,表示为在n天以前的”一天以内“修改过的文件
  • -mtime +n: 列出在n天以前(不包含n天自己)被修改过的文件
  • -mtime -n: 列出在n天以前(包含n天自己)被修改过的文件
  • newer file: file为一个已存在的文件,列出比file还要新的文件名

列出 home 目录中,当天(24 小时以内)有改动的文件:

$ find ~ -mtime 0

列出用户家目录下比Code文件夹新的文件:

$ find ~ -newer /home/shiyanlou/Code

做业:
数字雨




六、文件打包与解压缩

常见经常使用的压缩包文件格式。在 Windows 上咱们最多见的不外乎这三种*.zip,*.rar,*.7z后缀的压缩文件,而在 Linux 上面常见经常使用的除了以上这三种外,还有*.gz,*.xz,*.bz2,*.tar,*.tar.gz,*.tar.xz,*tar.bz2,简单介绍以下:

 
文件后缀名 说明
*.zip zip程序打包压缩的文件
*.rar rar程序压缩的文件
*.7z 7zip程序压缩的文件
*.tar tar程序打包,未压缩的文件
*.gz gzip程序(GNU zip)压缩的文件
*.xz xz程序压缩的文件
*.bz2 bzip2程序压缩的文件
*.tar.gz tar打包,gzip程序压缩的文件
*.tar.xz tar打包,xz程序压缩的文件
*tar.bz2 tar打包,bzip2程序压缩的文件
*.tar.7z tar打包,7z程序压缩的文件

zip压缩打包程序

  使用zip打包文件夹:

  $ zip -r -q -o shiyanlou.zip /home/shiyanlou

  $ du -h shiyanlou.zip

  $ file shiyanlou.zip

  

  1. 上面命令将 shiyanlou 的 home 目录打包成一个文件,并查看了打包后文件的大小和类型。第一行命令中,-r参数表示递归打包包含子目录的所有内容,-q参数表示为安静模式,即不向屏幕输出信息,-o,表示输出文件,需在其后紧跟打包输出文件名。后面使用du命令查看打包后文件的大小(后面会具体说明该命令)。

    • 设置压缩级别为9和1(9最大,1最小),从新打包:
    $ zip -r -9 -q -o shiyanlou_9.zip /home/shiyanlou -x ~/*.zip $ zip -r -1 -q -o shiyanlou_1.zip /home/shiyanlou -x ~/*.zip 

    这里添加了一个参数用于设置压缩级别-[1-9],1表示最快压缩但体积大,9表示体积最小但耗时最久。最后那个-x是为了排除咱们上一次建立的 zip 文件,不然又会被打包进这一次的压缩文件中,注意:这里只能使用绝对路径,不然不起做用

    咱们再用du命令分别查看默认压缩级别、最低、最高压缩级别及未压缩的文件的大小:

    $ du -h -d 0 *.zip ~ | sort
  2. 经过man 手册可知:

    • h, --human-readable(顾名思义,你能够试试不加的状况)

    • d, --max-depth(所查看文件的深度)

     

    默认压缩级别应该是最高的,效果很明显,不过你在环境中操做以后看到的大小可能跟图上的有些不一样,由于在你使用过程当中,会随时还生成一些缓存文件在当前用户的家目录中。

    • 建立加密zip包

    使用-e参数能够建立加密压缩包:

    $ zip -r -e -o shiyanlou_encryption.zip /home/shiyanlou
  3. 注意: 关于zip命令,由于 Windows 系统与 Linux/Unix 在文本文件格式上的一些兼容问题,好比换行符(为不可见字符),在 Windows 为 CR+LF(Carriage-Return+Line-Feed:回车加换行),而在 Linux/Unix 上为 LF(换行),因此若是在不加处理的状况下,在 Linux 上编辑的文本,在 Windows 系统上打开可能看起来是没有换行的。若是你想让你在 Linux 建立的 zip 压缩文件在 Windows 上解压后没有任何问题,那么你还须要对命令作一些修改:

    $ zip -r -l -o shiyanlou.zip /home/shiyanlou 

    须要加上-l参数将LF转换为CR+LF来达到以上目的。

  4. 解压zip包

  5. 使用unzip命令:unzip XX.zip
  6. 将文件解压到指定目录: unzip -q xx.zip
    -d 目录名
  7. 不解压仅仅查看: unzip -l xx.zip
  8. windows中文采用GBK编码,LINUX相爱用UTF-8,解决解压的兼容问题,解压是指定采用编码类型:
    unzip -O GBK 中文压缩文件.zip
  9. rar打包压缩命令

  10. rar压缩命令: rar命令没有参数-
    参数a:rar a xx.rar 添加一个目录~到xx.rar
    参数d:rar d xx.rar 文件名 从xx.rar删除文件
    l:rar l xx.rar 查看不解压
  11. unrar解压命令 x:unrar x xx.rar 全路径解压
    e:unrar e xx.rar 目录 解压到指定目录

    tar打包工具

    -c:建立一个tar包文件
    -f:指定建立的文件名
    -v:非安静模式
    tar -cf shiyanlou.tar ~
    -x:解压一个tar
    -C:解压到指定路径的已存在目录
    tar -xf xx.tar -C 目录
    -t:只查看不解包
    tar -tf xx.rar
    -p:保存文件属性
    -h保存设备链接指向的源文件
    tar -cphf xx.tar 要压缩目录
    -z:.tar.gz
    -J:tar.xz
    -j:tar.bz2

    做业:

 

七、文件系统操做与磁盘管理

1、简单文件系统操做

 

1.查看磁盘和目录的容量

 

使用 df 命令查看磁盘的容量

 

$ df 

 

在实验楼的环境中你将看到以下的输出内容:

 

 

但在实际的物理主机上会更像这样:

 

 

通常使用状况下,咱们更多只是关心第一行的内容也就是环境中的rootfs或者物理主机上的/dev/sda2

 

物理主机上的 /dev/sda2 是对应着主机硬盘的分区,后面的数字表示分区号,数字前面的字母 a 表示第几块硬盘(也多是可移动磁盘),你若是主机上有多块硬盘则可能还会出现 /dev/sdb,/dev/sdc 这些磁盘设备都会在 /dev 目录下以文件的存在形式。

 

接着你还会看到"1k-blocks"这个陌生的东西,它表示以磁盘块大小的方式显示容量,后面为相应的以块大小表示的已用和可用容量,在你了解 Linux 的文件系统以前这个就先无论吧,咱们以一种你应该看得懂的方式展现:

 

$ df -h 

 

 

使用 du 命令查看目录的容量

 

# 默认一样以 blocks 的大小展现 $ du # 加上`-h`参数,以更易读的方式展现 $ du -h 

 

-d参数指定查看目录的深度

 

# 只查看1级目录的信息 $ du -h -d 0 ~ # 查看2级 $ du -h -d 1 ~ 

 

 

du(estimate file space usage)命令与df(report file system disk space usage)只用一字只差,首先就但愿注意不要弄混淆了,以能够像我这样从man手册中获取命令的完整描述,记全称就不会搞混了。

 

 

 

2、简单的磁盘管理

1.建立虚拟磁盘

dd 命令简介

dd命令用于转换和复制文件,不过它的复制不一样于cp。以前提到过关于 Linux 的很重要的一点,一切即文件,在 Linux 上,硬件的设备驱动(如硬盘)和特殊设备文件(如/dev/zero/dev/random)都像普通文件同样,只要在各自的驱动程序中实现了对应的功能,dd 也能够读取自和/或写入到这些文件。这样,dd也能够用在备份硬件的引导扇区、获取必定数量的随机数据或者空数据等任务中。dd程序也能够在复制时处理数据,例如转换字节序、或在 ASCII 与 EBCDIC 编码间互换。

dd的命令行语句与其余的 Linux 程序不一样,由于它的命令行选项格式为选项=值,而不是更标准的--选项 值-选项=值dd默认从标准输入中读取,并写入到标准输出中,但能够用选项if(input file,输入文件)和of(output file,输出文件)改变。

dd命令从标准输入读入用户输入到标准输出或者一个文件:

# 输出到文件 $ dd of=test bs=10 count=1 # 或者 dd if=/dev/stdin of=test bs=10 count=1 # 输出到标准输出 $ dd if=/dev/stdin of=/dev/stdout bs=10 count=1 

上述命令从标准输入设备读入用户输入(缺省值,因此可省略)而后输出到 test 文件,bs(block size)用于指定块大小(缺省单位为 Byte,也可为其指定如'K','M','G'等单位),count用于指定块数量。如上图所示,我指定只读取总共 10 个字节的数据,当我输入了“hello shiyanlou”以后加上空格回车总共 16 个字节(一个英文字符占一个字节)内容,显然超过了设定大小。使用和ducat命令看到的写入完成文件实际内容确实只有 10 个字节(那个黑底百分号表示这里没有换行符),而其余的多余输入将被截取并保留在标准输入。

前面说到dd在拷贝的同时还能够实现数据转换,那下面就举一个简单的例子:将输出的英文字符转换为大写再写入文件:

$ dd if=/dev/stdin of=test bs=10 count=1 conv=ucase 

使用 dd 命令建立虚拟镜像文件

/dev/zero设备建立一个容量为 256M 的空文件:

$ dd if=/dev/zero of=virtual.img bs=1M count=256 $ du -h virtual.img 

将这个文件格式化(写入文件系统):

使用 mkfs 命令格式化磁盘(咱们这里是本身建立的虚拟磁盘镜像)

你能够在命令行输入 mkfs 而后按下Tab键,你能够看到不少个以 mkfs 为前缀的命令,这些不一样的后缀其实就是表示着不一样的文件系统,能够用 mkfs 格式化成的文件系统:

能够简单的使用下面的命令来将咱们的虚拟磁盘镜像格式化为ext4文件系统:

$ mkfs.ext4 virtual.img 

能够看到实际 mkfs.ext4 是使用 mke2fs 来完成格式化工做的。mke2fs 的参数不少,不过咱们也不会常常格式化磁盘来玩,因此就掌握这基本用法

使用 mount 命令挂载磁盘到目录树

用户在 Linux/UNIX 的机器上打开一个文件之前,包含该文件的文件系统必须先进行挂载的动做,此时用户要对该文件系统执行 mount 的指令以进行挂载。

Linux/UNIX 命令行的 mount 指令是告诉操做系统,对应的文件系统已经准备好,可使用了,而该文件系统会对应到一个特定的点(称为挂载点)。

使用mount来查看下主机已经挂载的文件系统:

$ sudo mount 

输出的结果中每一行表示一个设备或虚拟设备,每一行最前面是设备名,而后是 on 后面是挂载点,type 后面表示文件系统类型,再后面是挂载选项

mount命令的通常格式以下:mount [options] [source] [directory]

一些经常使用操做:

mount [-o [操做选项]] [-t 文件系统类型] [-w|--rw|--ro] [文件系统源] [挂载点] 

直接来挂载咱们建立的虚拟磁盘镜像到/mnt目录:

$ mount -o loop -t ext4 virtual.img /mnt # 也能够省略挂载类型,不少时候 mount 会自动识别 # 以只读方式挂载 $ mount -o loop --ro virtual.img /mnt # 或者mount -o loop,ro virtual.img /mnt 

使用 umount 命令卸载已挂载磁盘

# 命令格式 sudo umount 已挂载设备名或者挂载点,如: $ sudo umount /mnt 

因为咱们环境的问题(环境中使用的 Linux 内核在编译时没有添加对 Loop device的支持),因此你将没法挂载成功:

在类 UNIX 系统中,/dev/loop(或称vnd (vnode disk)、lofi(循环文件接口))是一种伪设备,这种设备使得文件能够如同块设备通常被访问。

在使用以前,循环设备必须与现存文件系统上的文件相关联。这种关联将提供给用户一个应用程序接口,接口将容许文件视为块特殊文件(参见设备文件系统)使用。所以,若是文件中包含一个完整的文件系统,那么这个文件就能如同磁盘设备通常被挂载。

这种设备文件常常被用于光盘或是磁盘镜像。经过循环挂载来挂载包含文件系统的文件,便使处在这个文件系统中的文件得以被访问。这些文件将出如今挂载点目录。若是挂载目录中自己有文件,这些文件在挂载后将被禁止使用。

使用 fdisk 为磁盘分区

一样由于环境缘由中没有物理磁盘,也没法建立虚拟磁盘的缘由咱们就没法实验练习使用该命令了,下面将以物理主机为例讲解如何为磁盘分区。

# 查看硬盘分区表信息 $ sudo fdisk -l 

输出结果中开头显示了我主机上的磁盘的一些信息,包括容量扇区数,扇区大小,I/O 大小等信息。

咱们重点开一下中间的分区信息,/dev/sda1,/dev/sda2 为主分区分别安装了 Windows 和 Linux 操做系统,/dev/sda3 为交换分区(能够理解为虚拟内存),/dev/sda4 为扩展分区其中包含 /dev/sda5,/dev/sda6,/dev/sda7,/dev/sda8 四个逻辑分区,由于主机上有几个分区之间有空隙,没有对齐边界扇区,因此分区之间的不是彻底连续的。

# 进入磁盘分区模式 $ sudo fdisk virtual.img 

在进行操做前咱们首先应先规划好咱们的分区方案,这里我将在使用 128M(可用 127M 左右)的虚拟磁盘镜像建立一个 30M 的主分区剩余部分为扩展分区包含 2 个大约 45M 的逻辑分区。

操做完成后输入p查看结果以下:

最后不要忘记输入w写入分区表。

使用 losetup 命令创建镜像与回环设备的关联

$ sudo losetup /dev/loop0 virtual.img # 若是提示设备忙你也可使用其它的回环设备,"ls /dev/loop*"参看全部回环设备 # 解除设备关联 $ sudo losetup -d /dev/loop0 

而后再使用mkfs格式化各分区(前面咱们是格式化整个虚拟磁盘镜像文件或磁盘),不过格式化以前,咱们还要为各分区创建虚拟设备的映射,用到kpartx工具,须要先安装:

$ sudo apt-get install kpartx $ sudo kpart kpartx -av /dev/loop0 # 取消映射 $ sudo kpart kpartx -dv /dev/loop0 

接着再是格式化,咱们将其所有格式化为 ext4:

$ sudo mkfs.ext4 -q /dev/mapper/loop0p1 $ sudo mkfs.ext4 -q /dev/mapper/loop0p5 $ sudo mkfs.ext4 -q /dev/mapper/loop0p6 

格式化完成后在/media目录下新建四个空目录用于挂载虚拟磁盘:

$ mkdir -p /media/virtualdisk_{1..3} 
# 挂载磁盘分区 $ sudo mount /dev/mapper/loop0p1 /media/virtualdisk_1 $ sudo mount /dev/mapper/loop0p5 /media/virtualdisk_2 $ sudo mount /dev/mapper/loop0p6 /media/virtualdisk_3 # 卸载磁盘分区 $ sudo umount /dev/mapper/loop0p1 $ sudo umount /dev/mapper/loop0p5 $ sudo umount /dev/mapper/loop0p6 

而后:$ df -h

做业:

 

八、命令执行顺序控制与管道

1、命令执行顺序的控制

1.顺序执行多条命令

一般状况下,每次只能在终端输入一条命令,按下回车执行,执行完成后,再输入第二条命令,而后再按回车执行…… 

想要一次性输入完,让它本身去一次执行各命令

简单的顺序执行你可使用;来完成,好比上述操做你能够:

$ sudo apt-get update;sudo apt-get install some-tool;some-tool # 让它本身运行

2.有选择的执行命令

关于上面的操做,前面的命令执行不成功,然后面的命令又依赖与上一条命令的结果,那么就会形成花了时间,最终却获得一个错误的结果,并且有时候直观的看你还没法判断结果是否正确。那么咱们须要可以有选择性的来执行命令,好比上一条命令执行成功才继续下一条,或者不成功又该作出其它什么处理,好比咱们使用which来查找是否安装某个命令,若是找到就执行该命令,不然什么也不作

$ which cowsay>/dev/null && cowsay -f head-in ohch~ 

你若是没有安装cowsay,你能够先执行一次上述命令,你会发现什么也没发生,你再安装好以后你再执行一次上述命令,你也会发现一些惊喜。

上面的&&就是用来实现选择性执行的,它表示若是前面的命令执行结果(不是表示终端输出的内容,而是表示命令执行状态的结果)返回0则执行后面的,不然不执行

一样 Shell 也有一个||,它们的区别就在于,shell中的这两个符号除了也可用于表示逻辑与和或以外,就是能够实现这里的命令执行顺序的简单控制。||在这里就是与&&相反的控制效果,当上一条命令执行结果为≠0($?≠0)时则执行它后面的命令:

$ which cowsay>/dev/null || echo "cowsay has not been install, please run 'sudo apt-get install cowsay' to install" 

除了上述基本的使用以外,咱们还能够结合这&&||来实现一些操做,好比:

$ which cowsay>/dev/null && echo "exist" || echo "not exist"

我画个流程图来解释一下上面的流程:

2、管道

管道是一种通讯机制,一般用于进程间的通讯(也可经过socket进行网络通讯),它表现出来的形式就是将前面每个进程的输出(stdout)直接做为下一个进程的输入(stdin)。

管道又分为匿名管道和具名管道。咱们在使用一些过滤程序时常常会用到的就是匿名管道,在命令行中由|分隔符表示,具名管道简单的说就是有名字的管道,一般只会在源程序中用到具名管道。

1.试用

查看/etc目录下有哪些文件和目录,使用ls命令来查看:$ ls -al /etc

有太多内容,屏幕不能彻底显示,这时候可使用滚动条或快捷键滚动窗口来查看。不过这时候可使用管道:$ ls -al /etc | less

经过管道将前一个命令(ls)的输出做为下一个命令(less)的输入,而后就能够一行一行地看。

2.cut 命令,打印每一行的某一字段

打印/etc/passwd文件中以:为分隔符的第1个字段和第6个字段分别表示用户名和其家目录:

$ cut /etc/passwd -d ':' -f 1,6 

打印/etc/passwd文件中每一行的前N个字符:

# 前五个(包含第五个) $ cut /etc/passwd -c -5 # 前五个以后的(包含第五个) $ cut /etc/passwd -c 5- # 第五个 $ cut /etc/passwd -c 5 # 2到5之间的(包含第五个) $ cut /etc/passwd -c 2-5 

3.grep 命令,在文本中或 stdin 中查找匹配字符串

grep命令是很强大的,也是至关经常使用的一个命令,它结合正则表达式能够实现很复杂却很高效的匹配和查找,不过在学习正则表达式以前,这里介绍它简单的使用

grep命令的通常形式为:grep [命令选项]... 用于匹配的表达式 [文件]...

咱们搜索/home/shiyanlou目录下全部包含"shiyanlou"的全部文本文件,并显示出如今文本中的行号:

$ grep -rnI "shiyanlou" ~ 

-r 参数表示递归搜索子目录中的文件,-n表示打印匹配项行号,-I表示忽略二进制文件。这个操做实际没有多大意义,但能够感觉到grep命令的强大与实用。

固然也能够在匹配字段中使用正则表达式,下面简单的演示:

# 查看环境变量中以"yanlou"结尾的字符串 $ export | grep ".*yanlou$" 

其中$就表示一行的末尾。

4. wc 命令,简单小巧的计数工具

wc 命令用于统计并输出一个文件中行、单词和字节的数目,好比输出/etc/passwd文件的统计信息:

$ wc /etc/passwd 

分别只输出行数、单词数、字节数、字符数和输入文本中最长一行的字节数:

# 行数 $ wc -l /etc/passwd # 单词数 $ wc -w /etc/passwd # 字节数 $ wc -c /etc/passwd # 字符数 $ wc -m /etc/passwd # 最长行字节数 $ wc -L /etc/passwd 

注意:对于西文字符来讲,一个字符就是一个字节,但对于中文字符一个汉字是大于2个字节的,具体数目是由字符编码决定的

再来结合管道来操做一下,下面统计 /etc 下面全部目录数:$ ls -dl /etc/*/ | wc -l

5.sort 排序命令

功能很简单就是将输入按照必定方式排序,而后再输出,它支持的排序有按字典排序,数字排序,按月份排序,随机排序,反转排序,指定特定字段进行排序等等。

默认为字典排序:

$ cat /etc/passswd | sort 

反转排序:

$ cat /etc/passwd | sort -r 

按特定字段排序:

$ cat /etc/passwd | sort -t':' -k 3 

上面的-t参数用于指定字段的分隔符,这里是以":"做为分隔符;-k 字段号用于指定对哪个字段进行排序。这里/etc/passwd文件的第三个字段为数字,默认状况下是一字典序排序的,若是要按照数字排序就要加上-n参数:

$ cat /etc/passwd | sort -t':' -k 3 -n 

6. uniq 去重命令

uniq命令能够用于过滤或者输出重复行。

  • 过滤重复行

咱们可使用history命令查看最近执行过的命令,不过你可能只想查看使用了那个命令而不须要知道具体干了什么,那么你可能就会要想去掉命令后面的参数而后去掉重复的命令:

$ history | cut -c 8- | cut -d ' ' -f 1 | uniq 

而后通过层层过滤,你会发现确是只输出了执行的命令那一列,不过去重效果好像不明显,仔细看你会发现它趋势去重了,只是不那么明显,之因此不明显是由于uniq命令只能去连续重复的行,不是全文去重,因此要达到预期效果,咱们先排序:

$ history | cut -c 8- | cut -d ' ' -f 1 | sort | uniq # 或者$ history | cut -c 8- | cut -d ' ' -f 1 | sort -u
  • 输出重复行

# 输出重复过的行(重复的只输出一个)及重复次数

$ history | cut -c 8- | cut -d ' ' -f 1 | sort | uniq -dc

# 输出全部重复的行

$ history | cut -c 8- | cut -d ' ' -f 1 | sort | uniq -D

做业:

 

九、简单的文本处理

文本处理命令

1.tr 命令

tr 命令能够用来删除一段文本信息中的某些文字。或者将其进行转换。

使用方式:tr [option]...SET1 [SET2]

经常使用的选项有:

选项 说明
-d 删除和set1匹配的字符,注意不是全词匹配也不是按字符顺序匹配
-s 去除set1指定的在输入文本中连续并重复的字符

操做举例:

# 删除 "hello shiyanlou" 中全部的'o','l','h' $ echo 'hello shiyanlou' | tr -d 'olh' # 将"hello" 中的ll,去重为一个l $ echo 'hello' | tr -s 'l' # 将输入文本,所有转换为大写或小写输出 $ cat /etc/passwd | tr '[:lower:]' '[:upper:]' # 上面的'[:lower:]' '[:upper:]'你也能够简单的写做'[a-z]' '[A-Z]',固然反过来将大写变小写也是能够的 

2.col 命令

col 命令能够将Tab换成对等数量的空格建,或反转这个操做。

使用方式:

col [option] 

经常使用的选项有:

选项 说明
-x Tab转换为空格
-h 将空格转换为Tab(默认选项)

操做举例:

# 查看 /etc/protocols 中的不可见字符,能够看到不少 ^I ,这其实就是 Tab 转义成可见字符的符号 $ cat -A /etc/protocols # 使用 col -x 将 /etc/protocols 中的 Tab 转换为空格,而后再使用 cat 查看,你发现 ^I 不见了 $ cat /etc/protocols | col -x | cat -A 

3.join命令

用于将两个文件中包含相同内容的那一行合并在一块儿。

使用方式:

join [option]... file1 file2 

经常使用的选项有:

选项 说明
-t 指定分隔符,默认为空格
-i 忽略大小写的差别
-1 指明第一个文件要用哪一个字段来对比,,默认对比第一个字段
-2 指明第二个文件要用哪一个字段来对比,,默认对比第一个字段

操做举例:

# 建立两个文件 $ echo '1 hello' > file1 $ echo '1 shiyanlou' > file2 $ join file1 file2 # 将/etc/passwd与/etc/shadow两个文件合并,指定以':'做为分隔符 $ sudo join -t':' /etc/passwd /etc/shadow # 将/etc/passwd与/etc/group两个文件合并,指定以':'做为分隔符, 分别比对第4和第3个字段 $ sudo join -t':' -1 4 /etc/passwd -2 3 /etc/group 

4.paste命令

paste这个命令与join 命令相似,它是在不对比数据的状况下,简单地将多个文件合并一块儿,以Tab隔开。

使用方式:

paste [option] file... 

经常使用的选项有:

选项 说明
-d 指定合并的分隔符,默认为Tab
-s 不合并到一行,每一个文件为一行

操做举例:

$ echo hello > file1 $ echo shiyanlou > file2 $ echo www.shiyanlou.com > file3 $ paste -d ':' file1 file2 file3 $ paste -s file1 file2 file3 

 

做业:

1.

#从dos 到unix文本格式转换

$ cat -A [dos] | tr -d '^M' | cat -A [dos]

2.

 

十、数据流重定向

1、数据流重定向

下面咱们简单的回顾一下咱们前面常常用到的两个重定向操做:

固然前面没有用到的和操做也是没有问题的,如你理解的同样,它们的区别在于重定向的方向不一致而已,表示是从左到右,右到左。$ echo 'hello shiyanlou' > redirect $ echo 'www.shiyanlou.com' >> redirect $ cat redirect

<<<><

1.简单的重定向

Linux 默认提供了三个特殊设备,用于终端的显示和输出,分别为stdin(标准输入,对应于你在终端的输入),stdout(标准输出,对应于终端的输出),stderr(标准错误输出,对应于终端的输出)。

文件描述符 设备文件 说明
0 /dev/stdin 标准输入
1 /dev/stdout 标准输出
2 /dev/stderr 标准错误

文件描述符:文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向内核为每个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者建立一个新文件时,内核向进程返回一个文件描述符。在程序设计中,一些涉及底层的程序编写每每会围绕着文件描述符展开。可是文件描述符这一律念每每只适用于 UNIX、Linux 这样的操做系统。

默认使用终端的标准输入做为命令的输入和标准输出做为命令的输出

$ cat (按Ctrl+C退出) 

将cat的连续输出(heredoc方式)重定向到一个文件

$ mkdir Documents
$ cat > Documents/test.c\~ <<EOF
#include <stdio.h> int main() { printf("hello world\n"); return 0; } EOF 

将一个文件做为命令的输入,标准输出做为命令的输出

$ cat Documents/test.c\~ 

将echo命令经过管道传过来的数据做为cat命令的输入,将标准输出做为命令的输出

$ echo 'hi' | cat 

将echo命令的输出从默认的标准输出重定向到一个普通文件

$ echo 'hello shiyanlou' > redirect $ cat redirect 

注意不要将管道和重定向混淆,管道默认是链接前一个命令的输出到下一个命令的输入,而重定向一般是须要一个文件来创建两个命令的链接

2.标准错误重定向

标准输出和标准错误都被指向伪终端的屏幕显示

# 使用cat 命令同时读取两个文件,其中一个存在,另外一个不存在 $ cat Documents/test.c\~ hello.c # 你能够看到除了正确输出了前一个文件的内容,还在末尾出现了一条错误信息 # 下面咱们将输出重定向到一个文件,根据咱们前面的经验,这里将在看不到任何输出了 $ cat Documents/test.c\~ hello.c > somefile 

标准输出和标准错误虽然都指向终端屏幕,实际它们并不同。

那有的时候咱们就是要能够隐藏某些错误或者警告:

# 将标准错误重定向到标准输出,再将标准输出重定向到文件,注意要将重定向到文件写到前面 $ cat Documents/test.c\~ hello.c >somefile 2>&1 # 或者只用bash提供的特殊的重定向符号"&"将标准错误和标准输出同时重定向到文件 $ cat Documents/test.c\~ hello.c &>somefilehell 

注意你应该在输出重定向文件描述符前加上&,不然shell会当作重定向到一个文件名为1的文件中

3.使用tee命令同时重定向到多个文件

常常你可能还有这样的需求,除了将须要将输出重定向到文件以外也须要将信息打印在终端,那么你可使用tee命令来实现:

$ echo 'hello shiyanlou' | tee hello

4.永久重定向

使用exec命令实现“永久”重定向。exec命令的做用是使用指定的命令替换当前的 Shell,及使用一个进程替换当前进程,或者指定新的重定向:

# 先开启一个子 Shell $ zsh # 使用exec替换当前进程的重定向,将标准输出重定向到一个文件 $ exec 1>somefile # 后面你执行的命令的输出都将被重定向到文件中,直到你退出当前子shell,或取消exec的重定向(后面将告诉你怎么作) $ ls $ exit $ cat somefile 

5.建立输出文件描述符

默认在 Shell 中能够有9个打开的文件描述符,上面咱们使用了也是它默认提供的0,1,2号文件描述符,另外咱们还可使用3-8的文件描述符,只是它们默认没有打开而已,你可使用下面命令查看当前 Shell 进程中打开的文件描述符:

$ cd /dev/fd/;ls -Al 

一样使用exec命令能够建立新的文件描述符:

$ zsh $ exec 3>somefile # 先进入目录,再查看,不然你可能不能获得正确的结果,而后再回到上一次的目录 $ cd /dev/fd/;ls -Al;cd - # 注意下面的命令>与&之间不该该有空格,若是有空格则会出错 $ echo "this is test" >&3 $ cat somefile $ exit 

6.关闭文件描述符

如上面咱们打开的3号文件描述符,可使用以下操做将它关闭:

$ exec 3>&- $ cd /dev/fd;ls -Al;cd - 

7.彻底屏蔽命令的输出

在 Linux 中有一个被成为“黑洞”的设备文件,因此导入它的数据都将被“吞噬”。

在类 UNIX 系统中,/dev/null,或称空设备,是一个特殊的设备文件,它一般被用于丢弃不须要的输出流,或做为用于输入流的空文件,这些操做一般由重定向完成。读取它则会当即获得一个EOF。

咱们能够利用设个/dev/null屏蔽命令的输出:

$ cat Documents/test.c\~ nefile 1>/dev/null 2>&1 

向上面这样的操做将使你得不到任何输出结果。

8.使用 xargs 分割参数列表

xargs 是一条 UNIX 和类 UNIX 操做系统的经常使用命令。它的做用是将参数列表转换成小块分段传递给其余命令,以免参数列表过长的问题。

这个命令在有些时候十分有用,特别是当用来处理产生大量输出结果的命令如 find,locate 和 grep 的结果。

$ cut -d: -f1 < /etc/passwd | sort | xargs echo 

上面这个命令用于将/etc/passwd文件按:分割取第一个字段排序后,使用echo命令生成一个列表。

做业:

 

十一、正则表达式基础

 

正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为 regex、regexp 或 RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在不少文本编辑器里,正则表达式一般被用来检索、替换那些符合某个模式的文本。

许多程序设计语言都支持利用正则表达式进行字符串操做。例如,在 Perl 中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由 UNIX 中的工具软件(例如sedgrep)普及开的。正则表达式一般缩写成“regex”,单数有 regexp、regex,复数有 regexps、regexes、regexen。

 

简单的说形式和功能上正则表达式和咱们前面讲的通配符很像,不过它们之间又有很大差异,特别在于一些特殊的匹配字符的含义上,但愿注意不要将二者弄混淆。

2.基本语法:

一个正则表达式一般被称为一个模式(pattern),为用来描述或者匹配一系列符合某个句法规则的字符串。

选择

|竖直分隔符表示选择,例如"boy|girl"能够匹配"boy"或者"girl"

数量限定

数量限定除了咱们举例用的*,还有+加号,?问号,.点号,若是在一个模式中不加数量限定符则表示出现一次且仅出现一次:

  • +表示前面的字符必须出现至少一次(1次或屡次),例如,"goo+gle",能够匹配"gooogle","goooogle"等;
  • ?表示前面的字符最多出现一次(0次或1次),例如,"colou?r",能够匹配"color"或者"colour";
  • *星号表明前面的字符能够不出现,也能够出现一次或者屡次(0次、或1次、或屡次),例如,“0*42”能够匹配4二、04二、004二、00042等。

范围和优先级

()圆括号能够用来定义模式字符串的范围和优先级,这能够简单的理解为是否将括号内的模式串做为一个总体。例如,"gr(a|e)y"等价于"gray|grey",(这里体现了优先级,竖直分隔符用于选择a或者e而不是gra和ey),"(grand)?father"匹配father和grandfather(这里体验了范围,?将圆括号内容做为一个总体匹配)。

语法(部分)

正则表达式有多种不一样的风格,下面列举一些经常使用的做为 PCRE 子集的适用于perlpython编程语言及grepegrep的正则表达式匹配规则:(因为markdown表格解析的问题,下面的竖直分隔符用全角字符代替,实际使用时请换回半角字符)

PCRE(Perl Compatible Regular Expressions中文含义:perl语言兼容正则表达式)是一个用 C 语言编写的正则表达式函数库,由菲利普.海泽(Philip Hazel)编写。PCRE是一个轻量级的函数库,比Boost 之类的正则表达式库小得多。PCRE 十分易用,同时功能也很强大,性能超过了 POSIX 正则表达式库和一些经典的正则表达式库。

字符 描述
\ 将下一个字符标记为一个特殊字符、或一个原义字符。例如,“n”匹配字符“n”。“\n”匹配一个换行符。序列“\\”匹配“\”而“\(”则匹配“(”。
^ 匹配输入字符串的开始位置。
$ 匹配输入字符串的结束位置。
{n} n是一个非负整数。匹配肯定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,可是能匹配“food”中的两个o。
{n,} n是一个非负整数。至少匹配n次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的全部o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*”。
{n,m} m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}”将匹配“fooooood”中的前三个o。“o{0,1}”等价于“o?”。请注意在逗号和两个数之间不能有空格。
* 匹配前面的子表达式零次或屡次。例如,zo*能匹配“z”、“zo”以及“zoo”。*等价于{0,}。
+ 匹配前面的子表达式一次或屡次。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。
? 匹配前面的子表达式零次或一次。例如,“do(es)?”能够匹配“do”或“does”中的“do”。?等价于{0,1}。
? 当该字符紧跟在任何一个其余限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽量少的匹配所搜索的字符串,而默认的贪婪模式则尽量多的匹配所搜索的字符串。例如,对于字符串“oooo”,“o+?”将匹配单个“o”,而“o+”将匹配全部“o”。
. 匹配除“\n”以外的任何单个字符。要匹配包括“\n”在内的任何字符,请使用像“(.|\n)”的模式。
(pattern) 匹配pattern并获取这一匹配的子字符串。该子字符串用于向后引用。要匹配圆括号字符,请使用“\(”或“\)”。
x|y 匹配x或y。例如,“z|food”能匹配“z”或“food”。“(z|f)ood”则匹配“zood”或“food”。
[xyz] 字符集合(character class)。匹配所包含的任意一个字符。例如,“[abc]”能够匹配“plain”中的“a”。其中特殊字符仅有反斜线\保持特殊含义,用于转义字符。其它特殊字符如星号、加号、各类括号等均做为普通字符。脱字符^若是出如今首位则表示负值字符集合;若是出如今字符串中间就仅做为普通字符。连字符 - 若是出如今字符串中间表示字符范围描述;若是若是出如今首位则仅做为普通字符。
[^xyz] 排除型(negate)字符集合。匹配未列出的任意字符。例如,“[^abc]”能够匹配“plain”中的“plin”。
[a-z] 字符范围。匹配指定范围内的任意字符。例如,“[a-z]”能够匹配“a”到“z”范围内的任意小写字母字符。
[^a-z] 排除型的字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]”能够匹配任何不在“a”到“z”范围内的任意字符。

优先级

优先级为从上到下从左到右,依次下降:

运算符 说明
\ 转义符
(), (?:), (?=), [] 括号和中括号
*、+、?、{n}、{n,}、{n,m} 限定符
^、$、\任何元字符 定位点和序列
 选择

 

regex的思导图:

 

1.基本操做

grep命令用于打印输出文本中匹配的模式串,它使用正则表达式做为模式匹配的条件。grep支持三种正则表达式引擎,分别用三个参数指定:

参数 说明
-E POSIX扩展正则表达式,ERE
-G POSIX基本正则表达式,BRE
-P Perl正则表达式,PCRE

在经过grep命令使用正则表达式以前,先介绍一下它的经常使用参数:

参数 说明
-b 将二进制文件做为文原本进行匹配
-c 统计以模式匹配的数目
-i 忽略大小写
-n 显示匹配文本所在行的行号
-v 反选,输出不匹配行的内容
-r 递归匹配查找
-A n n为正整数,表示after的意思,除了列出匹配行以外,还列出后面的n行
-B n n为正整数,表示before的意思,除了列出匹配行以外,还列出前面的n行
--color=auto

将输出中的匹配项设置为自动颜色显示

注:在大多数发行版中是默认设置了grep的颜色的,你能够经过参数指定或修改GREP_COLOR环境变量。

2.使用正则表达式

使用基本正则表达式,BRE

位置

查找/etc/group文件中以"shiyanlou"为开头的行

$ grep 'shiyanlou' /etc/group $ grep '^shiyanlou' /etc/group

数量

# 将匹配以'z'开头以'o'结尾的全部字符串 $ echo 'zero\nzo\nzoo' | grep 'z.*o' # 将匹配以'z'开头以'o'结尾,中间包含一个任意字符的字符串 $ echo 'zero\nzo\nzoo' | grep 'z.o' # 将匹配以'z'开头,以任意多个'o'结尾的字符串 $ echo 'zero\nzo\nzoo' | grep 'zo*' 

注意:其中\n为换行符




  • 选择
# grep默认是区分大小写的,这里将匹配全部的小写字母 $ echo '1234\nabcd' | grep '[a-z]' # 将匹配全部的数字 $ echo '1234\nabcd' | grep '[0-9]' # 将匹配全部的数字 $ echo '1234\nabcd' | grep '[[:digit:]]' # 将匹配全部的小写字母 $ echo '1234\nabcd' | grep '[[:lower:]]' # 将匹配全部的大写字母 $ echo '1234\nabcd' | grep '[[:upper:]]' # 将匹配全部的字母和数字,包括0-9,a-z,A-Z $ echo '1234\nabcd' | grep '[[:alnum:]]' # 将匹配全部的字母 $ echo '1234\nabcd' | grep '[[:alpha:]]' 

下面包含完整的特殊符号及说明:

特殊符号 说明
[:alnum:] 表明英文大小写字节及数字,亦即 0-9, A-Z, a-z
[:alpha:] 表明任何英文大小写字节,亦即 A-Z, a-z
[:blank:] 表明空白键与 [Tab] 按键二者
[:cntrl:] 表明键盘上面的控制按键,亦即包括 CR, LF, Tab, Del.. 等等
[:digit:] 表明数字而已,亦即 0-9
[:graph:] 除了空白字节 (空白键与 [Tab] 按键) 外的其余全部按键
[:lower:] 表明小写字节,亦即 a-z
[:print:] 表明任何能够被列印出来的字节
[:punct:] 表明标点符号 (punctuation symbol),亦即:" ' ? ! ; : # $...
[:upper:] 表明大写字节,亦即 A-Z
[:space:] 任何会产生空白的字节,包括空白键, [Tab], CR 等等
[:xdigit:] 表明 16 进位的数字类型,所以包括: 0-9, A-F, a-f 的数字与字节

注意:之因此要使用特殊符号,是由于上面的[a-z]不是在全部状况下都管用,这还与主机当前的语系有关,即设置在LANG环境变量的值,zh_CN.UTF-8的话[a-z],即为全部小写字母,其它语系多是大小写交替的如,"a A b B...z Z",[a-z]中就可能包含大写字母。因此在使用[a-z]时请确保当前语系的影响,使用[:lower:]则不会有这个问题。

# 排除字符 $ echo 'geek|good' | grep '[^o]' 

注意:^放到中括号内为排除字符,不然表示行首。

使用扩展正则表达式,ERE

要经过grep使用扩展正则表达式须要加上-E参数,或使用egrep

  • 数量
# 只匹配"zo" $ echo 'zero\nzo\nzoo' | grep -E 'zo{1}' # 匹配以"zo"开头的全部单词 $ echo 'zero\nzo\nzoo' | grep -E 'zo{1,}' 

注意:推荐掌握{n,m}便可,+,?,*,这几个不太直观,且容易弄混淆。

  • 选择
注意:由于号有特殊含义,因此须要转义。# 匹配"www.shiyanlou.com"和"www.google.com" $ echo 'www.shiyanlou.com\nwww.baidu.com\nwww.google.com' | grep -E 'www\.(shiyanlou|google)\.com' # 或者匹配不包含"baidu"的内容 $ echo 'www.shiyanlou.com\nwww.baidu.com\nwww.google.com' | grep -Ev 'www\.baidu\.com'

.

3、sed 流编辑器

sed工具用于过滤和转换文本的流编辑器。它是一个非交互式的编辑器,下面咱们就开始介绍sed这个编辑器。

sed经常使用参数介绍

sed 命令基本格式:

sed [参数]... [执行命令] [输入文件]...
# 形如: $ sed -i '1s/sad/happy/' test # 表示将test文件中第一行的"sad"替换为"happy" 
参数 说明
-n 安静模式,只打印受影响的行,默认打印输入数据的所有内容
-e 用于在脚本中添加多个执行命令一次执行,在命令行中执行多个命令一般不须要加该参数
-f filename 指定执行filename文件中的命令
-r 使用扩展正则表达式,默认为标准正则表达式
-i 将直接修改输入文件内容,而不是打印到标准输出设备

sed编辑器的执行命令(这里”执行“解释为名词)

sed执行命令格式:

[n1][,n2]command [n1][~step]command # 其中一些命令能够在后面加上做用范围,形如: $ sed -i 's/sad/happy/g' test # g表示全局范围 $ sed -i 's/sad/happy/4' test # 4表示指定行中的第四个匹配字符串 

其中n1,n2表示输入内容的行号,它们之间为,逗号则表示从n1到n2行,若是为波浪号则表示从n1开始以step为步进的全部行;command为执行动做,下面为一些经常使用动做指令:

命令 说明
s 行内替换
c 整行替换
a 插入到指定行的后面
i 插入到指定行的前面
p 打印指定行,一般与-n参数配合使用
d 删除指定行

sed操做举例

咱们先找一个用于练习的文本文件:

$ cp /etc/passwd ~ 

打印指定行

# 打印2-5行 $ nl passwd | sed -n '2,5p' # 打印奇数行 $ nl passwd | sed -n '1~2p' 

行内替换

注意: 行内替换能够结合正则表达式使用。# 将输入文本中"shiyanlou" 全局替换为"hehe",并只打印替换的那一行,注意这里不能省略最后的"p"命令 $ sed -n 's/shiyanlou/hehe/gp' passwd

行间替换

$ nl passwd | grep "shiyanlou" # 删除第21行 $ sed -n '21c\www.shiyanlou.com' passwd 

4、awk文本处理语言

1.awk介绍

AWK是一种优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎之一.其名称得自于它的创始人Alfred Aho(阿尔佛雷德·艾侯)、Peter Jay Weinberger(彼得·温伯格)和Brian Wilson Kernighan(布莱恩·柯林汉)姓氏的首个字母.AWK程序设计语言,三位建立者已将它正式定义为“样式扫描和处理语言”。它容许您建立简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其余的功能。最简单地说,AWK是一种用于处理文本的编程语言工具。

在大多数linux发行版上面,实际咱们使用的是gawk(GNU awk,awk的GNU版本),在咱们的环境中ubuntu上,默认提供的是mawk,不过咱们一般能够直接使用awk命令(awk语言的解释器),由于系统已经为咱们建立好了awk指向mawk的符号连接。

$ ll /usr/bin/awk 

2.awk的一些基础概念

awk全部的操做都是基于pattern(模式)—action(动做)对来完成的,以下面的形式:

$ pattern {action} 

它将全部的动做操做用一对{}花括号包围起来。其中pattern一般是是表示用于匹配输入的文本的“关系式”或“正则表达式”,action则是表示匹配后将执行的动做。在一个完整awk操做中,这二者能够只有其中一个,若是没有pattern则默认匹配输入的所有文本,若是没有action则默认为打印匹配内容到屏幕。

awk处理文本的方式,是将文本分割成一些“字段”,而后再对这些字段进行处理,默认状况下,awk以空格做为一个字段的分割符,不过这不是固定了,你能够任意指定分隔符,下面将告诉你如何作到这一点。

3.awk命令基本格式

awk [-F fs] [-v var=value] [-f prog-file | 'program text'] [file...] 

其中-F参数用于预先指定前面提到的字段分隔符(还有其余指定字段的方式) ,-v用于预先为awk程序指定变量,-f参数用于指定awk命令要执行的程序文件,或者在不加-f参数的状况下直接将程序语句放在这里,最后为awk须要处理的文本输入,且能够同时输入多个文本文件。如今咱们仍是直接来具体体验一下吧。

4.awk操做体验

先用vim新建一个文本文档

$ vim test 

包含以下内容:

I like linux www.shiyanlou.com 
  • 使用awk将文本内容打印到终端
# "quote>" 不用输入 $ awk '{ > print > }' test # 或者写到一行 $ awk '{print}' test
  • 将test的第一行的每一个字段单独显示为一行
$ awk '{ > if(NR==1){ > print $1 "\n" $2 "\n" $3 > } else { > print} > }' test # 或者 $ awk '{ > if(NR==1){ > OFS="\n" > print $1, $2, $3 > } else { > print} > }' test
  • 将test的第二行的以点为分段的字段换成以空格为分隔
$ awk -F'.' '{ > if(NR==2){ > print $1 "\t" $2 "\t" $3 > }}' test # 或者 $ awk ' > BEGIN{ > FS="." > OFS="\t" # 若是写为一行,两个动做语句之间应该以";"号分开 > }{ > if(NR==2){ > print $1, $2, $3 > }}' test

说明:这里的-F参数,前面已经介绍过,它是用来预先指定待处理记录的字段分隔符。咱们须要注意的是除了指定OFS咱们还能够在print 语句中直接打印特殊符号如这里的\tprint打印的非变量内容都须要用""一对引号包围起来。上面另外一个版本,展现了实现预先指定变量分隔符的另外一种方式,即便用BEGIN,就这个表达式指示了,其后的动做将在全部动做以前执行,这里是FS赋值了新的"."点号代替默认的" "空格

6.awk经常使用的内置变量

变量名 说明
FILENAME 当前输入文件名,如有多个文件,则只表示第一个。若是输入是来自标准输入,则为空字符串
$0 当前记录的内容
$N N表示字段号,最大值为NF变量的值
FS 字段分隔符,由正则表达式表示,默认为" "空格
RS 输入记录分隔符,默认为"\n",即一行为一个记录
NF 当前记录字段数
NR 已经读入的记录数
FNR 当前输入文件的记录数,请注意它与NR的区别
OFS 输出字段分隔符,默认为" "空格
ORS 输出记录分隔符,默认为"\n"

做业:

一、练习其余几个命令动做的使用。

二、

 

十二、Linux 下软件安装

1、Linux 上的软件安装

一般 Linux 上的软件安装主要有三种方式:

  • 在线安装
  • 从磁盘安装deb软件包
  • 从二进制软件包安装
  • 从源代码编译安装

2、在线安装

在不一样的linux发行版上面在线安装方式会有一些差别包括使用的命令及它们的包管理工具,由于咱们的开发环境是基于ubuntu的,因此这里咱们涉及的在线安装方式将只适用于ubuntu发行版,或其它基于ubuntu的发行版如国内的ubuntukylin(优麒麟),ubuntu又是基于debian的发行版,它使用的是debian的包管理工具dpkg,因此一些操做也适用与debian。而在其它一些采用其它包管理工具的发行版如redhat,centos,fedora等将不适用(redhat和centos使用rpm)

1. 先体验一下

安装一个软件,名字叫作 w3m(w3m是一个命令行的简易网页浏览器),那么输入以下命令:

$ sudo apt-get install w3m

咱们来看看命令执行后的效果:

$ w3m www.shiyanlou.com/faq

注意:若是你在安装一个软件以后,没法当即使用Tab键补全这可命令,你能够尝试先执行source ~/.zshrc,而后你就可使用补全操做。

2. apt 包管理工具介绍

APT是Advance Packaging Tool(高级包装工具)的缩写,是Debian及其派生发行版的软件包管理器,APT能够自动下载,配置,安装二进制或者源代码格式的软件包,所以简化了Unix系统上管理软件的过程。APT最先被设计成dpkg的前端,用来处理deb格式的软件包。如今通过APT-RPM组织修改,APT已经能够安装在支持RPM的系统管理RPM包。这个包管理器包含以 apt- 开头的的多个工具,如 apt-get apt-cache apt-cdrom 等,在Debian系列的发行版中使用。

当你在执行安装操做时,首先apt-get 工具会在本地的一个数据库中搜索关于 w3m 软件的相关信息,并根据这些信息在相关的服务器上下载软件安装

  • 软件源镜像服务器
  • 软件源

咱们须要按期从服务器上下载一个软件包列表,使用 sudo apt-get update 命令来保持本地的软件包列表是最新的(有时你也须要手动执行这个操做,好比更换了软件源),而这个表里会有软件依赖信息的记录,对于软件依赖,我举个例子:咱们安装 w3m 软件的时候,而这个软件须要 libgc1c2 这个软件包才能正常工做,这个时候 apt-get 在安装软件的时候会一并替咱们安装了,以保证 w3m 能正常的工做。

3.apt-get

apt-get使用各用于处理apt包的公用程序集,咱们能够用它来在线安装、卸载和升级软件包等,下面列出一些apt-get包含的经常使用的一些工具:

工具 说明
install 其后加上软件包名,用于安装一个软件包
update 从软件源镜像服务器上下载/更新用于更新本地软件源的软件包列表
upgrade 升级本地可更新的所有软件包,但存在依赖问题时将不会升级,一般会在更新以前执行一次update
dist-upgrade 解决依赖关系并升级(存在必定危险性)
remove 移除已安装的软件包,包括与被移除软件包有依赖关系的软件包,但不包含软件包的配置文件
autoremove 移除以前被其余软件包依赖,但如今再也不被使用的软件包
purge 与remove相同,但会彻底移除软件包,包含其配置文件
clean 移除下载到本地的已经安装的软件包,默认保存在/var/cache/apt/archives/
autoclean 移除已安装的软件的旧版本软件包

下面是一些apt-get经常使用的参数:

参数 说明
-y 自动回应是否安装软件包的选项,在一些自动化安装脚本中使用这个参数将十分有用
-s 模拟安装
-q 静默安装方式,指定多个q或者-q=#,#表示数字,用于设定静默级别,这在你不想要在安装软件包时屏幕输出过多时颇有用
-f 修复损坏的依赖关系
-d 只下载不安装
--reinstall 从新安装已经安装但可能存在问题的软件包
--install-suggests 同时安装APT给出的建议安装的软件包

4.安装软件包

关于安装,如前面演示的同样你只须要执行apt-get install <软件包名>便可

可使用以下方式从新安装:

$ sudo apt-get --reinstall install w3m 

在不知道软件包完整名的时候进行安装。一般是使用Tab键补全软件包名,有时候须要同时安装多个软件包,还可使用正则表达式匹配软件包名进行批量安装。

5.软件升级

# 更新软件源 $ sudo apt-get update # 升级没有依赖问题的软件包 $ sudo apt-get upgrade # 升级并解决依赖关系 $ sudo apt-get dist-upgrade 

6.卸载软件

卸载是一个命令加回车 sudo apt-get remove w3m 

或者,你能够执行

# 不保留配置文件的移除 $ sudo apt-get purge w3m # 或者 sudo apt-get --purge remove # 移除再也不须要的被依赖的软件包 $ sudo apt-get autoremove

7.软件搜索

sudo apt-cache search softname1 softname2 softname3…… 

apt-cache 命令则是针对本地数据进行相关操做的工具,search 顾名思义在本地的数据库中寻找有关 softname1 softname2 …… 相关软件的信息。

如今咱们试试搜索一下以前咱们安装的软件 w3m ,如图:

结果显示了4个 w3m 相关的软件,而且有相关软件的简介。

3、使用 dpkg 从本地磁盘安装 deb 软件包

1.dpkg 介绍

dpkg 是 Debian 软件包管理器的基础,它被伊恩·默多克建立于 1993 年。dpkg 与 RPM 十分类似,一样被用于安装、卸载和供给和 .deb 软件包相关的信息。

dpkg 自己是一个底层的工具。上层的工具,像是 APT,被用于从远程获取软件包以及处理复杂的软件包关系。"dpkg"是"Debian Package"的简写。

咱们常常能够在网络上简单以deb形式打包的软件包,就须要使用dpkg命令来安装。

dpkg经常使用参数介绍:

参数 说明
-i 安装指定deb包
-R 后面加上目录名,用于安装该目录下的全部deb安装包
-r remove,移除某个已安装的软件包
-I 显示deb包文件的信息
-s 显示已安装软件的信息
-S 搜索已安装的软件包
-L 显示已安装软件包的目录信息

2.使用dpkg安装deb软件包

咱们先使用apt-get加上-d参数只下载不安装,下载emacs编辑器的deb包,下载完成后,咱们能够查看/var/cache/apt/archives/目录下的内容,以下图:

而后咱们将第一个deb拷贝到home目录下,并使用dpkg安装

$ cp /var/cache/apt/archives/emacs24_24.3+1-4ubuntu1_amd64.deb ~ # 安装以前参看deb包的信息 $ sudo dpkg -I emacs24_24.3+1-4ubuntu1_amd64.deb 

如你所见,这个包还额外依赖了一些软件包,这意味着,若是主机目前没有这些被依赖的软件包,直接使用dpkg安装可能会存在一些问题,由于dpkg并不能为你解决依赖关系。

# 使用dpkg安装 $ sudo dpkg -i emacs24_24.3+1-4ubuntu1_amd64.deb

咱们将如何解决这个错误了,这就要用到apt-get了,使用它的-f参数了,修复依赖关系的安装

$ sudo apt-get -f install

3.查看已安装软件包的安装目录

使用dpkg -L查看deb包目录信息

$ sudo dpkg -L emacs 

4、从二进制包安装

二进制包的安装比较简单,咱们须要作的只是将从网络上下载的二进制包解压后放到合适的目录,而后将包含可执行的主程序文件的目录添加进PATH环境变量便可。

做业:

相关文章
相关标签/搜索