Linux文本处理命令

做为一名 Linux 研发人员,几乎天天都要面对文本处理场景。 所以 掌握文本处理套路熟练运用文本处理命令 ,对于 提高工做效率 意义重大。html

原文地址:learn-linux.readthedocs.io
QQ交流群:玩转Linux,群号:278378501
欢迎关注咱们的公众号:小菜学编程 (coding-fan)python

本文以一个实战例子抛砖引玉,介绍如何运用 grepawksedcut 等命令进行文本处理, 以 快速 完成本来很繁琐的操做。linux

背景

笔者开发机上有不少 Docker 镜像,如今须要删除名为 none 的那些:golang

$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
<none>              <none>              f0fa889be9e8        2 days ago          956MB
<none>              <none>              257954316455        2 days ago          956MB
<none>              <none>              99739acbfe7a        2 days ago          956MB
<none>              <none>              52b10754a70c        2 days ago          956MB
<none>              <none>              86878eefdd39        2 days ago          956MB
golang              1.10                0a19f4d16598        12 days ago         729MB
python              3                   1e80caffd59e        12 days ago         923MB
复制代码

如何操做呢?莫非手工一个个删除么?docker

$ docker image rm f0fa889be9e8
复制代码

试想,若是有上百个这样的镜像待删,要搞到何年何月!但如何改进呢?shell

文本过滤

考虑先把名字为 none 的镜像从结果中过滤出来, grep 命令便可搞定:编程

$ docker images | grep none
<none>              <none>              f0fa889be9e8        2 days ago          956MB
<none>              <none>              257954316455        2 days ago          956MB
<none>              <none>              99739acbfe7a        2 days ago          956MB
<none>              <none>              52b10754a70c        2 days ago          956MB
<none>              <none>              86878eefdd39        2 days ago          956MB
复制代码

字段提取

接着,将容器 ID 一列提取出来,这对 awk 来讲简直是小儿科:api

$ docker images | grep none | awk '{print $3}'
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39
复制代码

固然了,经过 cut 命令进行 字段切分 也能够获得相同的结果。 因为 cut 只能按单个字符进行切分,而原文本中的空格为多个,所以须要先进行 文本替换bash

文本替换

文本替换是 sed 命令擅长的事,下面将一个或多个空格替换成一个:微信

$ docker images | grep none | sed 's/ */ /g'
<none> <none> f0fa889be9e8 2 days ago 956MB
<none> <none> 257954316455 2 days ago 956MB
<none> <none> 99739acbfe7a 2 days ago 956MB
<none> <none> 52b10754a70c 2 days ago 956MB
<none> <none> 86878eefdd39 2 days ago 956MB
复制代码

文本切分

接下来,使用 cut 命令对结果进行进一步切分并取出第三个字段:

$ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39
复制代码

不错,咱们获得与运用 awk 命令相同的结果。

批量删除

接下来,经过 xargs 批量删除镜像:

$ docker images | grep none | awk '{print $3}' | xargs docker image rm
Deleted: sha256:f0fa889be9e8f8369353a32e8cec17e9333cbeb581de5f78bf6875917d971bc9
Deleted: sha256:d301d0546b29b7daa55d29f29d9253664870fd83465aefe8b92ff6a7048d5612
...
复制代码

在这个例子中, xargs 最终将执行如下命令:

$ docker image rm f0fa889be9e8 257954316455 99739acbfe7a 52b10754a70c 86878eefdd39
复制代码

看到没有,全部不想要的镜像都删除干净了,并且只须要进行一次操做:

$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
golang              1.10                0a19f4d16598        12 days ago         729MB
python              3                   1e80caffd59e        12 days ago         923MB
复制代码

下面这个操做也是等价的:

$ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3 | xargs docker image rm
复制代码

订阅更新,获取更多学习资料,请关注咱们的 微信公众号 :

小菜学编程
相关文章
相关标签/搜索