文本处理工具详解

1、cat命令shell

    cat:文件查看
vim

    格式:cat [OPTION]...[FILE]..
centos

    OPTION:
bash

        -E:显示行结束符$;
less

        -n: 对显示出的每一行进行编号;ide

        -A:显示全部控制符;centos7

        -b:非空行编号;spa

        -s:压缩连续的空行成一行;3d

        -T显示制表符;
日志

    tac:逆向显示文件内容,与cat命令相反;

    rev:行文件内容逆向显示;


            eg1:显示全部控制符

                wKiom1mJX-fCO_8MAAAlpw965Nc540.png-wh_50

            eg2:显示制表符

                wKioL1mJYMeTd9gHAAAhIZI-hYI344.png-wh_50

            eg3:显示行号

                wKiom1mJYS6jkU3SAAAtlhTuE-8181.png-wh_50

            eg4:压缩空行成一行

                wKiom1mJYmqSuRftAABNCSmkmGw884.png-wh_50

            eg5:非空行编号

                wKiom1mJYsGjkz0lAAArGb4EDCQ661.png-wh_50

            eg6:tac:逆向显示文件内容

                wKioL1mJY9fx6JGFAAAyx0pZqbM896.png-wh_50

            eg7:逆向显示行文件内容

                wKiom1mJZCqDPsSgAAAzuev59CA166.png-wh_50

                

2、more命令

    more:分页查看文件内容

    格式:more [OPTIONS...] [FILE]...

    OPTIONS:

        -d:显示翻页及退出提示;

3、less命令

    less:分页查看文件内容

        查看时有用的命令包括:

            /文本:搜索文本

            n:向下匹配

            N:向上匹配

4、head命令

    head:显示文本前几行内容(默认显示前10行)

    格式:head [OPTION]... [FILE]...

    OPTION:

        -c #: 指定获取前#字节

        -n #: 指定获取前#行

        -#: 指定行数

5、tail命令

    tail:显示文本后几行内容(默认显示后10行)

    格式:tail [OPTION]... [FILE]...

    OPTION:

        -c #: 指定获取后#字节

        -n #: 指定获取后#行

        -#:指定行数

        -f: 跟踪显示文件新追加的内容,经常使用日志监控         

            eg:tail -n0 -f filename &:后台运行,既能查看内容又能作别的事

6、cut命令

    cut:按列切割文本内容

    格式:cut [OPTION]... [FILE]...

    OPTION:

        -d DELIMITER: 指明分隔符,默认tab

        -f FILEDS:

            #: 第#个字段

            #,#[,#]:离散的多个字段,例如1,3,6

            #-#:连续的多个字段, 例如1-6 混合使用:1-3,7

        -c 按字符切割

        --output-delimiter=STRING指定输出分隔符       

              eg1:
                [root@centos7 testdir]# cut -d: -f1 /etc/passwd
                    ##以冒号作分隔符,取文件第一列,也就是用户名;
                    
            eg2:
                [root@centos7 testdir]# cut -d: -f1,3 /etc/passwd
                    ##以冒号作分隔符,取文件第1、第三列,我就是用户名和UID;
                    
            eg3:
                [root@centos7 testdir]# cut -d: -f1,3,5-7 /etc/passwd
                    ###以冒号作分隔符,取用户名、UID和shell类型;

            eg4:

                wKioL1mJdgWzl8Q_AAA6zr4vhXc619.png-wh_50

            eg5:

                wKiom1mJdr7CKX0IAABICKexy0I034.png-wh_50

7、paste命令

    paste:合并两个文件同行号的列到一行

    格式:paste [OPTION]... [FILE]...

    OPTION:

        -d 分隔符:指定分隔符,默认用TAB

        -s : 全部行合成一行显示

            paste f1 f2

            paste -s f1 f2


            eg1:

                wKiom1mJgHuQxzRZAABg1-p7FZs407.png-wh_50

            eg2:

                wKiom1mJgO6RPhxqAAAnm2i7G8k949.png-wh_50

            eg3:

                wKioL1mJgUmBliw1AAAlDY_7ID8150.png-wh_50

8、wc命令

    wc:字符统计(默认显示行数、单词数、字节数)

    格式:wc [OPTION]... [FILE]...

    OPTION:

        -l:统计行数

        -w:统计单词个数

        -c:统计字节总数

        -m:统计字符总数

9、sort命令

    sort:文本排序(不改变原始文件)

    格式:sort [OPTION] file

    OPTION:

        -r 执行反方向(由上至下)整理 

        -n 执行按数字大小整理 

        -f 选项忽略(fold)字符串中的字符大小写

        -u 选项(独特,unique)删除输出中的重复行

        -t  c选项使用c作为字段界定符

        -k  X选项按照使用c字符分隔的X列来整理可以使用屡次           

             eg1:
                [root@centos7 testdir]# sort -t: -k 3 -n /etc/passwd
                    ##以冒号作分隔符,取第三列按数字大小进行正向排序
                    
            eg2:
                [root@centos7 testdir]# sort -t: -k 3 -nr /etc/passwd
                    ##以冒号作分隔符,取第三列按数字大小进行逆向排序

10、uniq命令

    uniq命令:从输入中删除重复先后相接的行 

    格式:uniq [OPTION]... [FILE]...

    OPTION:

        -c: 显示每行重复出现的次数

        -d: 仅显示重复过的行

        -u: 仅显示未曾重复的行

        注:连续且彻底相同方为重复 

   常和sort 命令一块儿配合使用:sort  userlist.txt  |  uniq-c


            eg1(vim /uniq.txt)

                wKiom1mJjtnT-zP-AAAXEjYsHUI085.png-wh_50

            

            eg2:uniq命令什么选项都不加,仅显示连续重复的行一次

                wKioL1mJjxLRDvXTAAAojUAmSjQ352.png-wh_50


            eg3:显示每行重复出现的次数

                wKiom1mJj5vDRQfMAAArjzbs8i0634.png-wh_50


            eg4:仅显示重复过的行

                wKioL1mJj8ywoHSQAAAfE66pveA304.png-wh_50


            eg5:仅显示未曾重复过的行

                wKioL1mJkEOgE-VGAAAk6NLuang963.png-wh_50                

11、比较文件

    diff:比较两个文件之间的区别 

    patch:向文件打补丁

        -b:自动备份改变了的文件

       diff foo.conf-broken foo.conf-works
         5c5
        < use_widgets = no
        --
        > use_widgets = yes 
        注明第5行有区别(改变)

            eg1:

                wKioL1mJiQKwB776AAA-cq1KyvQ611.png-wh_50

            eg2:使用 -u 选项来输出“统一的(unified)”diff格式文件,最适用于补丁文件。

                wKiom1mJiUGzF6jsAABqgzwc08g580.png-wh_50

            eg3:打补丁;删除f2文件,使用patch来恢复f2文件,-b自动备份改变了的文件(f1),执行以后f2文件就恢复了,可是文件名不叫f2,而是f1;而原来的f1文件更名叫f1.orig;

                wKioL1mJi1Xwmk3zAAB8dF4xKbQ725.png-wh_50

相关文章
相关标签/搜索