文本处理工具 -wc、cut、sort、uniq的用法及参数

文本处理工具 -wc,cut,sort,uniq
  wc:word count 统计文本文件中的字符个数
    用法:wc filename
    行数 字符个数 文件大小(字节) 文件名
    -l 行数
    -w 字符个数
    -c 文件大小(字节)

  cut:用来作文件分割
    默认使用 空格 作文件分隔
    -d 指定分隔符(delimiter)
    -d[ :] //不能够这样写,cut的局限性:一、-d指定分隔符,不能同时指定多个。二、不能作高级的格式化输出,因此须要熟练的掌握awk
    -f 指定提取那一列
    -f1 输出第一列
    -f1-3 输出1到3列
    -f1,3 输出第一列和第三列
    --output-delimiter=‘xx’ 将输出的分隔符,替换为本身想用的分隔符
工具

  sort:排序,根据ASCLL码排序
    -n 按数字大小排序
    -r 逆序
    -f 忽略字符大小写
    -t 指定分隔符
    -k 指定第几段进行排序
    -u 排序去重复spa

 

  uniq:去重,连续且重复的命令才视为重复排序

    建议先排序后去重
    -d 显示重复的行
    -c 统计某些字符重复的次数
    sort FINENAME | uniq -c
it

相关文章
相关标签/搜索