LInux 分割合并文件

有两种方式,linux

第一种使用dd命令网络

第二种使用split日志

 

dd命令是linux下一个很是有用的磁盘命令。它能够将指定大小的块拷贝成一个文件,并在拷贝的同时执行指定的转换。
UNIX已经提供了文件切割功能,能完成这个功能的UNIX命令就是DD。 
要切割的大文件为DGJD,共98336321字节,则: 
dd if=dgjd of=zz1 bs=1 count=20000000 
dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000 
dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000 
dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000 
dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000 

其中IF(INPUT FILENAME)是要切割的大文件名,OF(OUTPUT FILENAME)是切割后的子文件名,BS是指明以多少字节做为一个切割记录单位,COUNT是要切割的单位记录数,SKIP是说明切割时的起点,单位一样以BS设定值为准。经过上述五条指令就将DGJD大文件切割成为4个2千万字节、1个18336321字节的子文件。要注意的是SKIP的值不能错。 由此 
也不难看出,DD切割是“非损耗”式的切割,而且支持从任意位置开始的任意大小的切割。 

要将生成的ZZ一、ZZ二、ZZ三、ZZ4四个子文件组装为XDGJD,则: 
dd if=zz1 of=xdgjd bs=1 count=20000000 
dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000 
dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000 
dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000 
dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000 

其中SKIP参数改成SEEK参数,指明组装的新大文件XDGJD每次的开始位置是从文件头开始多少字节。若是缺省,则组装从文件头开始,显然这不是咱们每次都但愿的, 因此需用SEEK参数明确指出开始位置。经过以上5个指令,便可将5个子文件从新组装为一个大文件。将切割后生成的子文件从新用FTP传送,结果有的可以顺利传送, 有的仍然致使网络瘫痪,不怕,继续切割,切成每一个一千万字节,再传,OK!成功传送! ip

 

 

 

1、关于it

    在linux下,切割和合并文件可使用split和cat命令来实现。日志分析

 

2、文件切割
        文件切割模式分为两种:文本文件和二进制模式。
    一、文本模式
            文本模式只适用于文本文件,用这种模式切割后的每一个文件都是可读的。文本模式又分为两种:按最大文件大小切割和按文本行数切割。
        1)按文件大小切割二进制

                split -C 50k log.log splog方法

            将文本文件log.log按每块最大50k的大小进行切割,不打碎行。输出文件名相似splogaa, splogab…… 
        2)按文本行数切割文件

                split -l 100 log.log splogco

            每一个分块100行,不考虑大小。日志分析时应该有用。
    二、二进制模式

                split -b 50k log.log splog

        每一个分块(固然,最后一个不保证)大小都是50k,基本不可读。任何类型文件均可以用这种切割模式。

3、文件合并
    无论用什么方式切割,合并方法不变。

        cat splog* >newLog.log


4、补充说明
    split 参数:
        -a:指定输出文件名的后缀长度,默认为2个(aa,ab...)

        -d:指定输出文件名的后缀用数字代替

        -b:指定输出文件的最大字节数,如1k,1m...
        -C:指定每个输出文件中单行的最大字节数
        -l:指定每个输出文件的最大行数

 

从0开始,以ss为前缀,每一个分割大小1kb 

split -b 1k  -d  a.log ss

相关文章
相关标签/搜索