LInux 分割合并文件

时间 2019-11-06

标签 linux 分割合并文件栏目 Linux 繁體版

原文原文链接

有两种方式，linux

第一种使用dd命令网络

第二种使用split日志

dd命令是linux下一个很是有用的磁盘命令。它能够将指定大小的块拷贝成一个文件，并在拷贝的同时执行指定的转换。
UNIX已经提供了文件切割功能，能完成这个功能的UNIX命令就是DD。
要切割的大文件为DGJD，共98336321字节，则：
dd if=dgjd of=zz1 bs=1 count=20000000
dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000
dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000
dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000
dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000

其中IF（INPUT FILENAME）是要切割的大文件名，OF（OUTPUT FILENAME）是切割后的子文件名，BS是指明以多少字节做为一个切割记录单位，COUNT是要切割的单位记录数，SKIP是说明切割时的起点，单位一样以BS设定值为准。经过上述五条指令就将DGJD大文件切割成为4个2千万字节、1个18336321字节的子文件。要注意的是SKIP的值不能错。由此
也不难看出，DD切割是“非损耗”式的切割，而且支持从任意位置开始的任意大小的切割。

要将生成的ZZ一、ZZ二、ZZ三、ZZ4四个子文件组装为XDGJD，则：
dd if=zz1 of=xdgjd bs=1 count=20000000
dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000
dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000
dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000
dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000

其中SKIP参数改成SEEK参数，指明组装的新大文件XDGJD每次的开始位置是从文件头开始多少字节。若是缺省，则组装从文件头开始，显然这不是咱们每次都但愿的，因此需用SEEK参数明确指出开始位置。经过以上5个指令，便可将5个子文件从新组装为一个大文件。将切割后生成的子文件从新用FTP传送，结果有的可以顺利传送，有的仍然致使网络瘫痪，不怕，继续切割，切成每一个一千万字节，再传，OK！成功传送！ ip

1、关于it

在linux下，切割和合并文件可使用split和cat命令来实现。日志分析

2、文件切割
文件切割模式分为两种：文本文件和二进制模式。
一、文本模式
文本模式只适用于文本文件，用这种模式切割后的每一个文件都是可读的。文本模式又分为两种：按最大文件大小切割和按文本行数切割。
1）按文件大小切割二进制

split -C 50k log.log splog方法

将文本文件log.log按每块最大50k的大小进行切割，不打碎行。输出文件名相似splogaa, splogab……
2）按文本行数切割文件

split -l 100 log.log splogco

每一个分块100行，不考虑大小。日志分析时应该有用。
二、二进制模式

split -b 50k log.log splog

每一个分块（固然，最后一个不保证）大小都是50k，基本不可读。任何类型文件均可以用这种切割模式。

3、文件合并
无论用什么方式切割，合并方法不变。

cat splog* >newLog.log

4、补充说明
split 参数：
-a：指定输出文件名的后缀长度，默认为2个(aa,ab...)

-d：指定输出文件名的后缀用数字代替

-b：指定输出文件的最大字节数，如1k,1m...
-C：指定每个输出文件中单行的最大字节数
-l：指定每个输出文件的最大行数

从0开始，以ss为前缀，每一个分割大小1kb

split -b 1k -d a.log ss