5分钟学linux命令之split

情景介绍

平时工做中,我习惯使用rz从本地上传文件到服务器,sz从服务器下载文件到本地,但对传输文件大小有限制,例如排查线上jvm的问题,须要生成了dump文件,可能有10G大,超过了限制,怎么下载呢?git

拆分文件命令之split

语法shell

split [-<行数>][-l<行数>][-b<字节>][-C<字节>][要切割的文件][输出文件名的前缀][-a<后缀长度>]

-<行数>或-l<行数>:指定每多少行切成一个小文件bash

-b<字节>:指定每多少字节切成一个小文件,这里也能够指定K、M、G等单位服务器

-C<字节>:与-b<字节>相似,但在切割时会尽可能维持每行的完整性jvm

输出文件名的前缀:设置拆分后文件的名称前缀,split会自动在前缀后面加上编号,默认从aa开始code

-a<后缀长度>:默认后缀长度是2,即按 aa,ab,ac的顺序排序blog

<br>排序

split命令和cat命令能够完成上面的难题,排查线上问题的现场已经没有了,因此为了演示,用dd命令(对dd命令不了解的也能够学下,由于此次重点介绍split,因此dd暂且不介绍)建立一个400MB的文件,文件名是adsearch.hprof,这里假设400MB的大小就超过了服务器的下载限制md5

dd if=/dev/zero bs=1024 count=409600 of=adsearch.hprof

file

如图所示,建立了一个400MB的文件cmd

<br>

那我把adsearch.hprof文件按100MB大小拆分,能够拆分红4个文件

split -b 100M adsearch.hprof

file

能够看到在执行完split命令后,目录下生成了四个相同大小 xaa、xab、xac、xad四个100MB的小文件。由于咱们没有指定前缀,就采用了默认的前缀x,后面跟着aa、ab、ac、ad。咱们也能够指定前缀,好比我把刚刚生成的四个小文件删掉,用下面的命令从新切分下

split -b 100M adsearch.hprof adsearch-

file

<br>

合并文件之cat

把大文件切分后,咱们就能够把小文件下载到本地,而后把他们再拼接起来

// 用通配符的形式,要保证该目录下没有其余以adsearch-a为前缀的文件
cat adsearch-a* > adsearch.hprof
// 或者指定文件进行拼接
cat adsearch-aa adsearch-ab adsearch-ac adsearch-ad > adsearch.hprof

file

<br> **备注**

上面的操做我是在win本上的gitbash操做的,有cat命令

<br>

那若是没有安装gitbash只有cmd呢?

可使用copy /b 命令来拼接,其中 /b 表明指定以二进制格式进行复制

copy /b adsearch-aa + adsearch-ab + adsearch-ac + adsearch-ad adsearch.hprof

<br> #### 校验

通过拆分-合并后,两个文件同样吗?这是咱们主要关心的问题,咱们对文件作一个md5,看结果是否相等,就能够判断文件是否同样了

原始文件的md5 file

合并后文件的md5(gitbash) file

合并后文件的md5(cmd)

file

通过对先后文件的md5值比价,结果一致,说明咱们的操做没有问题

<br> #### 小结

当咱们下载或上传相对较大的文件时,可使用split把大文件拆分红小文件,而后用cat命令把这些小文件从新拼接成大文件

相关文章
相关标签/搜索