转: Linux 上的经常使用文件传输方式介绍与比较

时间 2019-11-08

标签 linux 经常使用文件传输方式介绍比较栏目 Linux 繁體版

原文原文链接

from: https://www.ibm.com/developerworks/cn/linux/l-cn-filetransfer/html

ftp

ftp 命令使用文件传输协议（File Transfer Protocol, FTP）在本地主机和远程主机之间或者在两个远程主机之间进行文件传输。linux

FTP 协议容许数据在不一样文件系统的主机之间传输。尽管这个协议在传输数据上提供了高适应性，可是它并无尝试去保留一个特定文件系统上的文件属性（例如一个文件的保护模式或者修改次数）。并且 FTP 协议不多对一个文件系统的总体结构做假定，也不提供这样的功能，好比递归的拷贝子目录。在使用 ftp 命令时，须要注意 FTP 协议的这些特性。当须要保留文件属性或者须要递归的拷贝子目录时，可使用 rcp/scp 等命令。算法

基本语法

ftp 命令的通常格式以下：shell

$ ftp 主机名 /IP浏览器

其中“主机名 /IP ”是所要链接的远程机的主机名或 IP 地址。在命令行中，主机名属于可选项，若是指定主机名，ftp 将试图与远程机的 ftp 服务程序进行链接；若是没有指定主机名，ftp 将给出提示符，等待用户输入命令：安全

$ ftp 
 ftp >

此时在 ftp> 提示符后面输入 open 子命令加主机名或 IP 地址，将试图链接指定的主机。无论使用哪种方法，若是链接成功，须要在远程机上登陆。用户若是在远程机上有账号，就能够经过 ftp 使用这一账号并须要提供口令。在远程机上的用户账号的读写权限决定该用户在远程机上能下载什么文件和能将上载文件放到哪一个目录中。在远程站点上登陆成功后，在“ ftp> ”提示符下能够自由使用 ftp 提供的各类子命令，最经常使用的子命令以下表所示。服务器

表 1. ftp 子命令

命令	描述
ls	列出远程机的当前目录
cd	在远程机上改变工做目录
lcd	在本地机上改变工做目录
ascii	设置文件传输方式为 ASCII 模式
binary	设置文件传输方式为二进制模式
close	终止当前的 ftp 会话
get (mget)	从远程机传送指定文件到本地机
put (mput)	从本地机传送指定文件到远程机
open	链接远程 ftp 站点
quit	断开与远程机的链接并退出 ftp
?	显示本地帮助信息
!	转到 Shell 中
prompt 1	关闭交互模式

使用实例：

利用编写 ftp 脚本能够自动完成文件传输任务。具体方法是使用 ftp 命令的 -in 选项，并重定向 ftp 命令的输入。如今咱们来编写一个利用 ftp 登陆到远程服务器，并以 bin 的文件格式，在 /home 目录下，下载 file1.log 以及 file2.sh 至本机 /opt/ibm/，并从本地 /opt 目录上传文件 file3.jave 至远程服务器 /home 的自动化脚本。网络

ftp -ni <<+ 
	 open $IP 
	 user $USERNAME $PASSWD 
	 bin 
	 cd /home 
	 lcd /opt/ibm 
	 mget file1.log file2.sh 
	 lcd /opt 
	 mput file3.jave 
	 ls 
	 bye

回页首并发

rcp

rcp 意为“ remote file copy ”（远程文件拷贝）。该命令用于计算机之间进行文件拷贝。其有两种格式。第一种格式用于文件到文件的拷贝；第二种格式用于把文件或目录拷贝到另外一个目录中。dom

基本语法

rcp [-px] [-k realm] file1 file2 
 rcp [-px] [-r] [-k realm] file directory

每一个文件或目录参数既能够是远程文件名也能够是本地文件名。远程文件名具备以下形式：rname@rhost：path，其中 rname 为远程用户名，rhost 为远程计算机名，path 为该文件的路径。下表说明了 rcp 命令各个参数的含义。

表 2. rcp 命令的命令行参数

选项	描述
-r	递归地将源目录中的全部内容拷贝到目的目录中。若使用该选项，目的须为一个目录。
-p	试图保留源文件的修改时间和模式，忽略 umask 。
-k	请求 rcp 得到在指定区域内的远程主机的 Kerberos 许可，而不是得到由 krb_relmofhost（3）肯定的远程主机区域内的远程主机的 Kerberos 许可。
-x	为传送的全部数据进行 DES 加密。这会影响响应时间和 CPU 利用率，可是能够提升安全性。

若是在文件名中指定的路径不是完整的路径名，则该路径将被解释为相对远程机上同名用户的主目录。若没有给出远程用户名，则使用当前用户名。若是远程机上的路径包含特殊 shell 字符，须要使用反斜线（\）、双引号（”）或单引号（’）将其括起来，使全部的 shell 元字符都能被远程地解释。须要说明的是，rcp 不提示输入口令，它经过 rsh（remote shell）命令来执行拷贝。

使用实例：

将本地文件复制到远程登陆目录中
rcp <source> <remoteDir>
将多个本地文件复制到远程登陆目录的子目录中
rcp <source1> <source2> <source3> <subdirectory in remote system>
将多个文件从多个远程源复制到使用不一样用户名的远程目标中
rcp <host1.user1:source1> <host2.user2:source2> <dest.destuser:directory>

回页首

scp

scp 命令在网络上的主机之间拷贝文件，它是安全拷贝（secure copy）的缩写。 scp 命令使用 ssh 来传输数据，并使用与 ssh 相同的认证模式，提供一样的安全保障。 scp 命令的用法和 rcp 命令很是相似，这里就不作过多介绍了。通常推荐使用 scp 命令，由于它比 rcp 更安全。

咱们能够经过配置 ssh，使得在两台机器间拷贝文件时不须要每次都输入用户名和密码。

基本语法

scp [-1246BCpqrv] [-c cipher] [-F ssh_config] [-i identity_file] 
         [-l limit] [-o ssh_option] [-P port] [-S program] 
         [[user@]host1:]file1 [...] [[user@]host2:]file2

使用 scp 命令，须要输入密码，若是不想每次都输入，可参考下面的方法。

首先生成密钥对

$ ssh-keygen -t rsa 
 Generating public/private rsa key pair. 
 Enter file in which to save the key (/home/user/.ssh/id_rsa): 
 Created directory '/home/user/.ssh'. 
 Enter passphrase (empty for no passphrase): 
 Enter same passphrase again: 
 Your identification has been saved in /home/user/.ssh/id_rsa. 
 Your public key has been saved in /home/user/.ssh/id_rsa.pub. 
 The key fingerprint is: 
 10:66:da:38:85:8a:8c:bd:db:9c:6e:eb:ee:bd:7d:15 user@somehost

在这里，咱们指定了生成 rsa 类型的密钥。在提示密钥的保存路径和密码时，能够直接回车使用默认路径和空密码。这样，生成的公共密钥保存在 $HOME/.ssh/id_rsa.pub，私有密钥保存在 $HOME/.ssh/id_rsa 。而后把这个密钥对中的公共密钥的内容复制到要访问的机器上的 $HOME/.ssh/authorized_keys 文件中。这样，下次再访问那台机器时，就不用输入密码了。

使用实例：

Copy 本地文件 /etc/eva.log, 到远程机器 sysB, 用户 user 的家目录下
scp /etc/eva.log user@sysB:/home/user
copy 远程机器 sysB 上的文件 /home/uesr/eva.log, 到本地的 /etc 目录下 , 并保持文件属性不变
scp -p user@sysB:/home/uesr/eva.log /etc
copy sysB 上的目录 /home/user，到本地 /home/user/tmp, <new dir,/home/user/tmp/user>
scp -r user@sysB:/home/user /home/user/tmp

回页首

wget

wget 是一个经由 GPL 许可的可从网络上自动获取文件的自由软件包。它是一个非交互式的命令行工具。支持 HTTP，HTTPS 和 FTP 协议，支持代理服务器以及断点续传功能。 wget 可实现递归下载，便可跟踪 HTML 页面上的连接依次下载来建立远程服务器的本地版本，彻底重建原始站点的目录结构，实现远程网站的镜像。在递归下载时，wget 将页面中的超级连接转换成指向本地文件，方便离线浏览。因为非交互特性，wget 支持后台运行，用户在退出系统后，仍可继续运行。功能强大，设置方便简单。

基本语法

wget [options] [URL-list]

wget 有不少不一样的参数以用于远程站点信息的获取，经常使用参数以下，更多参数请参照 wget 帮助手册 http://www.gnu.org/software/wget/manual/wget.html

表 3. wget 工具经常使用参数

选项	描述
-r	递归下载服务器上全部的目录和文件。由 -l 选项来指定递归深度。
-b	后台下载
-m	制做站点镜像
-c	指定断点续传功能。该功能要求服务器支持断点续传。
-I	指定下载目录列表，可实现批量下载
-A/-R	指定接受／拒绝下载列表，实现选择性地下载
--proxy=on/off	指定是否利用代理服务器进行下载
-t, --tries=NUMBER	最大尝试连接次数 (0 表示无限制，默认为 20 次 )
-nc, --no-clobber	不覆盖已存在的文件
-N, --timestamping	只下载比本地新的文件
-nd --no-directories	不进行目录结构建立
-x, --force-directories	强制建立目录结构
-nH, --no-host-directories	不继承主机目录结构
-P, --directory-prefix=PREFIX	设置目录前缀

使用实例：

递归下载 http://www.ibm.com.cn 站点的信息。下载全部显示完整网页因此须要的文件，如图片等。在下载不进行上层目录搜索并将绝对连接转换为相对连接。
wget -r -p -np -k http://www.ibm.com.cn

将在本地硬盘创建 http://www.ibm.com.cn 的镜像，镜像文件存入当前目录下一个名为 www.ibm.com.cn 的子目录中（也可使用 -nH 参数指定不创建该子目录，而直接在当前目录下创建镜像的目录结构），递归深度为 4，重试次数为无穷（若链接出现问题，wget 将永远重试下去，直至任务完成）
wget -m -l4 -t0 http://www.ibm.com.c

使用代理进行下载，并实现断点续传。代理能够在环境变量 PROXY 或 wgetrc 文件中设定。 -c 选项要求服务支持断点续传。
wget -Y on -c http://www.ibm.com.cn

回页首

curl

另外一个能够用来进行文件传输的工具是 curl，它是对 libcurl 库的一个命令行工具包装。 libcurl 库中提供了相应功能的 API，能够在程序中调用。对于 libcurl 库的使用方法介绍超出了本文的讨论范围。 curl 使用 URL 的语法来传输文件，它支持 FTP, FTPS, HTTP, HTTPS, TFTP, SFTP, TELNET 等多种协议。 curl 功能强大，它提供了包括代理支持，用户认证，FTP 上载，HTTP post，SSL 链接，文件续传等许多特性。

基本语法

curl [options … ] <url>

其中下载参数大约有 80 多个，curl 的各个功能彻底依靠这些参数来完成。下面举例说明 curl 的一些基本用法。

使用实例：

获取 GNU 的主页
curl http://www.gnu.org
获取 GNU 的 FTP 服务器上根目录下的 README 文件
curl ftp://ftp.gnu.org/README
从一个字典中获取 curl 的定义
curl dict://dict.org/m:curl
若是须要指定用户名和密码的话，能够在 url 中指定，或者使用 -u 参数
curl ftp://name:passwd@machine.domain:port/full/path/to/file

curl -u name:passwd ftp://machine.domain:port/full/path/to/file
curl 会将从指定 url 处获取的内容打印到标准输出上。若是须要保存在本地文件中，可使用 -o，或使用 -O 参数指定使用远程主机上的文件名（若是 url 中没有给出文件名的部分，则此操做将会失败）
curl – o gnu.html http://www.gnu.org

curl – O http://www.gnu.org/index.html
使用 -x 选项来使用代理进行链接
curl -x my-proxy:port ftp://ftp.somesite.com/README
经过使用 curl 的 -T 选项来进行上载
curl -T - ftp://ftp.upload.com/upfile
此命令从标准输入读取数据，并上载至远程 FTP 服务器上的 upfile 文件中。也能够指定上载一个本地文件
curl -T localfile -a ftp://ftp.upload.com/upfile

其中 -a 参数表示以添加方式将 localfile 中的内容附加到 upfile 的末尾。

总的来讲，curl 适合用来进行自动的文件传输或操做序列，它是一个很好的模拟用户在网页浏览器上的行为的工具。尤为当须要在程序中调用时，libcurl 是个很好的选择。

回页首

rsync

rsync 是一款高效的远程数据备份和镜象工具，可快速地同步多台主机间的文件，其具备以下特性：

支持连接、全部者、组信息以及权限信息的拷贝；
经过远程 shell（ssh, rsh）进行传输；
无须特殊权限便可安装使用；
流水线式文件传输模式，文件传输效率高；
支持匿名操做；

须要说起的是 rsync 以其优越的性能优点区别于其它几种 Linux 文件传输方法，其同步文件的速度至关快，这主要归功于 rsync 所使用的传输算法。简而言之 rsync 算法能在至关短的时间内计算出须要备份的数据，只对源文件与目标文件的不一样之处进行传输，从而下降网络中传输的数据量，以此达到快速备份镜像的目的。下面经过一典型应用场景来描述 rsync 算法的基本原理：主机 A 与主机 B 均有对同一文件的拷贝，用户对主机 A 上的拷贝进行更新，主机 B 经过 rsync 算法对更新后的文件进行同步。如下是该算法的实现步骤：

主机 B 将原始拷贝划分红大小为 N 的不重合的若干块（文件末尾部分分块大小可能不足 N），并对这些数据块进行两种不一样方式的校验：32 位的滚动弱校验、128 位的 MD4 强校验。弱校验较之强校验计算速度快。
主机 B 将每一个数据块的弱校验、强校验结果发送给主机 A 。
主机 A 对更新后的文件拷贝中的每一个长度为 N 的数据块进行弱校验并与从 B 接收到的弱校验值进行匹配，若相同再进行强校验匹配。因为弱校验的滚动特性能够快速地筛选出须要进行同步的数据块。该算法的运算量主要集中在主机 A 上。
经过上述计算，主机 A 将文件的不一样部分发送给 B，B 接收到两个拷贝之间的不一样之处，从而同步获得更新后的文件。

经过如上方式，rsync 避免了对相同数据的传输，减小了网络带宽的浪费。在时间上整个过程当中需一个往返，从某种程度上也保证了 rsync 的优越性能。

用户可从官方网站 http://rsync.samba.org/ 上下载安装 rsync 的最新版本。使用时需将 rsync 分别安装于服务端和客户端，服务端和客户端使用同一个 rsync 软件包来实现远程镜像和按期同步更新。须要说明的是一个 rsync 服务端可同时备份多个客户端的数据；多个服务端备份一个客户端的数据。 rsync 默认端口为 873，服务器在该端口接收客户的匿名或者认证方式的备份请求。

rsync 服务端在使用以前须要进行必要的配置，其配置文件为 /etc/rsyncd.conf，进行认证、访问、日志记录等控制。配置文件包括全局参数、模块参数的设置。 rsyncd.conf 文件中 [module] 以前的全部参数为全局参数，也能够在全局参数部分定义模块参数，在这种状况下该参数的值就是全部模块的默认值。全局参数设置程序使用的端口号，指定消息文件、日志文件 pid 文件以及发送日志消息的级别。模块参数主要定义服务端哪一个目录须要被同步。用户可根据不一样的须要指定多个模块，每一个模块对应须要备份的一个目录树，即如有 N 个须要备份的目录树，则须要 N 个模块与之对应。模块中能够定义许多参数，常见参数以下。

表 4. rsyncd.conf 配置文件常见模块参数列表

选项	描述
Comment	模块信息描述，该描述连同模块名在客户链接获得模块列表时显示给客户。默认没有描述定义。
Path	指定供备份的目录路径，必须指定该参数。
max connections	指定最大并发链接数以保护服务器，超过限制的链接请求将被告知随后再试。默认值为 0，即没有限制。
log file	指定日志文件
read only	设定是否容许客户上载文件。若为 true 任何上载请求均会失败，若为 false 且客户端拥有服务器目录读写权限则能够上载。默认值为 true 。
write only	设定是否容许客户下载文件。若为 true 任何下载请求均会失败，默认值为 false 。
List	设定当客户请求可使用的模块列表时，是否列出该模块。若为 false，则建立隐藏的模块。默认值为 true 。
fake super	容许文件享有全部权限，而无需后台服务以 root 权限进行操做。
Filter	设置过滤列表以决定哪些文件可由客户端访问。
hosts allow	指定容许客户链接的 IP 地址。能够为单个 IP 地址或整个网段。多个 IP 或网段须要以空格隔开。默认是容许全部主机链接。
dont compress	指定不进行压缩处理便可传输的文件，默认值是 .gz .tgz .zip .z .rpm .deb .iso .bz2 *.tbz
pre-xfer exec, post-xfer exec	设置可在文件传输前／后执行的命令。若在文件传输前执行的命令失败，则取消本次传输操做。

基本语法

经过远程 shell 方式：

rsync [OPTION] [USER@]HOST:SRC DEST
使用远程 shell（如 ssh, rsh）实现将远程机器的内容拷贝到本地机器。 SRC 地址路径中以单个冒号 ":" 进行分隔。
rsync [OPTION] SRC [USER@]HOST:DEST
使用远程 shell（如 rsh、ssh）实现本地机器的内容拷贝到远程机器。 DEST 地址路径中以单个冒号 ":" 进行分隔。

经过 rsync daemon 方式：

rsync [OPTION] [USER@]HOST::SRC DEST 或
rsync [OPTION] rsync://[USER@]HOST[:PORT]/SRC [DEST]
从远程 rsync 服务器中拷贝文件到本地机。 SRC 地址路径中以双冒号 "::" 进行分隔。
rsync [OPTION] SRC [USER@]HOST::DEST 或
rsync [OPTION] SRC rsync://[USER@]HOST[:PORT]/DEST
从本地机器拷贝文件到远程 rsync 服务器中。 DEST 地址路径中以双冒号 "::" 进行分隔。

若是 rsync 命令中只指定 SRC 参数而不指定 DEST 参数，则意为显示源文件列表而非进行同步拷贝。 rsync 有许多功能选项，经常使用的选项以下：

表 5. rsync 经常使用参数

选项	描述
-a, --archive	归档模式，保持全部文件属性，等同于 -rlptgoD
-v, --verbose	详细信息输出
-r, --recursive	对子目录进行递归处理
-R, --relative	使用相对路径信息
-b, --backup	建立备份
-z, --compress	对备份的文件在传输时进行压缩处理
--delete	用于同步目录，从 DEST 中将 SRC 不存在的文件进行删除
--progress	显示备份过程

使用实例：

查看服务端文件及列表
- # rsync 9.186.110.53::
  查看服务端可用的模块列表以及注释信息
- # rsync ibmuser@9.186.110.53::www/
  查看服务端 www 模块中的目录及文件列表（使用 rsyncd 用户认证方式）
- # rsync ibmuser@9.186.110.53:/var/www/html/
  查看服务端 /var/www/html 目录中的内容（使用服务端的系统用户进行验证，如 ibmuser）
保持客户端与服务端的数据同步
- # rsync -avz ibmuser@9.186.110.53::www/ /backup1/
  使用后台服务方式将服务端 www 模块下的内容备份到本地 /backup1 目录中，备份时保留原有权限、属性、属主及符号链接等，并使用压缩方式加快数据传输。
- # rsync – avz ibmuser@9.186.110.53:/var/www/html /backup2/
  使用 ssh 方式将远程的 /var/www/html 目录备份到本地 /backup2/ 目录下
- # rsync -avz --delete ibmuser@9.186.110.53::www/ /backup3/
  将远程 www 模块备份到本地 /backup3/ 目录中，同时进行同步目录，删除本地目录中多余的文件。

当服务端的数据出现问题时，须要经过客户端的数据对服务端进行恢复，只要客户端有服务端的写入权限，便可经过调换 rsync 命令的 SRC、DEST 参数进行恢复。

回页首

结尾与总结

综上所述，各类文件传输方式的特征表现各有千秋，咱们从如下几个方面综合对比，更深刻地了解它们各自的特性。

传输性能

wget 经过支持后台执行及断点续传提升文件传输效率； rsync 则以其高效的传输及压缩算法达到快传输的目的。

配置难度

rcp 只需进行简单的配置，建立 .rhost 文件以及设置 /etc/hosts 文件中主机名与 IP 地址列表； wget 设置设置方便简单，只需在客户端指定参数执行命令便可； rsync 在使用前须要对服务端 /etc/rsyncd.conf 进行参数设定，配置内容相对复杂。

安全性能

ftp、rcp 不保证传输的安全性，scp、rsync 则都可基于 ssh 认证进行传输，提供了较强的安全保障。 wget 也可经过指定安全协议作到安全传输。

经过上述的对比不难发现，每种文件传输方法基于其自身的特色与优点均有其典型的适用场景：

ftp 做为最经常使用的入门式的文件传输方法，使用简单，易于理解，而且能够实现脚本自动化；
rcp 相对于 ftp 能够保留文件属性并可递归的拷贝子目录；
scp 利用 ssh 传输数据，并使用与 ssh 相同的认证模式，相对于 rcp 提供更强的安全保障；
wget，实现递归下载，可跟踪 HTML 页面上的连接依次下载来建立远程服务器的本地版本，彻底重建原始站点的目录结构，适合实现远程网站的镜像；
curl 则适合用来进行自动的文件传输或操做序列，是一个很好的模拟用户在网页浏览器上的行为的工具；
rsync 更适用于大数据量的每日同步，拷贝的速度很快，相对 wget 来讲速度快且安全高效。

读者可在不一样的场合根据实际须要，选择适合的文件传输方法。

参考：Linux 大全　第三版，[ 美 ] Jack Tackett Jr., David Gunter 著，万华，李建森，何江华译，电子工业出版社出版，1989. – 提供了 Linux 相关的各方面知识。
参考：http://www.gnu.org/software/wget/manual/wget.html- GNU 的官方网站，提供了不少经常使用命令的用法。
参考：http://rsync.samba.org/ftp/rsync/rsync.html- rsync 命令的详细介绍
参考：Linux Man-page – Linux 的用户手册
在 developerWorks Linux 专区寻找为 Linux 开发人员（包括 Linux 新手入门）准备的更多参考资料，查阅咱们最受欢迎的文章和教程。
在 developerWorks 上查阅全部 Linux 技巧和 Linux 教程。