RSYNC的介绍和配置


1、软件介绍

能够实现全量或增量的本地或远程的数据镜像同步,可跨平台使用linux

         相似scp命令,可是功能优于scp,由于rsync能够作增量备份git

         在同步备份数据时,默认状况下,rsync经过其独特的“quick check”算法,它仅同步大小或者最后修改时间发生变化的文件或目录,固然也能够根据权限、属主等属性的变化同步,但须要指定响应的参数,甚至能够实现指同步一根文件里有变化的内容部分,github

2、rsync特性:

         1)支持拷贝特殊文件,如连接、设备等web

         2)能够配出指定文件或目录同步的功能,至关于tartar -X)的排除功能算法

         3)能够作到保持原文件或目录的权限时间、软硬连接等全部属性不变shell

         4)能够实现增量同步,安全

         5)可使用rcprshssh等方式配合传输文件(rsync自己是不加密的),bash

    6)能够直接经过socket(进程方式)传输服务器

          7)支持匿名的或认证的进程模式传输(无需系统用户,使用虚拟用户),能够实现方便安全的进行数据备份及镜像。cookie

3、rsync的工做方式

         1)本地传输,相似cp

         2)借助rcpssh等通道加密传输数据

         3)以守护进程(socket)的方式传输数据(这是rsync的重要的功能)

注意:在远程同步任务中,负责发起rsync同步操做的客户机称为发起端,而负责响应来自客户机的rsync同步的服务器称为备份源。在这须要注意的是:在下行同步(下载)中,备份源负责提供原始位置,发起端应具备对该位置读取权限;在上行同步(上传)中,备份源负责提供文档的目标位置,发起端应对·该位置有写入权限

4、rsync的配置文件

1)默认rsync不存在配置文件,须要咱们手动建立 /etc/rsyncd.conf

2)配置文件中相关的配置参数

 全局配置的相关参数

port:指定后台程序使用的端口号,默认为873。

uid:指定该模块传输文件时守护进程的uid,配合gid选项使用肯定文件的权限,默认值是" nobody" 。

gid:指定当该模块传输文件时守护进程应该具备的gid。默认值为" nobody" 。

max connections:指定该模块的最大并发链接数量,超过限制的链接请求将被告知随后再试。默认值是0,也就是没有限制。

strict modes 设置是否监听用户密码文件的权限,默认为yes,监听后密码文件必须为600

lock file:指定支持maxconnections参数的锁文件,默认值是/var/run/rsyncd.lock

motd file:指定一个消息文件,当客户链接服务器时该文件的内容显示给客户,默认是没有motd文件的。

log file:指定rsync的日志文件,而不将日志发送给syslog

pid file:指定rsyncpid文件,一般指定为"/var/run/rsyncd.pid",存放进程ID的文件位置。

hosts allow = 单个IP地址或网络地址 //容许访问的客户机地址

常见的模块配置参数:

Comment:给模块指定一个描述,该描述连同模块名在客户链接获得模块列表时显示给客户。默认没有

Path:指定该模块的供备份的目录树路径,该参数是必须指定的。

read only yes为只容许下载,no为能够下载和上传文件到服务器

exclude:用来指定多个由空格隔开的多个文件或目录(相对路径),将其添加到exclude列表中。这等同于在客户端命令中使用—exclude----filter来指定某些文件或目录不下载或上传(既不可访问)

exclude from:指定一个包含exclude模式的定义的文件名,服务器从该文件中读取exclude列表定义,每一个文件或目录须要占用一行

include 用来指定不排除符合要求的文件或目录。这等同于在客户端命令中使用--include来指定模式,结合includeexclude能够定义复杂的exclude/include规则。

include from:指定一个包含include模式的定义的文件名,服务器从该文件中读取include列表定义。

ignore errors:指定rsyncd在判断是否运行传输时的删除操做时忽略server上的IO错误

ignorenonreadable:指定rysnc服务器彻底忽略那些用户没有访问权限的文件

auth users:该选项指定由空格或逗号分隔的用户名列表,只有这些用户才容许链接该模块。这里的用户和系统用户没有任何关系。若是" auth users" 被设置,那么客户端发出对该模块的链接请求之后会被rsync请求challenged进行验证身份这里使用的challenge/response认证协议。用户的名和密码以明文方式存放在" secrets file" 选项指定的文件中。默认状况下无需密码就能够链接模块(也就是匿名方式)

secrets file:该选项指定一个包含定义用户名:密码对的文件。只有在" auth users" 被定义时,该文件才有做用。文件每行包含一个username:passwd对。通常来讲密码最好不要超过8个字符。没有默认的secures file名,注意:该文件的权限必定要是600,不然客户端将不能链接服务器。

hosts allow:指定哪些IP的客户容许链接该模块。定义能够是如下形式:

单个IP地址,例如:192.167.0.1,多个IP或网段须要用空格隔开,

整个网段,例如:192.168.0.0/24,也能够是192.168.0.0/255.255.255.0

"*"则表示全部,默认是容许全部主机链接。

hosts deny:指定不容许链接rsync服务器的机器,可使用hostsallow的定义方式来进行定义。默认是没有hosts deny定义。

list:该选项设定当客户请求可使用的模块列表时,该模块是否应该被列出。若是设置该选项为false,能够建立隐藏的模块。默认值是true

Timeout:经过该选项能够覆盖客户指定的IP超时时间。经过该选项能够确保rsync服务器不会永远等待一个崩溃的客户端。超时单位为秒钟,0表示没有超时定义,这也是默认值。对于匿名rsync服务器来讲,一个理想的数字是600

log format:经过该选项用户在使用transfer logging能够本身定制日志文件的字段

dont compress:指定那些不进行压缩处理再传输的文件,默认值是*.gz *.tgz *.zip *.z*.rpm *.deb *.iso *.bz2 *.tbz

3)配置文件案例:

#############################global########################
uid = fuzj
gid = fuzj
use chroot = no
max connections= 4
strict modes =yes
port = 873
pid file = /var/run/rsyncd.pid
lock file =/var/run/rsync.lock
log file =/var/log/rsyncd.log
 
#############################modules####################
[webroot]
path = /webroot
comment =webroot backup
ignore errors
read only = yes
list = no
auth users = fuzj
secrets file =/etc/rsync.passwd
hosts allow =192.168.255.101
host deny =0.0.0.0/0
timeout 600

5.rsync的管理

rsync有两种管理方式:

一种是独立运行于系统后台,直接执行rsync –daemon ,便开始运行

一种是受xinetd管理,可是须要安装xinetd软件,而且修改/etc/xinetd.d/rsync中的disabled的值为no

命令:sed -i -e 's/= yes/= no/g' /etc/xinetd.d/rsync

6.rsync的使用方法

工做方式一:本地传输

rsync  [OPTION...]  SRC... [DEST]

工做方式二:借助rcpssh等通道加密传输数据

  Pull(拉): rsync [OPTION...]  -e “ssh -p22”[USER@]HOST:SRC... [DEST] 

  Push(推): rsync [OPTION...] -e “ssh -p 22”SRC... [USER@]HOST:DEST

注意:1ssh必定要放在-p的前边,不然报错

         2、若是ssh的端口是22的话,能够不指定-p

         3、这里用的是系统用户oldboy,所以使用的是单冒号,若是是虚拟用户的话要用双冒号。

工做方式三:以守护进程(socket)的方式传输数据

Pull(拉): rsync [OPTION...][USER@]HOST::SRC... [DEST]

        rsync[OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]

  Push(推): rsync [OPTION...] SRC...[USER@]HOST::DEST

        rsync[OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST

 

rsync命令参数:经常使用的 -avz  --delete   

-v, --verbose 详细模式输出

-q, --quiet 精简输出模式

-c, --checksum 打开校验开关,强制对文件传输进行校验

-a, --archive 归档模式,表示以递归方式传输文件,并保持全部文件属性,等于-rlptgoD

-r, --recursive 对子目录以递归模式处理

-R, --relative 使用相对路径信息

-b, --backup 建立备份,也就是对于目的已经存在有一样的文件名时,将老的文件从新命名为~filename。可使用--suffix选项来指定不一样的备份文件前缀。

--backup-dir 将备份文件(如~filename)存放在在目录下。

-suffix=SUFFIX 定义备份文件前缀

-u, --update 仅仅进行更新,也就是跳过全部已经存在于DST,而且文件时间晚于要备份的文件。(不覆盖更新的文件)

-l, --links 保留软链结

-L, --copy-links 想对待常规文件同样处理软链结

--copy-unsafe-links 仅仅拷贝指向SRC路径目录树之外的链结

--safe-links 忽略指向SRC路径目录树之外的链结

-H, --hard-links 保留硬链结     -p, --perms 保持文件权限

-o, --owner 保持文件属主信息     -g, --group 保持文件属组信息

-D, --devices 保持设备文件信息    -t, --times 保持文件时间信息

-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间

-n, --dry-run现实哪些文件将被传输

-W, --whole-file 拷贝文件,不进行增量检测

-x, --one-file-system 不要跨越文件系统边界

-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节

-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步

--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息

-C, --cvs-exclude 使用和CVS同样的方法自动忽略文件,用来排除那些不但愿传输的文件

--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新建立的文件

--delete 删除那些DST中SRC没有的文件

--delete-excluded 一样删除接收端那些被该选项指定排除的文件

--delete-after 传输结束之后再删除

--ignore-errors 即便出现IO错误也进行删除

--max-delete=NUM 最多删除NUM个文件

--partial 保留那些因故没有彻底传输的文件,以是加快随后的再次传输

--force 强制删除目录,即便不为空

--numeric-ids 不将数字的用户和组ID匹配为用户名和组名

--timeout=TIME IP超时时间,单位为秒

-I, --ignore-times 不跳过那些有一样的时间和长度的文件

--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间

--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0

-T --temp-dir=DIR 在DIR中建立临时文件

--compare-dest=DIR 一样比较DIR中的文件来决定是否须要备份

-P 等同于 --partial

--progress 显示备份过程

-z, --compress 对备份的文件在传输时进行压缩处理

--exclude=PATTERN 指定排除不须要传输的文件模式

--include=PATTERN 指定不排除而须要传输的文件模式

--exclude-from=FILE 排除FILE中指定模式的文件

--include-from=FILE 不排除FILE指定模式匹配的文件

--version 打印版本信息

--address 绑定到特定的地址

--config=FILE 指定其余的配置文件,不使用默认的rsyncd.conf文件

--port=PORT 指定其余的rsync服务端口

--blocking-io 对远程shell使用阻塞IO

-stats 给出某些文件的传输状态

--progress 在传输时现实传输过程

--log-format=formAT 指定日志文件格式

--password-file=FILE 从FILE中获得密码

--bwlimit=KBPS 限制I/O带宽,KBytes per second      

-h, --help 显示帮助信息

 

RSYNC的具体应用

1.本地复制文件和同步目录

建立1.txt文件并复制到/tmp目录下,
[root@localhost ~]# touch 1.txt
[root@localhost ~]# rsync 1.txt /tmp/
[root@localhost ~]# ls /tmp/
1.txt 
把/share/目录下的文件同步到/tmp下
[root@localhost ~]# ls /share/
123.jpg  123.sh
[root@localhost ~]# rsync -r /share/ /tmp/
[root@localhost ~]# ls /tmp/
123.jpg  123.sh
注意:若/share后面不加/,表示把share目录复制到/tmp下
[root@localhost ~]# rsync -r /share /tmp/ 
[root@localhost ~]# ls /tmp/
123.jpg  123.sh  share

2.远程复制文件,至关于备份

1)把192.168.255.100上的webroot中全部文件拉回到本地
[root@localhost ~]# rsync -avz jeck@192.168.255.100::webroot/backup_dir/
Password: 
receiving incremental file list
./
1.jpg
1.sh
1.txtr
sent 117 bytes  received252 bytes  25.45 bytes/sec
total size is 0  speedupis 0.00
 
发现上面的还得手动输入密码,可使用--password-file来指定密码文件,不须要再手动输入
[root@localhost ~]# rsync -avz jeck@192.168.255.100::webroot/backup_dir/ --password-file=/etc/rsync.passwd 
receiving incremental file list
 
sent 57 bytes  received141 bytes  18.86 bytes/sec
total size is 0  speedupis 0.00
注意本次操做是在客户端上,因此须要客户端有密码文件,文件中只须要填写密码便可,且权限600
加—delet能够实现增量备份,如,删除1.jpg,而后再同步,会发现只取回了1.jpg
[root@localhost ~]# rsync -avz --deletejeck@192.168.255.100::webroot /backup_dir/ --password-file=/etc/rsync.passwd 
receiving incremental file list
./
1.jpg
 
sent 79 bytes  received180 bytes  24.67 bytes/sec
total size is 0  speedupis 0.00
 
2)把本地(192.168.255,101)上的backup_dir文件推送到192.168.255.100的webroot里,注意rsyncd.conf中的read only 为no才能够推送成功
rsync -avz --delete /backup_dir/ jeck@192.168.255.100::webroot --password-file=/etc/rsync.passwd

3.以守护进程(socket)的方式传输数据

拉取:
rsync –avz rsync://jeck@192.168.255.100::webroot/ /backup_dir/--password-file=/etc/rsync.passwd
推送命令:
rsync –avz  /backup_dir/rsync:// jeck@192.168.255.100::webroot/  --password-file=/etc/rsync.passwd

4.rsync实现无交互自动密码验证

1SSH备份源无密码验证

对于ssh服务器来讲,采用密钥对验证是避免交互式登陆的最佳方式,只要在客户机中建立好无私钥短语的密钥对,再把公钥分发给服务器上的备份用户,就能够实现无交互式登陆

[root@localhost ~]# ssh-keygen -t rsa                   建立公钥和私钥
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): 
Enter passphrase (empty for no passphrase): 
Enter same passphrase again: 
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
04:07:8e:d5:48:36:13:61:7c:f4:f7:d4:e7:12:f4:9croot@localhost.localdomain
The key's randomart p_w_picpath is:
+--[ RSA 2048]----+
|     o%Bo     .  |
|     *o=o.   . +.|
|    . ... . . oE=|
|       .   . o o.|
|        S     o .|
|               . |
|                 |
|                 |
|                 |
+-----------------+
[root@localhost ~]# ssh-copy-id fuzj@192.168.255.100                    将公钥拷贝至服务器
fuzj@192.168.255.100's password: 
Now try logging into the machine, with "ssh'fuzj@192.168.255.100'", and check in:
 
  .ssh/authorized_keys                     公钥在服务器存放的位置
 
to make sure we haven't added extra keys that you weren'texpecting.
如今已经实现无交互密码验证登陆了

 

2Rsync备份源的无交互验证

rsync备份源的无交互验证,对于rsync备份源来讲,可以使用环境变量RSYNC_PASSWORD来存放密码。执行 rsync备份任务时,会自动读取该变量,并在须要时发送给rsync源服务器

[root@localhost ~]# export RSYNC_PASSWORD=fuzj
[root@localhost ~]# rsync -avzrsync://fuzj@192.168.255.100::webroot /backup_dir/
receiving incremental file list
 
sent 57 bytes  received141 bytes  18.86 bytes/sec
total size is 0  speedupis 0.00

3)使用密码文件进行自动验证

在服务器上rsync的配置文件须要使用secretsfile = /etc/rsync.passwd指定密码文件的位置,在/etc/rsync.passwd中以usernamepassword形式存储密码,并设置权限为600;在客户端上也须要建立密码文件,可是密码文件中只须要写入密码便可,不用写username,权限一样设置为600

使用:在rsync命令后面用--password-file=密码文件的方式进行指定便可。

5.rsync+inotify实现时时同步

         经过rsync能够实现对远程服务器数据的增量备份,可是rsync自身也有瓶颈,同步数据时,rsync采用核心算法岁目标文件进行对比,只进行差别同步,可是若是服务器的文件的数据十分庞大,千万级的,那么对比耗时就会很是长,而inotify的出现能够解决这个缺点。

         inotify是一种细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了inotify支持,inotify能够监控文件系统中添加、删除、修改、移动等各类事件,

         inotify的实现是在rsync的基础上实现的,要配置在rsync的服务端

 

1)inotify工做原理

         inotify监控文件系统是否有改动,一旦发现有改动则调用rsync进行数据同步

2)inotify的安装

 查看系统是否支持
[root@localhost ~]# uname -r   
2.6.32-358.el6.x86_64
[root@localhost ~]# ll /proc/sys/fs/inotify
total 0
-rw-r--r-- 1 root root 0 Jun 3 17:01 max_queued_events
-rw-r--r-- 1 root root 0 Jun 3 17:01 max_user_instances
-rw-r--r-- 1 root root 0 Jun 3 17:01 max_user_watches
提示:当要监控的目录、文件数量较多或者变化较频繁时,建议加大这三个参数的值。例如可直接修改/etc/sysctl.conf配置文件,将管理队列设为32768,实例数设为1024,监控数设为1048576(建议大于监控目标的总文件数)。
[root@localhost ~]# echo "fs.inotify.max_queued_events =16384" >>/etc/sysctl.conf 
[root@localhost ~]# echo "fs.inotify.max_user_instances =1024" >>/etc/sysctl.conf           
[root@localhost ~]# echo "fs.inotify.max_user_watches =1048576" >>/etc/sysctl.conf          
[root@localhost ~]# sysctl -p
net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
error: "net.bridge.bridge-nf-call-ip6tables" is anunknown key
error: "net.bridge.bridge-nf-call-iptables" is anunknown key
error: "net.bridge.bridge-nf-call-arptables" is anunknown key
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.shmmax = 68719476736
kernel.shmall = 4294967296
fs.inotify.max_queued_events = 16384
fs.inotify.max_user_instances = 1024
fs.inotify.max_user_watches = 1048576
 
下载inotify软件包,编译安装
wgethttp://github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz
tar zxf inotify-tools-3.14.tar.gz -C /usr/src/
cd /usr/src/inotify-tools-3.14/
./configure
make
make install

3)inotify的使用

 

时时监控/webroot中的文件变化,

执行inotifywait -mqr -e modify,create,move,delete,attrib /webroot/命令后,再另个终端中在/webroot里建立文件,删除等操做,会在打印出来

命令参数

-m, 即--monitor,表示始终保持事件监听状态。
-r, 即--recursive,表示递归查询目录。
-q, 即--quiet,表示打印出监控事件。

-e, 即--event,经过此参数能够指定要监控的事件,常见的事件有modify、delete、create、attrib等

补充:--timefmt  用来指定-%T中所表现出来的时间格式。定义字符跟date命令中的同样。如: %Y表示完整格式的年,%m月,%d日,%H时,%M分,%S秒。

--format  用来定义发生事件之后所发出的通知格式。如: %T 时间,%w事件目录,%f事件文件,%e事件类型。

 

[root@localhost ~]# inotifywait -mqr -emodify,create,move,delete,attrib /webroot/
/webroot/ CREATE,ISDIR test1
/webroot/ ATTRIB 1.sh
/webroot/ CREATE sss
/webroot/ ATTRIB sss

 

4rsync+inotify时时同步的脚本

注意:本脚本是基于ssh源来远程同步,因此在运行脚本以前须要作好无交互式ssh密码认证。只须要把本脚本在后台时时运行便可。  sh rsync+inotify_backup.sh&

 

 

 

 

#!/bin/bash
 
BACKUP_DIR="/webroot/"
TARGET_DIR="/backup_dir/"
TARGET_HOST="192.168.255.101"
INOTIFY_CMD="/usr/local/bin/inotifywait -mrq   -e modify,create,move,delete,attrib$BACKUP_DIR "
RSYNC="/usr/bin/rsync"
BACKUP_WAY="-avz --delete"
BACKUP_USER="fuzj"
RSYNC_CMD="$RSYNC $BACKUP_WAY $BACKUP_DIR$BACKUP_USER@$TARGET_HOST:$TARGET_DIR "
$INOTIFY_CMD | while read DIRECTORY EVENT FILE
do
    if [ `pgrep rsync | wc-l` -gt 0 ]
     then
         $RSYNC_CMD
    else
        echo "thersync no running"
    fi
done

 

下面是一个rsync客户端定时去同步备份源的脚本

#!/bin/bash
 
SOURCE_HOST="192.168.255.100"
SOURCE_DIR="webroot"
LOCAL_DIR="/backup_dir"
BCAKUP_USER="fuzj"
USER_PASSWORD="fuzj"
BACKUP_WAY="-avz --delete"
RSYNC="/usr/bin/rsync"
export RSYNC_PASSWORD="$USER_PASSWORD"
$RSYNC $BACKUP_WAY $BACKUP_USER@$SOURCE_HOST::$SOURCE_DIR$LOCAL_DIR 
if [ $? -eq 0 ] 
then
    unset RSYNC_PASSWORD 
    echo "RSYNC backupsuccessfull"
else
    unset RSYNC_PASSWORD 
    echo "RSYNC backupfaild"
fi

以上两个脚本仅供参考---

相关文章
相关标签/搜索