VERITA Netbackup平常巡检详细说明

VERITA备份平常监控java

#一. 相关检查方法、命令 1.1 启动NBU的图形管理界面: /usr/openv/netbackup/bin/jnbSA & 1.2字符界面命令: 1.2.1catlog 日志备份时间 bpdbjobs |grep -i cata|grep " 0 " |head -1|awk '{print "/usr/openv/netbackup/bin/admincmd/bpdbjobs -all_columns -jobid ",$1}' 1.2.2文件系统使用率 df -h 1.2.3空白磁带数目是否充足 available_media |grep -i tld |grep -i ava|wc -l 1.2.4最近失败的200条做业,备份时间过长的也须要注意 bpdbjobs |grep -v " 0 " |head -200 1.2.6驱动器状态 vmoprcmd -d数据库

#二. 平常检查流程 2.1确认VERITAS NBU进程状态 2.2确认备份任务状态 2.3确认磁带、磁带机的工做状态 2.4确认文件系统状态服务器

##2.1检查NBU进程状态: 须要天天监控activity monitor,确认在备份服务器上运行的进程有:avrd、vmd、tldd、ltid、bprd、nbdbd、bpdbm、bpsched、bpjobd。 若是前四个进程avrd、vmd、tldd、ltid有一个没有运行,则备份系统工做不正常。 简单的处理方法:从新启动NBU服务器进程 方法以下: a)退出NBU的java管理界面,以root身份在命令行状态下输入:netbackup stop b)使用bpps –a检查上述进程的状态 c)若是进程没有被kill干净,继续执行netbackup stop命令。 d)若是没法结束全部的进程,须要使用bp.kill_all来进行终结。 e)当使用bpps –a看到没有NBU的进程输出时,代表全部的NBU进程已经结束。使用命令:netbackup start启动NBU进程,并用bpps –a确认。 f)若是问题依然存在,请与厂家联系检查VERITAS工做状态。网络

##2.2检查备份任务状态。 须要天天监控activity monitor,观察已经发生备份的任务状态返回值,返回值为0代表备份成功;若是返回值不为0,代表备份失败。对于数据库Archivelog的备份,因为备份的频率目前设置为每一小时一次,所以若是在下面的备份做业中,若是Archivelog的备份成功,能够忽略上面错误的备份。 典型的备份错误有:oracle

a) Archivelog备份返回值为1,并且后续的备份均返回1。 一般状况,须要进行Oracle 数据库的Archivelog同步。ide

Oracle数据库Archivelog同步的方法为: 以Oracle数据库用户登陆到Oracle数据库服务上,经过RMAN来运行下面的命令: $ su – oracle $ rman RMAN> connect target / RMAN> change archivelog all validate; RMAN> exit工具

b) 备份做业返回值为4一、54。 检查服务器网络工做状态: 首先找到备份失败的服务器IP地址,确认IP地址能够ping通。 使用telnet工具,进行以下操做: telnet 服务器IP地址 13782 若是返回信息以下,代表VERITAS NBU通讯正常。 Trying... Connected to 服务器IP地址. Escape character is '^]'. 若是系统直接返回到命令行状态,请检查问题服务器的service和inetd设置,确保bpcd进程存在。 并使用以下命令检查bpcd的工做状态: netstat |grep bpcd测试

c) 备份做业返回9六、219。 请检查磁带机、磁带的工做状态ui

##2.3检查磁带和磁带机状态: 磁带机和磁带常见的错误为9六、219,须要确认磁带机状态是否up,磁带库是否闪红灯,使用bpmedialist命令查看是否磁带已经写满或者处于frozen状态,磁带是否卡在了磁带机里。 若是磁带显示frozen,可使用bpmedia –unfreeze –m labelid来清除此状态,若是磁带反复显示frozen,可能磁带坏,请与厂家联系磁盘检查。命令行

补充:能够在java界面中选择“Media and Device Management”来查看如今media分配的状况。 观察磁带机工做状态的方式有2种:Java GUI界面和命令行。

a) Java GUI界面方式: 在Java GUI界面下,能够在Media and Device ManagementàDevice Monitor选项中,观察到磁带机的状态。例如磁带机正在使用中、磁带机DOWN、磁带机空闲等。

b) 命令行方式: 使用命令行方式观察磁带机的状态,相关的命令有vmdareq、vmoprcmd。

若是观察到磁带机DOWN,建议先检查是否有卡带现象。肯定没有卡带现象后,能够作简单的磁带机UP操做。磁带机UP操做能够经过上面所述的Java GUI界面和命令行方式来执行。命令行方式举例以下: vmoprcmd –h hostID –up driveID 其中,hostID是SSO服务器名称,driveID是磁带机的序号,目前备份系统中2台磁带机的序号取值为0和1。

通过简单UP后,若是磁带机仍然出现DOWN现象,请与厂家联系解决。

##2.4检查文件系统状态 在备份服务器和其它服务器上使用以下命令 df –k 确认文件系统有可使用的空间。文件系统若是写满,备份系统将工做不正常。

备注: 若是通过了很长时间(如7,8个小时)一个备份任务一直处于active或者queued状态,同时显示此任务的字节数没有增加,须要把此任务kill掉。由于这样会阻止下一个任务的执行。


#三NBU经常使用的命令

  1. 在命令提示符下输入available_media,查看当前磁带使用状况
  2. 在命令提示符下输入bpmedialist命令查看当前磁带使用状况及是否冻结
  3. 在命令提示符号下输入bpexpdate –m a00001 –d 0来使磁带过时
  4. 在命令提示符号下输入bpmedia –unfreeze –m a00001来使磁带解除冻结状态
  5. 在命令提示符号下输入vmquery –m a00001来查看磁带的归属状况
  6. 在命令提示符号下输入vmquery –deassignbyid a00001 4 0来取消磁带的分配日期
  7. 在命令提示符号下输入bprecover –l a00001 –d hcart来查看catalog磁带中的内容
  8. 在命令提示符号下输入bprecover –r a00001 –d hcart来恢复catalog
  9. 在命令提示符号下输入bpexpdate –backupid wbs_1039674374 –d 0来删除一个备份影像,其中wbs_1039674374是backupid,能够经过report中的Images on Media报告来查看backupid
  10. 如何收集NBU备份服务器的相关信息 查看并导出全部备份策略内容到c:bppllist1.txt: C:Program FilesVERITASNetBackupbinadmincmd>bppllist -allpolicies -L -verbose >c:bppllist1.txt
  11. 列出当前存储单元并导出内容到c:bpstulist1.txt: C:Program FilesVERITASNetBackupbinadmincmd>bpstulist -L -verbose >c:bpstulist1.txt
  12. 查看磁带使用状况并导出内容到c:available_media.txt: C:Program FilesVERITASNetBackupbingoodies>available_media >c:available_media.txt
  13. 查看磁带归属状况: 显示全部卷并导出内容到c:vmquery.txt: C:Program FilesVERITASVolmgrbin>vmquery -a >c:vmquery.txt
  14. 列出卷池并导出内容到c:vmpool.txt: C:Program FilesVERITASVolmgrbin>vmpool -listall >c:vmpool.txt
  15. 列出license导出内容到c:nbulicense.txt: C:Program FilesVERITASNetBackupbinadmincmd>bpminlicense -list_keys> c:nbulicense.txt 其它信息请用nbsupport170工具收集。方法是解压缩nbsupport170 .zip到备份服务器上某个临时文件夹,运行nbsupport.exe,而后在当前文件夹下的output中会生成一个.cab打包文件。全部与备份服务器运行相关的信息文件全在里面。 1六、bpexpdate过时磁带,报”requested media id is in use”错误解决办法

若是你确认这个media并无在使用,能够手工释放这个media占用的资源

首先使用/usr/openv/netbackup/bin/admincmd/nbrbutil -dump命令获得磁带占用资源的id

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump

Allocation Requests

(AllocationRequestSeq )

MDS allocations in EMM:

MdsAllocation: allocationKey=91666 jobType=1 mediaKey=4000261 mediaId=YZ5350 driveKey=2000012 driveName=HP.ULTRIUM4-SCSI.004 drivePath=/dev/nst0 stuName=nbumaster-hcart-robot-tld-0 masterServerName=nbumaster mediaServerName=nbumaster ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1

    MdsAllocation: allocationKey=91667 jobType=1 mediaKey=4000264 mediaId=YZ5353 driveKey=2000008 driveName=HP.ULTRIUM4-SCSI.000 drivePath=/dev/nst5 stuName=nbumaster-hcart-robot-tld-0 masterServerName=nbumaster mediaServerName=nbumaster ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1

nbumaster:~ #

而后使用/usr/openv/netbackup/bin/admincmd/nbrbutil –releaseMDS 即上面的“allocationKey=”后面相应的数值,来释放资源

这样咱们便能成功执行bpexpdate命令

1七、查询目前有哪些磁带正在被哪一个驱动器调用,以及正在运行哪些备份任务

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump

1八、列出全部的job的明细

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpdbjobs

将bpdbjobs输出到/tmp/bpdbjobs.txt文件中

bpdbjobs -file /tmp/bpdbjobs.txt

列出全部做业的摘要,可查看目前正处于ACTIVE的任务有多少个

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpdbjobs -summary

MASTER SERVER QUEUED REQUEUED ACTIVE SUCCESS PARTSUCC FAILED INCOMP SUSP WAITING_RETRY TOTAL

nbumaster 0 0 5 1320 0 43 0 0 0 1368

nbsupport170工具能够向veritas技术支持中心获取。


  1. Solaris下: /usr/openv/volmgr/bin/sgscan changer 查看本机全部Robot设备; /usr/openv/volmgr/bin/sgscan tape 查看本机全部的磁带驱动器。 /usr/openv/volmgr/bin/sgscan disk 查看本机全部的disk,包括本地磁盘和共享磁盘。

  2. robot及磁带驱动器配置: /usr/openv/volmgr/bin/tpconfig 提供add ,delete,list NBU能够识别并使用的物理设备。 /usr/openv/volmgr/bin/stopltid /usr/openv/volmgr/bin/stopltid <参数> :当修改配置后请重启:ltid(设备管理进程)。 tpconfig: 能够进入文本菜单。 先配置robot,再配置磁带驱动器。 /usr/openv/volmgr/bin/tpconfig -d 能够查看磁带驱动器及robot细节状况。 当配置完成以后,必定要重启ltid进程。 robtest

tpconfig -d Id DriveName Type Residence Drive Path Status


0 HP.ULTRIUM3-SCSI.000 hcart3 TLD(0) DRIVE=1 /dev/rmt/0cbn UP /dev/rmt/1cbn UP

Currently defined robotics are: TLD(0) robotic path = /dev/sg/c0tw500110a0009485aal1

EMM Server = dcd-bjgglc-logcdr

  1. 名词介绍: image: 镜像:一个客户端在一次备份中全部数据的集合。 storage unit: 存储单元:保存备份的逻辑位置,能够是磁盘也能够是磁带。 volume: 卷: 每个磁带一个编号,称为一个卷。 volume: 卷池:一组卷的集合,在备份时须要指明卷池,netbackup会自动维护卷池中的全部卷。 backup policy: 备份策略:4方面:数据保存在哪一个存储单元,什么时段运行,备份哪些client的数据; 须要备份的数据的位置。

  2. netbackup 进程维护 /usr/openv/netbackup/bin/bpps -a 查看netbackup 全部进程,也能够经过图形界面查看Daemons状态。 bp.kill_all 启动netbackup (netbackup stop) bp.start_all 中止netbackup (netbackup start)

jnbSA % 启动netbackup图形化界面.

  1. 磁带维护 /usr/openv/netbackup/bin/goodies/available_media: 以root用户运行,能够查看磁带的状态等等信息; status: full,active,available,frozen,dbbackup. 当有磁带frozen时,能够用:bpmedia -unfreeze -m A00006,对磁带进行解frozen; 当磁带反复frozen时,请检查是否有坏,或是此磁带是清洗带。

过时磁带: bpexpdate -m media_id -d 0 eg: bpexpdate -m NU06CU -d 0 使磁带可重写。 bpexpdate -backupid eel_0904219764 -d 0 删除备份

bpexpdate: -m -d

bplist:

bplist -C dcd-bjgglc-rac03-vip -t 4 -l -R 4表明oracle

bplist --help

bpmedialist -l: 查看磁带信息。

bplabel: 对磁带进行label : 有三种方式 :quick erase; long erase; NBU label; /usr/openv/netbackup/bin/admincmd/bplabel -erase -o -m -d hcart -p NetBackup -host /usr/openv/netbackup/bin/admincmd/bplabel -erase -l -o -m -d hcart -p NetBackup -host /usr/openv/netbackup/bin/admincmd/bplabel -m -d hcart -o -p NetBackup [-n drive_name | -u device_number] -host 对磁带label 能够检查,磁带是否有问题,时间也很快。

/usr/openv/netbackup/bin/admincmd/bpdbjobs -report /usr/openv/netbackup/bin/admincmd/bperror -U –problems 报告24小时内的问题。 /usr/openv/netbackup/bin/admincmd/bpgetconfig | more 得到netbackup的配置信息。 /usr/openv/netbackup/bin/bpclntcmd -hn Client_A 测试到某client是否有问题。

磁带的池: netbackup : 默认扫描到的磁带都放在此池;除clear带。 none: 默认放清洗带。 其余池能够手工建议:对一个策略创建一个池,从netbackup中找到数据带,分配到相应的策略池中。 并能够对分配完成的磁带进行label操做,能够检查磁带是否有问题。

6.管理维护: bpadm 能够进行平常维护用,而不用jnbSA 的图形化界面。

bpflist -d 2009-07-01 -e 2009-07-02 -policy dbbackup -client dcd-bjgglc-rac03-vip -U

这一句多是最有用的。

bpps -a

bpdbjobs -report 执行结果的状态问题: 0 :成功; 96: 没有空闲磁带可用。其余:

bpimage --help

bpflist --help

相关文章
相关标签/搜索