我在刚开始学习Netbackup的时候,没少走弯路。经常会遇到各种稀奇古怪的error信息,遇到报错会很慌张,急需一个解决问题的办法。跟无头苍蝇一样,会不加思索地把错误粘到百度上,希望赶紧查找一下有没有好的处理问题的方法。
今天就给大家列举Netbackup中,最经典的十大错误案例,并附有处理问题的解决思路和方法,希望能给刚入行一些帮助,今后再遇到任何报错,我们都可以很淡定地去处理。
学习任何一门技术的同时,其实就是自我修炼的过程。沉下心,尝试去拥抱技术的世界!
(在执行请求的操作的过程中,检测到一个可能需要更正操作的问题。)
解决方法:
1、确保该备份文件当前未被使用或修改。检查文件或目录路径的长度是否超过了1023个字符。无法打开文件。检查文件的权限或目录中是否有隐藏文件
如果是Archivelog备份,而且后续的备份均返回1。通常情况,需要进行Oracle数据库的Archivelog同步。
Oracle数据库Archivelog同步的方法为:
$su–oracle
$rman
RMAN>connecttarget/
RMAN>changearchivelogallvalidate;
RMAN>exit
如果是数据库在线全备份,需要查看备份脚本所在目录中的.out输出文件,查看哪部分没有备份成功,再进行相应处理。
(备份或存档操作未备份文件列表中的任何文件。
根据需要,执行以下操作:
在UNIX上,如果没有为LotusDominoServer启用存档式日志记录,则会发生此错误。如果正在对事务日志进行另一个备份操作,也会发生此错误。
客户端空间不足、卡进程、sql服务没有启动
出现在sql数据库,客户端名字带域名,去客户端设置里修改
看看磁盘使用情况
看看脚本是否正常(注册表)
看看客户端与SQL的连接是否已认证(SQL代理服务器)
(所出现的错误导致用户备份失败。)
验证您是否具有读取这些文件的权限。检查文件读取权限或Windows上的用户权限。
对于数据库扩展客户机(如NetBackupforOracle),这可能意味着控制备份的脚本出现问题。详细信息请查看脚本的Out文件和错误信息。
oracle归档问题,试试能否全备成功,oracle交叉验证
rmantarget/
allocatechannelformaintenancedevicetypediskconnect'sys/abc123@nfjd1';//改节点
crosscheckarchivelogall;
deleteforceexpiredarchivelogall;
也有可能是客户端验证失败,在netbackupclientservice重新验证一下。(.out文件报错ORA-03113)
也有可能是文件夹权限不足,开发/usr/openv文件夹权限后再进行oracle_link(.out文件报错ORA-19554)
(无法读取某个文件或套接字。)
可能的原因如下:
在NetBackup活动监视器中,详细状态日志可能包括如下类似消息:
12/05/201406:43:53-beginwriting
12/05/201406:48:53-Errorbpbrm(pid=2605)socketreadfailed:
errno=62-Timerexpired
12/05/201406:48:55-Errorbptm(pid=2654)mediamanagerterminated
byparentprocess
/NetBackup/logs/vxms日志可能包含类似如下VDDK消息的重复实例:
12/08/201405:11:35:g_vixInterfaceLogger:libvix.cpp:1844
[VFM_ESINFO]2014-12-08T05:11:35.146-06:00[7F1B1163F700infoLibs']
FILE:FileLockWaitForPossessiontimeouton'/var/log/vmware/hotAddLock.
dat.lck/M34709.lck'duetoalocalprocess'15882-26732358(bpbkarv)'
Mar2401:35:58bisonunix:WARNING:sn_alloccache:cache
/dev/rdsk/c0t2d0s3full-allsnapsusingthiscachearenow
unusable
该日志可能会指出下列情况:
如果磁盘是IDE驱动器,则在/usr/openv/netbackup/logs/bpfis日志中可能会看到下列内容:
get_disk_info:FTL-/var/tmp/caa026fEUdisk_inquiryfailed.
Errno=25:Inappropriateioctlfordevice
在/usr/openv/netbackup/logs/bpbkar日志中可能会出现下列内容:
bpbkar:INF-Processing/var
bpbkar:ERR-get_disk_info()failed,status13
bpbkar:ERR-tpc_get_disk_info()failed:err13
bpbkar:ERR-bpbkarFATALexitstatus=13:filereadfailed
bpbkar:INF-EXITSTATUS13:filereadfailed
要增大所有客户端的客户端读取超时,请在“NetBackup管理控制台”中,转到“主机属性”>“主服务器”>,双击主服务器,然后转到“属性”>“超时”。然后增大客户端读取超时。
在NetBackup管理控制台中,单击“NetBackup管理”>“主机属性”>双击主服务器>“超时”>“客户端读取超时”。
(系统函数gethostbyname()未能找到客户端的主机名。)
在下列位置验证客户端名称是否正确:
在UNIX客户端上,验证客户端的主机名是否在/etc/hosts文件、YPhosts文件或NIS映射中。
(客户机拒绝bpcd端口号上的连接。)
发生这种情况的原因可能是在该bpcd端口没有进程监听,或者因为到该bpcd端口的连接太多,超过了网络子系统使用listen()调用可以处理的数量。
(文件列表中的文件与客户机上的任何文件都不匹配。)
验证是否为此客户机指定了正确的文件列表。
在Windows客户机上,验证用来启动NetBackup客户机服务的帐户是否有读取这些文件的权限。
(以下是出现此状态码的可能原因:
NetBackup可能无法获取驱动器的卷ID。在此情况下,将不会备份任何虚拟机驱动器。备份失败,NetBackup状态码为156。
驱动器可能会关闭。
每次只能对一个虚拟机运行一个备份。如果在第一个备份处于活动状态时启动虚拟机的第二个备份,则第二个作业将失败,状态码为156。
推荐的操作:请等到第一个作业完成后再运行第二个作业。
NetBackup无法查找备份策略中列出的虚拟机的主机名或VM显示名称。详细状态日志可能包含以下错误消息:
Criticalbpbrm(pid=
FTL-snapshotcreationfailed,status156.)
如果虚拟机没有静态IP地址,可以将NetBackup配置为通过虚拟机的VM显示名称或UUID来识别虚拟机。不使用静态IP地址的环境包括群集和动态分配IP地址的网络等。
请注意,可能已将NetBackup配置为通过虚拟机的VM显示名称来识别虚拟机。在这种情况下,请确保显示名称是唯一的,且不包含特殊字符。
通过vCenterServer,NetBackup可以备份已关闭的虚拟机。必须为NetBackup提供用于访问vCenterServer的凭据。
如果NetBackup使用ESXServer(而不是vCenter)的凭据,则可能无法识别已关闭的虚拟机。请注意以下几点:
如果具有独立磁盘的虚拟机处于暂停状态,则快照作业将失败。作业详细信息日志中将出现类似下面的消息:
01/12/201517:11:37-Criticalbpbrm(pid=10144)fromclient
memorysnapshot,sincethevirtualmachineisconfiguredwith
independentdisks.
解决方法是,将虚拟机的状态更改为打开或关闭,然后重新运行备份。
注意:
不能使用快照捕获独立磁盘中的数据。将会备份虚拟机的其余数据。
将忽略RDM(不备份),并重新创建任一独立磁盘,但该磁盘是空的。
如果尝试创建虚拟机的快照超出10秒的VMware超时,快照将失败,并显示NetBackup状态156。如果虚拟机配置了大量的卷,可能会发生该超时。请注意,即使禁用“虚拟机静默”选项,仍可能会遇到超时问题。
执行以下操作之一:
没有vmdk文件的虚拟机可以出现在vCenterSiteRecoveryManager(SRM)环境中。如果复制虚拟机从未处于活动状态,则它处于被动模式,且可能没有vmdk文件。
您可以在策略的“VMware高级属性”选项卡上启用“忽略无盘VM”选项。如果启用此选项:在SRM环境中,如果该虚拟机没有vmdk文件,NetBackup就不会备份复制(被动)虚拟机。
只要发生VMware快照,就会为每个vmdk创建一个delta.vmdk文件。如果单个vmdk文件存在32个或更多此类增量文件,则NetBackup对该VM的备份可能会失败(状态为156)。NetBackup活动监视器的作业详细信息包含类似以下内容的消息:
02/06/201510:33:17-Criticalbpbrm(pid=15799)from
clientfl5vm1_2012:FTL-vSphere_freeze:Unabletoproceedwith
snapshotcreation,toomanyexistingdeltafiles(44).
02/06/201510:33:17-Criticalbpbrm(pid=15799)fromclient
fl5vm1_2012:FTL-VMware_freeze:VIXAPIfreeze(VMwaresnapshot)
failedwith25:SYM_VMC_FAILED_TO_CREATE_SNAPSHOT
fl5vm1_2012:FTL-vfm_freeze:method:VMware_v2,type:FIM,
function:VMware_v2_freeze
要备份VM,请执行以下操作:
在VMware界面中,右键单击VM并选择“快照”>“合并”。有关更多信息,请参见VMware文档。
如果NetBackup策略可用于虚拟机静默(默认),vSphere中的VMware快照操作将启动虚拟机静默。如果快照静默失败,则NetBackup作业失败,状态为156。
请参见下列指南之一的“故障排除”一节:
如有必要,提高日志记录级别并重试该作业。
(备份调度程序对其进行排队的备份或归档操作没有尝试执行,因为备份时段不再打开。)
请检查是否有进程卡死,一直占用驱动器。
如果有重启备份服务器或介质服务器的服务,重试备份。
消息:资源请求失败
(nbjm进程无法获取作业所需的资源。此状态码附带有EMM原因字符串,该字符串出现在活动监视器的作业详细信息屏幕中以及nbjm调试日志中。EMM原因字符串确定失败的资源请求的原因。)
找到EMM原因字符串,更正问题,然后重新运行该作业。
对于某些通用的EMM原因字符串(如“磁盘卷已关闭”),可能需要生成某些报告来确定失败原因。可以通过在“NetBackup管理控制台”中使用bperror或者各种日志条目报告(如“报告”>“磁盘报告”>“磁盘日志”)来生成此类报告。
今后还会继续总结Netbackup中的各种报错处理思路与方法,希望跟各位老铁们,同学们一起努力。多沟通多交流!