/ 中存储网

IBM 磁带机日常使用常见问题解决方法汇总

2016-03-09 14:23:58 来源:中存储

磁带卡在磁带机里不能够弹出:

1.在磁带使用之前检查磁带引导针的位置:

在新磁带使用之前,应该检查所有LTO或3592磁带的引导针。确保它在正确的位置。如果发现其位置不正确,应该将其调整倒正确的位置(如下图)。可以使用人工卷带工具(P/N LTO=08L9129 3592=18P888)来调整。

具体操作步骤,可以参照《TS2340 3580 L43S43 Setup Operator Service Guide>> GC27-2103中的第4章的:Using Ultrium Media --Repositioning or Reattaching a Leader Pin.。

<=== 正确的位置 

2.检查是否主机曾经发过“PREVENT MEDIUM REMOVAL”的命令

这个命令通常是由主机端的某些应用程序发出的。如果有类似的问题,可以先从应用程序端发出包含有“ALLOW MEDIUM REMOVAL”的命令,然后再从主机端去EJECT磁带。如果磁带还是不能弹出来,则将磁带机重起。然后再手工方式弹出磁带。

3.当需要人工方式取出磁带机理的磁带时

当需要人工方式取出磁带机理的磁带时,根据情况使用以下的步骤:

1)从主机端发出EJECT磁带的命令。

2)按磁带机上的蓝色unload按钮1秒钟。

3)按磁带机上的unload按钮15秒钟,磁带机会reset,然后再按unload按钮1秒钟。

4)将磁带机或磁带库下电/上电,然后再按unload按钮1秒钟。

磁带有关的故障:

1.一些磁带机进带故障和磁带的引导针的位置不正确有关系。可以参照前一节的介绍检查和调整引导针的位置。

2.关于处理磁带问题,遵循以下的步骤:

1)尝试再另一个磁带机load/unload怀疑有问题的磁带。

2)检查磁带是否有物理的损坏。

3)检查磁带引导针的位置是否正确。

4)如果怀疑有问题的磁带是空白的或者里面的数据不再需要的情况下,可以使用磁带机对磁带进行诊断:

在LTO磁带机的面板上“Maintenance Mode” drive diagnostic option '1'+ Diagnostic option 'E' (Test Cartridge & Media )

具体步骤参照《IBM TS2340 3580-L43 S43 Gen4 Tape Drive Tape Drive Setup, Operator, and Service Guide 》 GC27_2103 Appendix B. Diagnostic and Maintenance Functions.

3.磁带的运输和储存:

如果客户需要储存或者运输磁带,要使用符合规定的储存箱储存和运输,参照以下的weblink:

http://www-1.ibm.com/support/docview.wss?uid=ssg1S1001388&rs=546

符合标准的储存箱的信息参照一下的weblink:

http://www.turtlecase.com

4.LTO磁带机的兼容性:

LTO的磁带机可以读/写前一代的磁带(例如LTO4代磁带机可以读/写 LTO4和LTO3代的磁带)。

LTO磁带及可以读前2代的磁带(例如LTO4代磁带机可以读LTO4、LTO3和LTO2代的磁带)。

所以LTO1代的磁带是不可以在LTO4代的磁带机中使用的。

磁带机读/写有关的故障:

1.确保磁带机的firmware是最新推荐的版本:

通过RMSS PFE的weblink查找firmware信息:

http://snjlnt02.tucson.ibm.com/tape/tapetec.nsf/pages/opensystems

http://snjlnt02.tucson.ibm.com/tape/tapetec.nsf/pages/codematrix

通过Internet查找firmware的信息:

http://www-304.ibm.com/systems/support/supportsite.wss/selectproduct?brandind=5000034&familyind=0&oldbrand=0&oldfamily=0&oldtype=0&taskind=2&psid=ap

SSR可以通过ITDT(IBM Tape Diagnostic Tool)的工具或磁带机的驱动程序的工具在主机端进行firmware的升级。

ITDTv2.0:

不再支持3580 GEN1 and GEN2, 3581, 3582, and 3583

http://www-01.ibm.com/support/docview.wss?rs=543&context=STCVQ6R&dc=D400&q1=3580+firmware&uid=ssg1S4000662&loc=en_US&cs=utf-8&lang=en

ITDT v1.2:

http://www-01.ibm.com/support/docview.wss?rs=1140&context=STCXRHW&dc=D410&q1=ssg1*&uid=ssg1S4000338&loc=en_US&cs=utf-8&lang=en

2.隔离是否是磁带的问题:

1)尝试用磁带机load/unload,read/write一盘全新的磁带来隔离问题。

2)参照第一章中的有关磁带的问题的方法隔离问题。

3.隔离磁带机硬件方面的问题:

1)尝试将用另一个磁带机对磁带进行读/写操作来隔离问题。

2)使用ITDT的工具进行磁带机的诊断测试。

3)尝试用磁带机(库)操作面板上的maintenance菜单进行诊断测试。

如果以上的硬件测试能够通过,证明磁带没有问题,不需要更换磁带机。

磁带机和主机连接的问题:

1.磁带机和主机通过SCSI连接:

1)检查SCSI连接头的针和孔是否有异常,特别是68针的接头。针脚是否有过短、弯曲等问题。

2)简化SCSI的连接方式进行测试。例如在一个SCSI的总线上只接一个磁带机。

3)检查LVD/HVD SCSI终结器(terminator),确保终结器正确地使用。

4)尝试更换SCSI电缆和SCSI的终结器来检查问题。

5)检查主机端的SCSI卡是否和磁带机兼容,或尝试更换主机端的SCSI卡来检查问题。

6)在磁带机(库)上运行SCSI连接接口的诊断:

-运行基本的SCSI诊断

-在LTO磁带机(库)的“Maintenance mode”下运行“Host Interface Wrap test diagnostic”(参照《IBM TS2340 3580-L43 S43 Gen4 Tape Drive Tape Drive Setup, Operator, and Service Guide》GC27_2103的附录B)

7)如果已经完成了以上的诊断工作,而且更换过SCSI的电缆,运行ITDT工具的磁带机诊断扫描操作,验证SCSI的连接是否正常。

如果完成了以上的操作,而且“Host Interface Wrap test diagnostic”是正常的,但和主机端的连接还是有问题,不要更换更换磁带机(库)。参照以下的章节,收集相关的数据,向上一级技术支持寻求帮助。

2.磁带机和主机通过SAN/FC连接:

1)简化FC的连接,尝试将由问题的磁带机(库)直接和主机进行连接。

2)更换FC的光纤电缆。

3)检查主机的FC卡是否设置了更长时间的timeout以适应和磁带机设备连接。

4)检查主机端的FC卡是否和磁带机兼容,或尝试更换主机端的FC卡来检查问题。

5)在磁带机(库)上运行FC连接接口的诊断。(方法同上)

6)如果已经完成了以上的诊断工作,而且更换过FC的电缆,运行ITDT工具的磁带机诊断扫描操作,验证FC的连接是否正常。

如果完成了以上的操作,而且“Host Interface Wrap test diagnostic”是正常的,但和主机端的连接还是有问题,不要更换更换磁带机(库)。参照以下的章节,收集相关的数据,向上一级技术支持寻求帮助。

3.AIX服务器直接连接LTO磁带机(库)重起后设备成“define”状态:

IBM的LTO3或LTO4代的磁带机(库)和AIX服务器直接连接。当服务器power off/power on或重起后,磁带机(库)的设备rmtX和smcX不能够在设备配置中找到。用lsdev –Cc命令查看时,没有显示或成define的状态。这时需要重新启动或power off/power on磁带机(库),重新初始化FC连接。

4.LTO磁带库(LUN-1磁带机)连接的问题:

在绝大部分的LTO或3592的磁带中,都有机械抓手(autochanger)设备通过FC或SCSI和主机连接。它是通过有Control Path的磁带机的LUN-1被主机识别的。当磁带库和主机连接时,磁带机设备能正常地连接,但机械抓手设备不正常时:

如果是3581 3582 3583 3573......的磁带库,设置成了“Sequential mode”。磁带库则不会将LUN-1给机械抓手,让主机认到。3582 + 3581 (2U models)出厂时就是“Random mode”,所以可以被主机认到。

所以当需要由主机来控制机械抓手时,磁带库应设置成为“Random mode”。

5.磁带机(库)设备和磁盘设备要使用不同的FC连接:

在有SAN交换机连接的环境中,确保磁带机(库)设备和磁盘设备没有共享一块FC卡。

对于磁带机(库)和磁盘设备的连接,FC和SCSI卡会有包括timeout值在内的不同的参数设置。如果共享,这个参数设置通常对磁带机(库)和磁盘的访问都会产生问题。

6.多个主机连接访问同一个磁带机:

对于多个主机连接访问同一个磁带机,如果他们通过SAN交换机连接,而且在同一个ZONE里,会产生问题:

如果多个主机在同一个zone里面,当其中一个主机重起时,它会发起一个“IOINIT”的操作。会使得整个HBA的总线reset。而位于整个总线上的设备对于reset会有不同的反应。磁带机中如果有磁带,当收到这个reset时,会执行一个倒带(rewind)操作。无论此时磁带机在作什么操作此时都会中止。因为reset是更高级别的命令。如果此时另一个连接此磁带机的主机正在对磁带进行读/写操作,这个主机不会收到倒带的信息。当磁带倒到开始时,它会继续从磁带的开始部位进行读/写操作。这样将会导致数据的丢失。

7.iSeries主机不能识别TS3310的磁带库:

当3576磁带库power off时,和iSeries主机连接的IOP将会被reset。为了保证3576能被正常地使用,当iSeries主机的IOP要reset时,确保3576是power on的状态。

8.Xseries Configuration and Option Guide (COG)

Xseries Configuration and Option Guide (COG)里面可以查到和xSeries主机兼容的磁带机(库)的信息:

http://www-03.ibm.com/systems/xbc/cog/

System Storage InterOperationCenter (SSIC)

System Storage InterOperationCenter (SSIC)里面可以查到所有IBM的存储产品的兼容性信息:

http://www-03.ibm.com/systems/support/storage/config/ssic/displayesssearchwithoutjs.wss?start_over=yes,