磁带卡在磁带机里不能够弹出:
1.在磁带使用之前检查磁带引导针的位置:
在新磁带使用之前,应该检查所有LTO或3592磁带的引导针。确保它在正确的位置。如果发现其位置不正确,应该将其调整倒正确的位置(如下图)。可以使用人工卷带工具(P/N LTO=08L9129 3592=18P888)来调整。
具体操作步骤,可以参照《TS2340 3580 L43S43 Setup Operator Service Guide>> GC27-2103中的第4章的:Using Ultrium Media --Repositioning or Reattaching a Leader Pin.。
<=== 正确的位置
2.检查是否主机曾经发过“PREVENT MEDIUM REMOVAL”的命令
这个命令通常是由主机端的某些应用程序发出的。如果有类似的问题,可以先从应用程序端发出包含有“ALLOW MEDIUM REMOVAL”的命令,然后再从主机端去EJECT磁带。如果磁带还是不能弹出来,则将磁带机重起。然后再手工方式弹出磁带。
3.当需要人工方式取出磁带机理的磁带时
当需要人工方式取出磁带机理的磁带时,根据情况使用以下的步骤:
1)从主机端发出EJECT磁带的命令。
2)按磁带机上的蓝色unload按钮1秒钟。
3)按磁带机上的unload按钮15秒钟,磁带机会reset,然后再按unload按钮1秒钟。
4)将磁带机或磁带库下电/上电,然后再按unload按钮1秒钟。
磁带有关的故障:
1.一些磁带机进带故障和磁带的引导针的位置不正确有关系。可以参照前一节的介绍检查和调整引导针的位置。
2.关于处理磁带问题,遵循以下的步骤:
1)尝试再另一个磁带机load/unload怀疑有问题的磁带。
2)检查磁带是否有物理的损坏。
3)检查磁带引导针的位置是否正确。
4)如果怀疑有问题的磁带是空白的或者里面的数据不再需要的情况下,可以使用磁带机对磁带进行诊断:
在LTO磁带机的面板上“Maintenance Mode” drive diagnostic option '1'+ Diagnostic option 'E' (Test Cartridge & Media )
具体步骤参照《IBM TS2340 3580-L43 S43 Gen4 Tape Drive Tape Drive Setup, Operator, and Service Guide 》 GC27_2103 Appendix B. Diagnostic and Maintenance Functions.
3.磁带的运输和储存:
如果客户需要储存或者运输磁带,要使用符合规定的储存箱储存和运输,参照以下的weblink:
http://www-1.ibm.com/support/docview.wss?uid=ssg1S1001388&rs=546
符合标准的储存箱的信息参照一下的weblink:
http://www.turtlecase.com
4.LTO磁带机的兼容性:
LTO的磁带机可以读/写前一代的磁带(例如LTO4代磁带机可以读/写 LTO4和LTO3代的磁带)。
LTO磁带及可以读前2代的磁带(例如LTO4代磁带机可以读LTO4、LTO3和LTO2代的磁带)。
所以LTO1代的磁带是不可以在LTO4代的磁带机中使用的。
磁带机读/写有关的故障:
1.确保磁带机的firmware是最新推荐的版本:
通过RMSS PFE的weblink查找firmware信息:
http://snjlnt02.tucson.ibm.com/tape/tapetec.nsf/pages/opensystems
http://snjlnt02.tucson.ibm.com/tape/tapetec.nsf/pages/codematrix
通过Internet查找firmware的信息:
http://www-304.ibm.com/systems/support/supportsite.wss/selectproduct?brandind=5000034&familyind=0&oldbrand=0&oldfamily=0&oldtype=0&taskind=2&psid=ap
SSR可以通过ITDT(IBM Tape Diagnostic Tool)的工具或磁带机的驱动程序的工具在主机端进行firmware的升级。
ITDTv2.0:
不再支持3580 GEN1 and GEN2, 3581, 3582, and 3583
http://www-01.ibm.com/support/docview.wss?rs=543&context=STCVQ6R&dc=D400&q1=3580+firmware&uid=ssg1S4000662&loc=en_US&cs=utf-8&lang=en
ITDT v1.2:
http://www-01.ibm.com/support/docview.wss?rs=1140&context=STCXRHW&dc=D410&q1=ssg1*&uid=ssg1S4000338&loc=en_US&cs=utf-8&lang=en
2.隔离是否是磁带的问题:
1)尝试用磁带机load/unload,read/write一盘全新的磁带来隔离问题。
2)参照第一章中的有关磁带的问题的方法隔离问题。
3.隔离磁带机硬件方面的问题:
1)尝试将用另一个磁带机对磁带进行读/写操作来隔离问题。
2)使用ITDT的工具进行磁带机的诊断测试。
3)尝试用磁带机(库)操作面板上的maintenance菜单进行诊断测试。
如果以上的硬件测试能够通过,证明磁带没有问题,不需要更换磁带机。
磁带机和主机连接的问题:
1.磁带机和主机通过SCSI连接:
1)检查SCSI连接头的针和孔是否有异常,特别是68针的接头。针脚是否有过短、弯曲等问题。
2)简化SCSI的连接方式进行测试。例如在一个SCSI的总线上只接一个磁带机。
3)检查LVD/HVD SCSI终结器(terminator),确保终结器正确地使用。
4)尝试更换SCSI电缆和SCSI的终结器来检查问题。
5)检查主机端的SCSI卡是否和磁带机兼容,或尝试更换主机端的SCSI卡来检查问题。
6)在磁带机(库)上运行SCSI连接接口的诊断:
-运行基本的SCSI诊断
-在LTO磁带机(库)的“Maintenance mode”下运行“Host Interface Wrap test diagnostic”(参照《IBM TS2340 3580-L43 S43 Gen4 Tape Drive Tape Drive Setup, Operator, and Service Guide》GC27_2103的附录B)
7)如果已经完成了以上的诊断工作,而且更换过SCSI的电缆,运行ITDT工具的磁带机诊断扫描操作,验证SCSI的连接是否正常。
如果完成了以上的操作,而且“Host Interface Wrap test diagnostic”是正常的,但和主机端的连接还是有问题,不要更换更换磁带机(库)。参照以下的章节,收集相关的数据,向上一级技术支持寻求帮助。
2.磁带机和主机通过SAN/FC连接:
1)简化FC的连接,尝试将由问题的磁带机(库)直接和主机进行连接。
2)更换FC的光纤电缆。
3)检查主机的FC卡是否设置了更长时间的timeout以适应和磁带机设备连接。
4)检查主机端的FC卡是否和磁带机兼容,或尝试更换主机端的FC卡来检查问题。
5)在磁带机(库)上运行FC连接接口的诊断。(方法同上)
6)如果已经完成了以上的诊断工作,而且更换过FC的电缆,运行ITDT工具的磁带机诊断扫描操作,验证FC的连接是否正常。
如果完成了以上的操作,而且“Host Interface Wrap test diagnostic”是正常的,但和主机端的连接还是有问题,不要更换更换磁带机(库)。参照以下的章节,收集相关的数据,向上一级技术支持寻求帮助。
3.AIX服务器直接连接LTO磁带机(库)重起后设备成“define”状态:
IBM的LTO3或LTO4代的磁带机(库)和AIX服务器直接连接。当服务器power off/power on或重起后,磁带机(库)的设备rmtX和smcX不能够在设备配置中找到。用lsdev –Cc命令查看时,没有显示或成define的状态。这时需要重新启动或power off/power on磁带机(库),重新初始化FC连接。
4.LTO磁带库(LUN-1磁带机)连接的问题:
在绝大部分的LTO或3592的磁带中,都有机械抓手(autochanger)设备通过FC或SCSI和主机连接。它是通过有Control Path的磁带机的LUN-1被主机识别的。当磁带库和主机连接时,磁带机设备能正常地连接,但机械抓手设备不正常时:
如果是3581 3582 3583 3573......的磁带库,设置成了“Sequential mode”。磁带库则不会将LUN-1给机械抓手,让主机认到。3582 + 3581 (2U models)出厂时就是“Random mode”,所以可以被主机认到。
所以当需要由主机来控制机械抓手时,磁带库应设置成为“Random mode”。
5.磁带机(库)设备和磁盘设备要使用不同的FC连接:
在有SAN交换机连接的环境中,确保磁带机(库)设备和磁盘设备没有共享一块FC卡。
对于磁带机(库)和磁盘设备的连接,FC和SCSI卡会有包括timeout值在内的不同的参数设置。如果共享,这个参数设置通常对磁带机(库)和磁盘的访问都会产生问题。
6.多个主机连接访问同一个磁带机:
对于多个主机连接访问同一个磁带机,如果他们通过SAN交换机连接,而且在同一个ZONE里,会产生问题:
如果多个主机在同一个zone里面,当其中一个主机重起时,它会发起一个“IOINIT”的操作。会使得整个HBA的总线reset。而位于整个总线上的设备对于reset会有不同的反应。磁带机中如果有磁带,当收到这个reset时,会执行一个倒带(rewind)操作。无论此时磁带机在作什么操作此时都会中止。因为reset是更高级别的命令。如果此时另一个连接此磁带机的主机正在对磁带进行读/写操作,这个主机不会收到倒带的信息。当磁带倒到开始时,它会继续从磁带的开始部位进行读/写操作。这样将会导致数据的丢失。
7.iSeries主机不能识别TS3310的磁带库:
当3576磁带库power off时,和iSeries主机连接的IOP将会被reset。为了保证3576能被正常地使用,当iSeries主机的IOP要reset时,确保3576是power on的状态。
8.Xseries Configuration and Option Guide (COG)
Xseries Configuration and Option Guide (COG)里面可以查到和xSeries主机兼容的磁带机(库)的信息:
http://www-03.ibm.com/systems/xbc/cog/
System Storage InterOperationCenter (SSIC)
System Storage InterOperationCenter (SSIC)里面可以查到所有IBM的存储产品的兼容性信息:
http://www-03.ibm.com/systems/support/storage/config/ssic/displayesssearchwithoutjs.wss?start_over=yes,