/ 中存储网

SAN设计-基于总线连接的被动存储(一)

2013-11-01 09:12:00 来源:中存储网

基于总线连接的被动存储

本书的第一部分主要讲述了SCSI存储技术,它是如今大多数开放系统服务存储技术的基础。并行SCSI使用了总线结构。在这种总线结构中,主机的I/O控制器和设备通过一条公用通讯总线进行连接。

在网络存储技术出现以前,没有太多必要去考虑服务器存储通信的结构。现在,存储网络技术已经出现并已投入使用,因此对传统并行SCSI存储和网络存储的结构差异进行比较就变得很有必要。工业分析家MichaelPeterson提出了总线连接存储(BAS)。他使用这种新概念来描述传统的并行SCSI,或更具体的说,IDE存储。总的来说,这是一个有用的概念。但这并不意味着他暗示NAS和SAN这些概念在以前已经被提出。总线绑定存储技术,简单地说,就是并行SCSI和IDE存储技术。

总线绑定技术曾经因作为一种包括很多大公司在内的大型工业的基础而达到成功的颠峰。这种技术被广泛应用,并为现存的、几乎所有开放系统服务上使用的存储系统提供连接。但同时,它也显示出一些无法满足变化的客户要求的危险信号。通常情况下,它无法提供足够灵活和可扩展的功能以满足如今对系统和存储快速布署的要求。

本节讲述了IT组织在传统的面向总线的存储技术中发现的主要的限制和缺点。在对现有存储技术的缺陷进行讨论之后,你将看到对SAN技术如何解决这些问题的简单说明。

传统的BAS设备和子系统通常被连接到一台单独的服务器上。尽管存在带双控制器的存储子系统,但第二个控制器通常被用于在一台独立服务器中和双重启动控制器同时工作,而不是绑定到另外的系统上,从而能提供高可靠性和更好的性能。从服务器的角度来看,BAS是一种一对多的关系。在这种关系中,一台主机和多个设备或子系统进行通信。

另外一种总述性的说法是,BAS设备和子系统从属于它们的控制主机。它们的身份、所进行的操作以及管理都被其连接的主机完全控制。例如,BAS设备和子系统由主机系统上的总线地址标识—和由单独的网络地址来标识的方法完全不同。更进一步的,如果主机系统没有进行初始化,数据传输将不会发生。存储管理也取决于基于主机的软件模块。这些模块将收集管理的信息,并将它们在总线上的存储设备和主机上的管理系统之间,或与网络上的另外一个系统之间进行传递。

存储技术的扩展局限性

BAS最主要的缺点之一在于:它不能同时针对容量和性能的要求进行扩展。

1.BAS技术的原始容量限制

每个系统中都存在性能的局限,它们决定了该系统能处理的数据量。而能被连接到一方服务器上的原始存储容量被三方面的因素所制约:

一个系统能支持的主机输入输出设备控制的数量。这由硬件中的插槽数量所限定,或由软件中操作系统所能访问的I/O路径数限定。

能被物理连接到每个主机的I/O控制器上的设备或子系统数目。

这些设备和子系统的总容量。

主机存储器和主机I/O总线的结构是为了平衡许多不同的要求而设计的。一般而言,增加主机支持的I/O控制器的数量会增加成本,并且它会增加处理器中断次数,从而对系统的CPU性能产生负面影响。主机I/O总线技术中的物理设备限制,如总线长度,也对能使用的总线I/O控制器的数量产生显著的影响。例如:PCI总线结构只能提供仅有几英寸的总线,最多只能有三个适配卡接在上面。由于这些原因,想建立一个能轻易支持多个主机I/O控制器的系统并不容易,代价也很高。

回顾并行SCSI结构的寻址能力,就像第2章中讨论的那样,窄带SCSI总线除了一个I/O主机控制器外,还可支持多达7个地址;宽带SCSI总线可支持15个地址。每个地址可支持16个LUN,而使用最普遍的设备,磁盘驱动器,通常在总线上被作为设备使用,而不是LUN。尽管15个设备3条总线看上去不少,但仍不足于满足存储量达1012数量级的系统的要求。更重要的是,BAS的性能是不完美的,因为当高优先级的应用抢去了多数可用总线带宽时,低优先级的总线地址和发起者会进入“饥饿”状态。

但这里需要关注的并不仅仅是系统。存储子系统也是根据BAS技术的极限而设计制造的。存储子系统的制造商能在那些有潜力比一个典型计算机系统支持更多内部SCSI总线的组件和设计方案中做出选择。当然,设计和制造BAS接口的存储子系统,也是一种挑战。这些接口将能使用相同的基础总线技术而获得更高的存储容量和相同或更好的性能。

每15个月磁盘驱动器的容量都大约会翻一番,这意味着它能获得75%的年增长率。尽管这一点很令人难忘,它仍赶不上IT或企业所处理的存储信息100%或更高的增长率的增长步伐。但是在这里我们真正要讨论的并不是单个磁盘驱动器的容量增长。关键在于设备的容量是有限的。

磁盘子系统有时会安装空的驱动器包以备将来的容量扩展。这意味着当更大容量出现时,可以安装这些磁盘。然而,我们不应该假设新出现的高容量磁盘会被厂家认证并支持。如果子系统已经挂满了磁盘,那么增加容量就要求增加新的子系统,或将现有的子系统替换为新的更高容量的子系统。换而言之,单个磁盘容量的增加对BAS技术总体带来了好处,但对任何已安装的系统没有任何帮助。

和那些支持桥和通过互联设备进行级联的数据网络技术不同,BAS技术不能通过桥接或连接的方法接到其他总线上,以进行实际的容量扩展。这并不是因为没有进行过这种尝试,而是因为BAS技术的设计本身就不允许这样做

2.BAS备份中的缺点

备份是存储技术中最基本的应用。不幸的是,由于在第7章中讨论的许多问题,在备份中使用BAS技术并不是非常有效。BAS的距离限制意味着备份设备和子系统必须在它们所连接的系统的数米范围之内。这给在分布式服务环境中重组介质和更换磁带带来了很大困难。为回避这些困难,人们设计出了能通过数据网络来路由备份数据的网络备份系统,但是这会导致网络上的严重拥塞。

通过主机系统CPU和存储总线执行任务的单发起者BAS导致了备份网络阻塞,在备份所运行的服务器上产生了很重的负荷。另外,设备到设备的传输操作又称为第三方拷贝,不能应用于高速、无服务器的备份系统。几年前,SCSI规范就声称在理论上支持它了。

对于IT专业人士而言,设备的最低限制是一个很严重的问题:使用基于总线连接的存储的备份也被公认为不能扩展以满足今天大规模网络安装的要求。在备份硬件和带库的能力已完全能胜任的同时,性能和距离扩展问题将存储问题推到了前沿,成为大型网络管理者们所面临的主要问题。

3.SAN中进行备份的扩展性优势

第10章最初看起来像是SAN和备份系统之间的“关键应用”。和BAS不同的是,SAN设备子系统在那些能使用集中式介质分组系统的多个服务器之间使用长距离连接。SAN还给备份提供了两大优势:将备份数据流从LAN中转移,并且清除通过主机系统CPU和存储总线进行的备份数据传输。

4.BAS在数据交换或数据发布上的不足

备份数据传输不能被视为广域系统所提出的、将数据在系统和存储设备及子系统之间传输的要求的一部分。数据仓库即一个很好的应用实例,通常有大量的数据需要由一个集中式系统传输到一些小型的分布式系统中。还有其他许多数据驱动的应用需要在系统之间交换式分发数据。

将要传输的数据数量可能会非常大,从而严重加重其相关网络和系统的负载。

如所提到的,第三方拷贝操作在理论上可由并行SCSI规范支持,但它通过一个共享的存储I/O总线连接到2个不同的服务器上时,实现第三方拷贝的操作几乎不可能。例如,通过一个多发起者存储总线连接的UNIX和WindowsNT系统来实现第三方拷贝就几乎没有希望。这意味着所有的数据传输必须经过一个“长距离的路由”,经过它们各自的主机I/O总线的控制器、系统存储总线、网络接口卡、协议堆栈,等等。尽管这不会明显限制系统的可扩展性,但能进行交换的数据量必须被限制,从而限制了系统的增长。