/ 中存储网

存储进阶:教你几种常见存储备份系统

2010-05-31 15:38:07 来源:中存储网

Host-Based备份结构的优点是数据传输速度快,备份管理简单;缺点是不利于备份系统的共享,不 适合于现在大型的数据备份要求。

LAN-Based备份方式:

LAN-Based备份,在该系统中数据的传输是以网络为基础的。其中配置一台服务器作为备份服务器, 由它负责整个系统的备份操作。磁带库则接在某台服务器上,在数据备份时备份对象把数据通过网络传输到磁带库中实现备份的。

LAN-Based备份结构的优点是节省投资、磁带库共享、集中备份管理;它的缺点是对网络传输压力 大。

LAN-Free备份方式:

LAN-Free和Server-Free的备份系统是建立在SAN(存储区域网)的基础上的,其结构 如下图所示。基于SAN的备份是一种彻底解决传统备份方式需要占用LAN带宽问题的解决方案。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立 的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,是一种无需占用网络带宽 (LAN-Free) 的解决方案。

目前随着SAN技术的不断进步,LAN-Free的结构已经相当成熟,而Server-Free的备份 结构则不太成熟。

LAN-Free的优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是投资 高。

利用IBM Tivoly Storage Manager软件,配合IBM LTO等磁带库产品,可以实现以上各种备份方式。

数据备份方式的选择

目前数据备份主要方式有:LAN 备份、LAN Free备份和SAN Server-Free备份三种。LAN 备份针对所有存储类型都可以使用, LAN Free备份和SAN Server-Free备份只能针对SAN架构的存储。

基于LAN备份 传统备份需要在每台主机上安装磁带机备份本机系统,采用LAN备份策略,在数据量不是很大时候,可采用集中备份。一台中央备份服务器将会安装在 LAN 中,然后将应用服务器和工作站配置为备份服务器的客户端。中央备份服务器接受运行在客户机上的备份代理程序的请求,将数据通过 LAN 传递到它所管理的、与其连接的本地磁带机资源上。这一方式提供了一种集中的、易于管理的备份方案,并通过在网络中共享磁带机资源提高了效率。

LAN-Free备份 由于数据通过LAN传播,当需要备份的数据量较大,备份时间窗口紧张时,网络容易发生堵塞。在SAN环境下,可采用存储网络的LAN-Free备份,需要 备份的服务器通过SAN连接到磁带机上,在LAN-Free备份客户端软件的触发下,读取需要备份的数据,通过SAN备份到共享的磁带机。这种独立网络不 仅可以使 LAN 流量得以转移,而且它的运转所需的 CPU 资源低于 LAN 方式,这是因为光纤通道连接不需要经过服务器的 TCP/IP 栈,而且某些层的错误检查可以由光纤通道内部的硬件完成。在许多解决方案中需要一台主机来管理共享的存储设备以及用于查找和恢复数据的备份数据库。

SAN Server-Free备份 LAN Free备份对需要占用备份主机的CPU资源,如果备份过程能够在SAN内部完成,而大量数据流无需流过服务器,则可以极大降低备份操作对生产系统的影 响。SAN Server-Free备份就是这样的技术。

目前主流的备份软件,如IBM Tivoli 、Veritas,均支持上述三种备份方案。三种方案中,LAN备份数据量最小,对服务器资源占用最多,成本最低;LAN free备份数据量大一些,对服务器资源占用小一些,成本高一些;SAN Server-free备份方案能够在短时间备份大量数据,对服务器资源占用最少,但成本最高。中小客户可根据实际情况选择。

传统备份:黔驴技穷无奈何

在传统的备份模式下,每台主机都配备专用的存储磁盘或磁带系统,主机中的数据必须备份到位于本地的专用 磁带设备或盘阵中。这样,即使一台磁带机(或磁带库)处于空闲状态,另一台主机也不能使用它进行备份工作,磁带资源利用率较低。另外,不同的操作系统平台 使用的备份恢复程序一般也不相同,这使得备份工作和对资源的总体管理变得更加复杂。

后来,产生一种克服专用磁带系统利用率低的改进办法:即磁带资源由一个主备份/恢复服务器控制,而备份 和恢复进程由一些管理软件来控制。主备份服务器接收其他服务器通过局域网或广域网发来的数据,并将其存入公用磁盘或磁带系统中。这种集中存储的方式极大地 提高了磁带资源的利用效率。但它也存在一个致命的不足:网络带宽将成为备份和恢复进程中的潜在瓶颈。

有没有一种更先进的解决方案,在备份的时候尽可能减小对系统资源的消耗,同时又保证系统的高可用性和灵 活性呢?

LAN-free备份:平平常常第一招儿

办法之一是采用LAN-free技术。所谓LAN-free,是指数据不经过局域网直接进行备份,即用 户只需将磁带机或磁带库等备份设备连接到SAN中,各服务器就可把需要备份的数据直接发送到共享的备份设备上,不必再经过局域网链路。由于服务器到共享存 储设备的大量数据传输是通过SAN网络进行的,局域网只承担各服务器之间的通信(而不是数据传输)任务。

2种常见的实施手段

LAN-free有多种实施方式。通常,用户都需要为每台服务器配备光纤通道适配器,适配器负责把这些 服务器连接到与一台或多台磁带机(或磁带库)相连的SAN上。同时,还需要为服务器配备特定的管理软件,通过它,系统能够把块格式的数据从服务器内存、经 SAN传输到磁带机或磁带库中。

还有一种常用的LAN-free实施办法,在这种结构中,主备份服务器上的管理软件可以启动其他服务器 的数据备份操作。块格式的数据从磁盘阵列通过SAN传输到临时存储数据的备份服务器的内存中,之后再经SAN传输到磁带机或磁带库中。

LAN-free备份不足之处

“人无完人”,LAN-free技术也存在明显不足。首先,它仍旧让服务器参与了将备份数据从一个存储 设备转移到另一个存储设备的过程,在一定程度上占用了宝贵的CPU处理时间和服务器内存。还有一个问题是,LAN-free技术的恢复能力差强人意,它非 常依赖用户的应用。许多产品并不支持文件级或目录级恢复,映像级恢复就变得较为常见。映像级恢复就是把整个映像从磁带拷回到磁盘上,如果您需要快速恢复某 一个文件,整个操作将变得非常麻烦。

此外,不同厂商实施的LAN-free机制各不相同,这还会导致备份过程所需的系统之间出现兼容性问 题。

LAN-free的实施比较复杂,而且往往需要大笔软、硬件采购费。

无服务器备份:锦上添花第二招儿

另外一种减少对系统资源消耗的办法是采用无服务器(Serverless)备份技术。它是LAN- free的一种延伸,可使数据能够在SAN结构中的两个存储设备之间直接传输,通常是在磁盘阵列和磁带库之间。这种方案的主要优点之一是不需要在服务器中 缓存数据,显著减少对主机CPU的占用,提高操作系统工作效率,帮助企业完成更多的工作。

2种常见的实施手段

与LAN-free一样,无服务器备份也有几种实施方式。通常情况下,备份数据通过名为数据移动器的设备从磁盘阵列传输到磁带库上。该设备可能是光 纤通道交换机、存储路由器、智能磁带或磁盘设备或者是服务器。数据移动器执行的命令其实是把数据从一个存储设备传输到另一个设备。实施这个过程的一种方法 是借助于SCSI-3的扩展拷贝命令,它使服务器能够发送命令给存储设备,指示后者把数据直接传输到另一个设备,不必通过服务器内存。数据移动器收到扩展 拷贝命令后,执行相应功能。

另一种方法就是利用网络数据管理协议(NDMP)。这种协议实际上为服务器、备份和恢复应用及备份设备等部件之间的通信充当一种接口。在实施过程 中,NDMP把命令从服务器传输到备份应用中,而与NDMP兼容的备份软件会开始实际的数据传输工作,且数据的传输并不通过服务器内存。NDMP的目的在 于方便异构环境下的备份和恢复过程,并增强不同厂商的备份和恢复管理软件以及存储硬件之间的兼容性。

无服务器备份的优势

无服务器备份与LAN-free备份有着诸多相似的优点。如果是无服务器备份,源设备、目的设备以及SAN设备是数据通道的主要部件。虽然服务器仍 参与备份过程,但负担大大减轻,因为它的作用基本上类似交警,只用于指挥,不用于装载和运输,不是主要的备份数据通道。

无服务器备份技术具有缩短备份及恢复所用时间的优点。因为备份过程在专用高速存储网络上进行,而且决定吞吐量的是存储设备的速度,而不是服务器的处 理能力,所以系统性能将大为提升。此外,如果采用无服务器备份技术,数据可以数据流的形式传输给多个磁带库或磁盘阵列。

至于缺点,虽然服务器的负担大为减轻,但仍需要备份应用软件(以及其主机服务器)来控制备份过程。元数据必须记录在备份软件的数据库上,这仍需要占 用CPU资源。

与LAN-free一样,无服务器备份可能会导致上面提到的同样类型的兼容性问题。而且,无服务器备份可能难度大、成本高。最后,如果无服务器备份 的应用要更广泛,恢复功能方面还有待更大改进。

平衡利弊再定夺

前面我们讨论了光纤通道环境下的LAN-free和无服务器备份技术,由于有些结构集成了基于IP的技术,譬如iSCSI,特别是随着将来IP存储 技术在存储网络中占有的强劲优势,LAN-free和无服务器备份技术应用的解决方案将会变得更为普遍。

LAN-free和无服务器备份并非适合所有应用。如果您拥有的大型数据存储库必须7×24随时可用,无服务器备份或许是不错的选择。但必须确保您 已经清楚恢复过程需要多长时间,因为低估了这点会面临比开始更为严重的问题。

另一方面,如果您拥有的大小适中的数据库可以容忍一定的停机时间,那么传统的备份和恢复技术也许是您比较不错的选择。

没有了