作者:NetApp公司 David A. Chapa 和 Nathan Moffitt
全面的数据保护所需要的远不止于备份和恢复功能。为了保护关键业务数据的可存取性,您有必要考虑:高可用性,灾难恢复,业务连续性,存档和法规兼容。
您也许依靠各种解决方案来提供这些功能。您也许选择用一个厂商的解决方案实现高可用性,用第二个厂商的解决方案满足备份和恢复需求,再用另一个实现业务连续性,然后是又一个实现归档。结果是非常复杂的管理和巨额费用。
集成式数据保护战略将关键数据保护功能转移到存储系统中,减轻了上述复杂性,使您能够对准更加积极的恢复点目标(RPO)和恢复时间目标(RTO),同时降低成本,并最大限度地减少额外的管理开销。
本文说明什么是集成式数据保护,并就识别新的和有变化的文件以及移动和存储数据而言,对集成式数据保护流程与传统数据保护方法加以比较。本文还探讨集成式数据保护对关键应用的价值。
什么是集成式数据保护?
传统的数据保护方法十分昂贵,而且不能充分发挥存储系统的能力。数据保护应用只是放在服务器操作系统之上,向二级存储系统复制数据。这些应用不使用内置于基本存储系统中的特殊数据抓取和移动功能,因此操作速度缓慢,限制了RPO和RTO,并可能影响其他活动。
集成式数据保护采取一种效率更高的方法,同时数据所采用的格式还使数据能够用于其他用途。有了集成式数据保护,高可用性(HA)、备份和法规遵从功能都可以嵌入到存储系统中。所有功能一起工作,而且您还可以将同一数据集用于多种数据保护用途和需求。这种方法有以下几个优点:
关键数据保护功能由单一提供商提供,简化了功能部署和持续管理,同时增强了互操作性;充分利用存储系统的能力,提供更高的性能和更多的功能;数据副本可用于其他任务,以更快地获得投资回报。
通过描述数据保护流程,可以清晰地显示这些差别。
比较数据保护方法
几乎任何数据保护操作,无论是备份、复制还是归档,都包括一套共同的活动:识别有变化的或新的数据;移动数据;存储数据。
识别有变化的或新的数据
在备份等传统数据保护操作中,数据移动开始之前,首先需要识别所有新的或有变化的文件。在传统的备份流程中,一般情况下,这是一个耗时的文件收集过程,其中包括 “文件系统行走(file system walk)”。每个文件的时间信息必须与最后备份的时间相比较,以识别有变化的文件,并在任何实际的数据移动发生之前,建立一个文件目录。就非常大的文件系统而言,这个过程可能需要十几分钟、甚至数小时才能完成。
集成式数据保护解决方案利用存储系统内的快照技术。快照技术避免了很多耗费时间的过程,它立即抓取自上一次快照以来有变化的特定数据块(而不是整个文件)指针的下标,从而使数据移动能够以快得多的速度开始。
移动数据
移动数据的能力与识别数据的能力是紧密相关的。传统技术只是识别有变化的文件,并复制整个文件,甚至在只有单个数据块有变化时,也是这样,因此占用了大量网络带宽和二级存储容量。(目标去复制已经成为流行的、减少传统方法所需存储量的做法,但是对改善RPO或RTO一点用处都没有。)
集成式数据保护只传送指针图和快照中抓取的、有变化的数据块,因此速度更快,效率也更高。从网络带宽的角度来看,对立即复制离站备份(例如,采用远程至核心战略时的情况)和需要最大限度地降低在昂贵的WAN连接上的额外开销的公司,这种方法尤其有用。(一条19.4MBps的OC-3的费用约为每年2.7万美元。)
存储数据
谈到存储数据,大多数解决方案采用专有格式,这使得很难或不可能将数据用于恢复之外的任何用途。当备份总是存储在磁带上时,这没有太大关系,因为需要一个备份应用来与磁带转换器和磁带机互动。
集成式数据保护应该以一种开放的文件系统格式存储数据副本。这有以下几个优点:不用管理员介入,用户就可以非常方便地找到和恢复自己的文件;可以利用备份数据进行开发/测试、数据挖掘、灾难恢复、实现法规兼容等等。
传统的数据保护目标是,限制备份数据以一种不可能进行恢复的方式被修改的可能性。集成式数据保护可以保证,备份数据是只读的,而且可以保证,要进行读/写操作,备份数据必须被拆开。
例如,NetApp FlexClone技术无需产生完整的数据集副本,就能使二级数据副本用于其他用途。这些可写“瘦克隆”仅在有变化时才占用额外的存储空间,因此它们的存储空间利用效率很高,使您能够从用于磁盘备份或复制的二级存储系统中得到多得多的存储空间。
已存储数据未必是静止不动的。在集成式数据保护中,备份图像不是存储在磁盘或磁带上,静等着灰尘一层层落上去。它们可能用于实现其他业务职能以及用来扩展数据保护链。备份图像可以复制,以用于灾难恢复,然后锁定,以用于实现法规遵从,实现所有这一切时,都不必管理根本不同的应用或在一台服务器上运行多个资源密集型流程,而这样的应用管理和流程运行都可能影响业务应用的性能。
保护和恢复应用数据
连续运行的应用对数据保护提出了特殊要求。因为出于性能原因,大多数应用都将数据缓存到存储器中,您不可能只复制一个应用的盘上数据,然后就认定,数据处在一种一致的、最新的状态。由于这个原因,很多商业应用和数据库都提供一种热备份模式,以不用暂停应用,就可以建立一致的备份或副本。因为热备份模式会对正在运行的应用造成性能损害,所以必须在应用加载较轻时进行备份操作(并不总是可能),或者非常快地完成备份操作。
由于传统数据保护解决方案(无论使用磁带还是磁盘)一般需要很长时间才能完成操作,因此他们通常必须在非高峰时段运行。
相比之下,在集成式数据保护中,可以将应用置于热备份模式,产生一个快照,然后,在几分钟内返回正常运行状态。这种方式有很大的优势:可以在一天中产生很多快照,与其他解决方案可能提供的恢复点相比,这种方式可以提供多得多的恢复点;一旦有了一致的快照,就可以在主存储系统上保留这个快照,以立即恢复、将其复制到二级存储系统或将其复制到另一个站点以用于灾难恢复。
恢复应用
传统的应用识别备份让数据处于一致的状态,以便应用可以在做备份的点上重新启动。当必须从传统备份恢复数据库等应用时,首先要恢复最近的备份,然后重放交易日志,直到数据库达到最接近当前的状态为止。采用这种多步流程,发生错误或遇到其他问题而引起延迟的可能性很大。
在集成式数据保护中启动应用恢复时,可以自动将应用恢复到出现故障的时刻,而无需任何手工干预。软件执行所有恢复到指定时间点所需的步骤,而无需人工干预,从而节省了时间,并消除了用户出错的可能性。
NetApp解决方案
NetApp提供一套集成式数据保护解决方案,该解决方案以NetApp存储空间利用效率很高的Snapshot技术为基础。利用NetApp SnapVault软件,可以将Snapshot副本备份到二级存储系统,以进行较长时期的在线保留。只传送有变化的数据块,以高效率地利用网络带宽。利用Open Systems SnapVault,还可以将标准Windows、Linux和UNIX服务器上的存储系统包括进来。
就灾难恢复而言,NetApp提供SnapMirror,以实现高效率复制,该解决方案也是只复制有变化的数据块。就数据中心或园区中的增强数据保护而言,NetApp MetroCluster以连续镜像为大多数关键应用提供连续数据可用性。在有关这一问题的另一篇文章中,有一个MetroCluster实施的案例分析。
应用备份由SnapManager套件实现,该套件与Oracle、SAP、Microsoft Exchange、SQL Server、SharePoint、VMware等流行的应用相集成。这些工具可以将应用置于热备份模式、抓取一致的Snapshot副本并在几秒钟内恢复正常运行,从而成为备份和灾难恢复的基础。特定的存储管理功能可以直接授权给应用管理员,以提高效率。
就归档和法规遵从需求而言,NetApp SnapLock允许您将主或二级存储系统上的任何NetApp卷转换成不可重写和不可擦除的,以防文件在设定保留日期之前被更改或删除。图1说明了全套NetApp集成式数据保护解决方案。