数据备份顾名思义,就是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。在日常生活中,我们经常需要为自己家的房门多配几把钥匙,为自己的爱车准备一个备用胎,这些都是备份思想的体现。
备份:数据安全的重要屏障
数据备份作为存储领域的一个重要组成部分,其在存储系统中的地位和作用是不容忽视的。对一个完整的IT系统而言,备份工作是其中必不可少的组成部分。除了是 历史数据保存归档的最佳方式之外,它的重要意义在于备份数据的根本目的是重新利用,只有有了备份的数据之后,在发生意外事故时,才有重新恢复系统的基础。
简单的说,一份数据备份的作用,不仅仅像房门的备用钥匙一样,当原来的钥匙丢失或损坏了,才能派上用场。有时候,数据备份的作用,更像是我们为了留住美好时 光而拍摄的照片,把暂时的状态永久的保存了下来,供我们分析和研究。有了数据备份,一个存储系统乃至整个网络系统,完全可以回到过去的某个时间状态,或者 重新“克隆”一个指定时间状态的系统,只要在这个时间点上,我们有一个完整的系统数据备份。
因此,在这个意义上,数据备份是确保数据安全的最重要的一道屏障,没有备份数据,任何保护数据安全的措施都会显得惨白无力,是空中楼阁,是无根之萍。
有了备份数据,然后就是恢复,当然一个无法恢复的备份,对任何系统来说都是毫无意义的。然而,作为最终用户,一定要清醒的认识到,现实生活中有众多的备份数据无法恢复,从而导致数据丢失的例子。因此,能够安全、方便而又高效的恢复数据,才是备份系统的真正生命所在。
当然,在系统正常工作的情况下,数据备份工作毕竟算是系统的一个“额外负担”,或多或少的会给正常业务系统带来一定性能和功能上的影响。如在实际环境中,一 个备份作业运行起来,可能会占用掉一个中档小型机服务器CPU资源的60%!而一个未经妥善处理的备份日志文件,可能会占用源数据量30%的磁盘空间!
架设数据备份系统时,应考虑如何尽量减少这种“额外负担”,从而更充分的保证系统正常业务的高效运行。一个好的备份系统,能完全自动化的进行备份工作是基本要求,并且能够以很低的系统资源占用率和很少的网络带宽,来进行高速度的数据备份。
两种备份方式和4款备份软件对比
谈到备份在国内的应用,当前国内用户采用的备份方式主要有两种,一种是桌面的手工备份方式;另一种是依托局域网络的客户机代理自动备份方式。而更高级的两种 备份方式:所谓LANfree和Serverless的备份方式,由于造价高昂,在国内使用不多。
目前对于多数企业来说,由于计算机应用业务繁重程度和数 据量都不高,所以,采用传统的网络备份方式是提高数据保护的明智选择,投资小,效果明显。对于真正拥有大型网络和高负荷的关键企业应用系统来说,由于庞大 的数据的保护不能够以牺牲性能的代价来换取,所以采用所谓LANfree甚至Serverless的备份方式就显得非常有意义。
采用LANfree和 Serverless的备份方式,其实现方式几乎一定要依托被称为企业第二网络或计算平台后端网络的SAN(存储区域网络)才能够实现。
备份软件产品是备份产品的核心,当前主流的几种备份软件都有哪些?
Symantec 公司的其备份软件主要是NetBackup和Backup Exec两个系列。其中NetBackup适用于中型和大型的存储系统,除了可以广泛支持各种开放平台之外,NetBackup还支持复杂的网络备份方式 和LAN Free的数据备份。Backup Exec在Windows平台具有相当的普及率和认可度,现在Windows系统中使用的“备份”功能,就是OEM自Backup Exec的简化版。
Legato公司的备份软件产品以NetWorker系列为主线,与NetBackup一样,NetWorker也是适用于大型的复杂网络环境,具有各种先进的备份技术机制,广泛的支持各种开放系统平台。
IBM Tivoli也是高端备份产品,与Veritas的NetBackup和Legato的NetWorker相比,Tivoli Storage Manager更多的适用于IBM主机为主的系统平台,但其强大的网络备份功能绝对可以胜任任何大规模的海量存储系统的备份需要。
CommVault公司是第二代数据管理软件的代表,其产品Simpana 以统一数据管理为核心理念,所有功能基于同一开发平台,统一界面管理。其搜索功能和imagelevel技术更是受到特定用户的青睐。
容灾与备份区别以及三级容灾标准
谈到容灾与备份的区别,两者的区别在于:
(1)容灾主要针对火灾、地震等重大自然灾害,因此备份中心与主中心间必须保证一定的安全距离;数据备份在同一数据中心进行。
(2)容灾系统不仅保护数据,更重要的目的在于保证业务的连续性;而数据备份系统只保护数据的安全性。
(3)容灾保证数据的完整性;备份则只能恢复出备份时间点以前的数据。
(4)容灾是在线过程;备份是离线过程。
(5)容灾系统中,两地的数据是实时一致的;备份的数据则具有一定的时效性。
(6)故障情况下,容灾系统的切换时间是几分钟;而备份系统的恢复时间可能是几小时到几十小时。
保护数据安全和提高数据的持续可用性,是存储系统不断追求的最高目标。在今天这个复杂的信息环境中,要保障数据的安全,只有数据备份是远远不够的,容灾作 为数据安全性和业务连续性的最高保护级别,对于高数据安全性的企业来说也是不可缺少的。
著名的财经咨询公司摩根•斯坦利在纽约世贸中心有近4000名员 工,在“9•11”事件中可以说损失巨大。但值得庆幸的是,摩根•斯坦利公司在世贸中心倒塌前十几分钟内,已经通过容灾系统把所有商务资料备份到在离世贸 中心数公里之遥的第二个数据中心。但是,要正确认识容灾,还必须从概念上将容灾与数据备份区别开来。
远程容灾是指为了防止因火灾、地震、人为破坏或设备故障造成系统瘫痪、数据丢失、业务中断,而在数据中心之外的另一地点建立备份中心,备份中心具有与主中 心相同或相似的主机、网络和存储设备。系统正常运行时,应用会将数据同时写向主数据中心和备份中心的存储设备,并保证二者的实时一致性。当主数据中心发生 灾难时,应用能够快速地自动切换到备份系统,从而保证数据完整性和业务连续性。当主中心系统恢复后,主中心的存储设备会向备份中心存储设备进行数据重新同 步,然后应用切换回主中心。
容灾可以分为三级。第一级为“冷容灾”,即所谓“电子磁带入库”方式,可以有本地入库和远程入库两种子项,实际上就是备份,只不过可以将备份放置在远离数 据中心的第二或第三个地方;第二级为“温容灾”,即所谓“磁盘镜像/复制”方式,也有本地和远程两个子项,和备份不一样用户能够在远程在线使用镜像后的数 据;第三级为“热容灾”,即所谓“远程群集+磁盘镜像/复制”方式,这种方式可以允许整个过程自动地在本地和远程进行。
容灾三要素和具体实施细节
真正的容灾系统必须满足三个要素:首先是系统中的部件、数据都具有冗余性,即一个系统发生故障,另一个系统能够保持数据传送的顺畅;其次,具有长距离性, 因为灾害总是在一定范围内发生,因而充分的长距离才能够保证数据不会被一个灾害全部破坏;第三,容灾系统要追求快速的数据恢复,也称为容灾的“3R” (Redundance、Remote、Replication)。
容灾作为一种新的概念,目前已经被国内大多数行业所接受,特别是在金融、电信等信息密集型企业,实施容灾级别的数据保护工作已经被提上了日程。但是,容灾 的实现仍然面临着多方面的难题。其中,除了投入过高这一普遍因素外,对容灾如何确切理解、在具体实施过程中存在的技术问题等,都成为企业建立容灾系统的障 碍。
实现容灾功能包括两个环节:远程数据复制、远程动态监测和应用切换。远程数据复制的实现方法有三种:利用数据库厂家的软件产品完成远程复制,利用主机 进行远程数据镜像,和利用存储设备厂家的软件产品完成远程复制。前两种方法的存储镜像是通过主机完成的,将极大地影响主机性能。第三种方法,利用存储设备 厂家提供的智能磁盘控制技术,可以实现主数据中心和备份中心的操作系统、文件系统、数据库的实时拷贝维护。
由于利用存储设备厂家的软件产品完成远程复制, 主、备中心磁盘阵列是通过阵列上的微处理器完成数据实时同步功能,不占用主机CPU、内存和I/O资源,所以几乎不影响主机性能。在容灾系统的数据复制环 节,海阔也推荐采用这种基于存储设备的数据复制方法。
目前,能够提供基于存储设备的数据复制的产品有:EMC公司的Symmetrix的SRDF;EMC公司的CLARiiON的MirrorView和IBM公司的ESS和PPRC等。
为实现故障情况下的切换功能,数据复制的同时,还需要类似主机集群的软件,对应用进行动态监测。主、备中心的应用主机均要安装这种远程动态监测软件,主机 间除了网络连接,还需要专线做心跳监测。远程动态监测软件通过心跳线实时监测其它主机和应用的状态,当主机/应用发生故障时,远程动态监测软件会马上监测 到,将故障情况向管理员报警,然后根据策略自动或手工快速地将应用切换到远程的主机。目前,能够提供实现应用切换功能的厂商包括EMC、Veritas、 Legato、IBM、ROSE等公司。
详解数据迁移
谈到数据迁移,由于国内大多用户历史积累的数据量有限,目前“数据迁移”在国内用户中使用的不是很多。在存储技术中,“数据迁移”是指在线存储设备和离线 存储设备共同构成一个协调工作的存储系统,该系统在在线存储设备和离线存储设备之间动态的管理数据,使得访问频率高的数据存放于性能较高的在线存储设备 中,而访问频率低的数据存放于较为廉价的离线存储设备中。
这样做的目的是,为了平衡工作负载、系统扩充、故障恢复或者许多其它目的。要达到这个目的,传统 的方法要么是把应用系统停机,要么严重影响前台应用程序的性能,当性能的可预测性变得和速度几乎一样重要时,这两种方法都不会有好结果。
使用“数据迁移”基本上有两种主要的情况。
第一,由于系统升级或改造需要迁移原来存储设备上的数据;这种情况下使用一些数据迁移软件将原有存储设备上的数据或文件系统迁移到新的存储设备上来。
这种 方式非常常用,但往往是由人工来管理的,举个简单的例子,比如在新系统上新建目录,查找老存储系统上的文件,并使用COPY命令转移文件等等,这种情况针 对小数据量,简单的计算机环境(非异构)非常有效,但是对于大型网络和复杂的计算环境以及庞大数据和文件系统的情况下,系统管理员会手足无措并且会发生这 样或那样的错误。这时会需要更强大的自动管理数据迁移软件来帮忙。
第二,因为历史数据太庞大而使用频率不高,需要使用一些离线或近线的存储资源来转移在线存储设备上的数据资料。
当然实现应该是使用数据迁移软件来自动完成 和管理。使用这方式,会大大降低存储资源的成本(从在线转为离线),同时又不会对现有常用数据和应用造成影响。
数据迁移软件是数据迁移的核心,当前真正的数据迁移软件价格不菲,并且实施复杂程度较高,都需要专业的存储管理人员。目前一些备份软件在数据迁移中也有了一些成功案例,例如commvault等。
结束:
在以“数据为中心”的现代经济社会,数据就是信息的符号,数据的价值就代表了企业能够获取的最大利润。企业的数据存储正由配角变为主角。但是由于存储方面 投入的硬件、软件、网络设备、人员和管理费用在公司的IT预算中所占的费用越来越多,企业应该根据仔细分析自身的存储需求,或是数据备份、或是容灾系统、 或是数据迁移。然后有针对性的确定存储系统基本架构,再然后反观市场上的各种存储方案,从数据保护能力、性能、容量、连接性、管理性和附加功能这几个方面 来选择合适的存储产品。
以互联网技术为代表的信息技术的飞速发展,使得公司和企业的运作越来越依赖于计算机系统。大量有关企业生产、销售的业务信息数据维系着整个企业的生存和发展,它们是企业珍贵无比的无形资产。这些数据一旦因为存储系统遭受意外而被计算机病毒、丢失、篡改、物理损害或者其他不可避免的自然灾害,造成大量数据丢失,对于所 有的单位来说,都无疑是一场灾难,因为它除了会给企业带来重大的经济损失以外,甚至有可能动摇企业的生存基础。有关调查显示,有1/3的企业经历过因为计 算机系统失效导致大量数据丢失的情况。所以,加大保护数据安全的力度,已经成为了越来越多企业的共识。
在今天,企业的业务数据需要尽可能得到最强的保护,在现有的情况下最大限度的针对危及数据安全的各种可能性采取相应的措施,在灾前备份数据,灾后及时、准确地恢复系统的正常运行对企业至关重要。