在“桑迪”飓风袭击美国东部之后相当长一段时间内,灾难恢复(DR)计划这一主题几乎霸占了各大专业媒体的版面,同时,几乎每位IT管理员都在从不同角度参与这一话题的讨论。但其实每家企业都应该清醒的认识到人为操作错误、恶意破坏行为和设备故障,所带来的毁灭性的影响其实和超级风暴是一样的。
灾难恢复、数据保护、保证关键IT任务全天候24正常运转。事实上,数据中心管理人员们现在已经认识到,他们所要做的不仅仅只是进行数据保护和数据备份;他们需要百分百的保证IT服务的完整性,毕竟企业业务的正常运转取决于IT服务是否完整。目前,在复杂性日益增加的企业环境中,鉴于传统的数据保护方法无法很好的处理海量数据的增长,IT部门所面临的最大的挑战是如何实现成功的灾难恢复。
一款广泛适用的数据中心灾难恢复保险策略
当今的数据中心的复杂性使得时间危机只能越来越严重。灾难恢复是数据中心内部的最耗费时间的工作流程,其往往是被拖到每日IT的优先级列表的最后。由于数据中心管理人员需要处理越来越多的用户请求和其他日常项目,他们往往忙得不可开交,以至于开始疏于对灾难恢复计划的关注。然而,正如我们每个家庭都有购买相应的保险来保护我们免受不可预见的突发情况一样,数据中心也必须有相关的灾难恢复计划保险策略。灾难恢复计划应该是一项保险计划,并同时包括对数据中心数据、应用程序、系统、基础设施的保护,使关键IT服务能够始终保持运行。
简而言之,灾难恢复计划是保证数据中心关键业务运营连续性的重中之重。如果数据中心运转失常,可能会使企业蒙受数百万美元的损失。而这还只是生产力损失所造成的成本形式的有形损失,其对于企业声誉和其他方面的无形损失,则影响更大。大多数企业均无法承受持续超过四个多小时的停机时间所带来的惨重的损失。 IT管理员对于这一点都非常清楚,所以,每当某个中断发生时,他们往往都是手忙脚乱地执行一系列复杂的启动,紧张的运行所需的步骤。
那么,企业的IT领导人员怎样才能减轻这方面的压力,并在灾难发生后迅速恢复业务运行呢?数据中心管理者要如何才能确保其IT的保险计划是否足够的呢?答案就在于必须进行适当的规划、测试并执行灾难恢复计划和针对当今复杂的数据环境专门设计的相关的解决方案。在过去,太多的灾难恢复计划失败,恰恰是因为他们没有正确执行,传统的数据保护技术无法很好的进行扩展,以保护IT服务,或者说他们的灾难恢复计划并没有得到彻底的测试。自动灾难恢复通过传统耗时的手动恢复过程转变为机械化,解决了所有这些缺陷。随着自动化灾难恢复的采用,企业可以在短短的几分钟之内恢复系统,而不再需要数小时或数天的手工操作了。
消除对数据中心灾难恢复自动化的神话
数据中心灾难恢复自动化节省了时间和减少了昂贵的停机时间,那么为什么数据中心没有大规模采用灾难恢复自动化呢?答案很简单:误解。破除误解最好的方法就是信息透明,所以让我们来看看围绕着数据中心灾难恢复自动化的四种最常见的神话吧:
误区1:数据中心灾难恢复自动化不能根据环境进行定制。IT管理者认为数据中心灾难恢复自动化解决方案不能够处理当今大多数数据中心所使用的不同种类的硬件或物理/虚拟服务器。在许多情况下,IT管理员要迅速系统恢复,确保使用任何物理或虚拟系统都是可用的。
现实是:自动化的灾难恢复解决方案,可以在不同硬件之间、以及从物理到虚拟、虚拟到虚拟、虚拟到物理系统之间进行故障切换和故障恢复,可以在任何环境下的快速恢复。无论怎样的服务器,硬件或连接类型,自动化的灾难恢复解决方案均可以处理异构环境内的复制和恢复。
误区2:数据中心灾难恢复自动化不允许进行完整的测试。有一种看法认为,自动化灾难恢复缺乏测试端到端的场景恢复机制。有一些解决方案只提供一个特定的数据集、应用程序或过程的一部分的恢复能力。如果没有一个完整的测试,IT管理人员们不会对灾害系统中实际发生的紧急事件有充分的信心。
现实是:一个完整的,深入整个环境的测试是至关重要的。而且必须至少每季度一次,确保所有过程的正常工作。当选择了一款自动化的灾难恢复解决方案,IT管理人员们必须详细检查测试程序,以确保他们能够运行完整的测试,而不会造成重大的停机时间。
误区3:自动灾难恢复需要多个数据源进行数据恢复。有一些灾难恢复自动化解决方案,只能恢复部分系统上的数据,需要依靠其他潜在较慢的,备份应用程序来完成一个完整的恢复。例如,如果某个故障点已经持续4个小时了,而自动化的灾难恢复解决方案仅仅只能恢复前两个小时丢失的数据。剩余的数据将需要被从次要备份源中进行恢复。这些类型的解决方案,极大地阻碍了恢复时间目标。
现实是:一款真正的自动化灾难恢复系统可以追溯到原始故障点。结合基于磁盘的连续数据保护和快照技术的自动灾难恢复技术,将使企业能够在一个完整的过程中完全恢复过来。
误区4:自动灾难恢复一次只能恢复一个系统。有的IT管理员认为,自动化的灾难恢复解决方案一次只能恢复一个系统或应用程序,如果是跨多个系统,应用程序和服务的中断其是不足够的。这种担忧源于某些被视作自动灾难恢复解决方案的产品,其一次只能恢复一台服务器,作为恢复过程的一部分。而影响整个数据中心的大故障,从单一系统恢复开始则相当费时。
现实是:今天,先进的自动灾难恢复解决方案允许多台机器,一次最多五个系统,并能够在在几分钟内即可完全恢复IT服务操作。这种面向服务的方法能够恢复重点系统、关键数据中心服务,应用程序和数据,使关键数据中心服务,消除或大大减少了停机时间。
自动灾难恢复解决方案是企业的保险计划,以消除代价高昂的停机时间,避免当系统崩溃时,生产力蒙受损失。 企业的许多IT管理员固然已经消除了数据中心传统的数据保护解决方案的局限性的思维,但很多人对于自动灾难恢复解决方案仍然持有这些常见的误区。通过评估市场上的所有可用的解决方案, IT管理员们可以克服他们对于自动灾难恢复解决方案的不信任。他们会发现,今天的自动灾难恢复解决方案要远远比他们目前认为的功能更强大和可靠。
本文作者Ralph Wynn是FalconStor软件公司的产品营销技术总监,Ralph Wynn是一名存储专业人士,在产品管理、市场营销、支持和部署方面拥有超过15年的经验。加盟FalconStor软件之前,Ralph曾先后供职于Bocada、Synscort和赛门铁克。