灾难防御的重要性不容置疑。企业已经意识到,只有部署一套周密完备的灾备解决方案,才能在发生自然或人为灾难时避免损失。灾备是业务连续性计划中的一环,若要行之有效,必须着眼于完整的生命周期,包含分析、解决方案设计、实施、测试、验收以及维护等一系列步骤。
灾备应该包括对业务运行所需要的所有策略和程序的恢复,包括恢复业务数据访问、恢复所有关键应用程序及通信手段(电子邮件、电话、传真等)、恢复工作空间访问及其他业务处理,这对于企业恢复整体业务非常关键。
提高灾备 策略的灵活性
部署灾备方案非常复杂,而且成本不断增加,企业通常会因此不得不放弃、推迟或简化其灾备计划,改用低成本、低效率的数据保护策略。此外,部署灾备方案必须中断业务运行,也成为许多灾备方案部署受阻或推迟的原因,甚至有的企业已经酿成了难以挽回的损失。
高效的灾备解决方案应该是开放而灵活的,能够轻松适用于企业现有的IT基础结构,并将风险、实施时间和成本降至最低。灾备解决方案应具有很高的投资回报,同时最大限度减少运行中断,确保在站点发生故障时最少的数据丢失。
企业应该先对其业务进行需求分析,确定业务持续运行所需的各项业务处理并排定优先次序。另外,还要对这些业务处理所在的基础结构,以及实现这些业务处理的基础技术的能力(及局限性)进行重点分析。
随着企业越来越多的依赖于电子交易以及数字数据的存取,停机成本也不断上升。因此,企业选择的灾备解决方案,应该即能在部署时不用中断业务运行,又能满足其他方面的灾备要求。
有效控制灾备成本
实施具备灵活性、硬件独立性、不受协议约束的解决方案,的确可以减少存储基础架构和部署的成本,但带宽需求仍然是灾备解决方案的另一项重要成本构成。站点间的数据复制和通信通常占所有灾备方案成本的30%,所以,应当对复制提供优化,最大限度地降低带宽需求,降低灾备的总成本。
随着数据和处理自动化的需求日益增长,许多企业的服务器和应用程序数量也快速增加,因而出现了大量计算及存储资源“孤岛”,这些资源的利用率低下,通常仅为20%,造成了资源的极大浪费。这些没能充分利用的资源同时也在消耗能源:供电及制冷同样是数据中心的重要支出。
由于灾备计划本身需要一个以上的数据中心才能实现,因此在灾备计划中应该充分考虑到设备及电力的成本支出。新型服务器及存储管理技术的出现,有助于减少数据中心内硬件所占的空间,最大限度地提高了物理资源利用率。服务器及存储虚拟化技术的重点就是帮助整合物理资源,提高数据中心所有可用物理资源的利用率,从而减少供电及制冷需求,进一步节约成本。
毫无疑问,数据保护策略的首要目标是在主站点发生完全或部分故障时,迅速进行故障切换,将业务切换到容灾站点。故障切换速度决定了企业所承担的风险——快速故障切换可以降低企业在财务收入、客户满意度乃至公司声誉方面受到的影响。制定恢复时间目标(RTO),有助于企业选择可行的灾备技术。自动化的站点故障切换,能够大幅缩短故障切换时间,并将风险降至最低,同时也避免了复杂而耗时的手动操作经常导致的错误。
当然,故障切换速度还取决于远程站点是否已准备好接管主站点的业务。如果业务应用程序未与数据复制服务相集成,数据完整性问题将会造成恢复时间的延长。如果应用数据不能在数据复制过程中保持交易完整性,则应用程序必须先完成耗时的数据检查工作才能恢复数据,这将大大拖延恢复速度。
灾备中有一个非常重要却经常被忽视的环节,那就是主站点恢复运行后的故障回复。站点故障切换不容易,故障回复则更为复杂。故障回复处理必须确保在故障切换期间累积的所有变化数据都全部复制回主站点。因此,自动化的故障回复具有重要意义,它可以简化并加快恢复运行,同时将风险降到最低。
站点故障切换时 减少数据丢失
由于远程站点的数据与之前从主站点完整复制时的完全一致,因此,复制频率决定了潜在的数据丢失量。在选择数据复制策略时,应该充分考虑需要的恢复点目标(RPO)。企业需要采用足够灵活的技术,满足不同应用程序的不同服务级别协议(SLA),某些应用程序可能只允许丢失一个小时的数据,而其他的则没有那么严格。
无论是现在还是未来,只有兼具灵活与全面开放的解决方案才能满足企业所有的灾备需求。