重庆小潘seo博客

当前位置:首页 > 重庆网络营销 > 小潘杂谈 >

小潘杂谈

灾难恢复测试:确保灾难恢复计划正常工作

时间:2020-08-12 04:45:11 作者:重庆seo小潘 来源:
企业需要了解灾难恢复测试对于所有IT组织至关重要的原因,以及如何成功有效地实施这些测试。灾难恢复测试是组织灾难恢复计划(DRP)的一个多步骤演练,旨在确保在发生实际灾难时恢复信息技术(IT)系统。作为灾难恢复计划的一部分,企业通常采用灾难恢复服务。

企业需要了解灾难恢复测试对于所有IT组织至关重要的原因,以及如何成功有效地实施这些测试。灾难恢复测试是组织灾难恢复计划(DRP)的一个多步骤演练,旨在确保在发生实际灾难时恢复信息技术(IT)系统。作为灾难恢复计划的一部分,企业通常采用灾难恢复服务。

为什么灾难恢复测试至关重要?

自然灾难或人为事件通常会中断正常的IT功能,如数据处理、通信、虚拟化以及网络和数据中心操作。研究一致表明,灾难中IT功能的丧失会导致业务失败。例如,根据美国档案和记录管理局的报告,由于灾难事件导致数据文件丢失或计算机系统崩溃长达10天或以上的公司中,93%的公司在一年内申请破产倒闭。虽然灾难并不会经常发生,但一旦发生,其影响可能是毁灭性的。

灾难恢复测试的主要目标是确保在灾难发生的情况下,灾难恢复计划将真正起到作用。企业的灾难恢复站点将上线运营,IT系统将以最短的停机时间重新上线。也许一家公司使用基于云计算的灾难恢复(DR)或灾难恢复即服务(DRaaS),但在任何一种情况下,灾难恢复测试都会揭示备份是否真的像企业需要的那样万无一失。

正在进行的测试是必要的,因为灾难恢复测试的有效性可能受到组织内人员、技能水平以及硬件和软件架构的不可避免变化的影响。全面测试灾难恢复计划是制定灾难恢复计划的一个绝对关键的方面。

灾难恢复方案

灾难恢复测试(DRT)计划可以帮助组织为任何类型的IT灾难做好准备,包括在现实生活中展开的以下各种场景。

灾难恢复与业务连续性计划

灾难恢复计划(DRP)和测试通常与业务连续性计划(BCP)混淆。虽然两者密切相关,但它们并不相同。

灾难恢复计划和测试系统规定了IT组织在灾难发生后恢复系统所必须采取的步骤,这些系统将满足企业的技术需求。另一方面,业务连续性计划(BCP)阐明了企业必须做些什么来确保其产品和服务仍然可供客户使用。业务连续性计划(BCP)由业务影响分析、风险评估和整体业务连续性策略组成。它通过业务连续性测试(BCT)进行测试。一些组织将灾难恢复计划(DRP)/灾难恢复测试(DRT)和业务连续性计划(BCP)/业务连续性测试(BCT)分开处理,而其他组织在整体业务连续性计划和测试中包括灾难恢复。

5个灾难恢复测试技术

除了在紧急情况下恢复数据和保持关键应用程序和服务在线之外,灾难恢复解决方案还应包括向工作人员发出灾难警报的方法,以及在电话线路和网络中断时允许在事件期间和之后进行通信的方法。在规划和测试过程中,灾难恢复团队还应认识到,尽管发生了灾难,组织必须继续履行其安全和法规遵从性义务。

五种类型的灾难恢复测试(DRT)用于测试灾难恢复解决方案:

六个灾难恢复测试级别

在并行和切换测试中,IT系统可以在不同的综合性水平上进行测试。IT组织的测试水平各不相同,灾难恢复服务提供商也不相同。

灾难恢复测试最佳实践

一些大型组织每季度进行灾难恢复测试。然而,尽管进行了灾难恢复经验的一些宣传,23%的企业从不测试灾难恢复,而大约33%的企业每年测试一次或两次。根据一项调查显示,在测试其灾难恢复计划(DRP)的公司中,大约65%的公司未通过自己的灾难恢复测试(DRT)。虽然测试的频率将取决于企业的业务及其灾难恢复准备情况,但专家强烈建议企业至少每年进行一次完整的测试。

对于关键应用程序,设置恢复时间目标(RPO)和恢复点目标(RTO),这些目标可以按比例进行衡量。这些基准的目的是确保企业达到目标,同时详细说明成功的过程。包括医疗保健在内的一些行业要求组织了解并记录其恢复点目标(RTO)。无论企业在哪个行业,通过使用按比例衡量的基准,都能更好地确定需要改进的灾难恢复程序。

明确定义负责研究、开发、实施和测试灾难恢复计划(DRP)的所有人员。如果相关人员不在公司办公室,需要为灾难恢复练习中的每个角色指派一名备份人员。与所有团队成员共享灾难恢复计划(DRP)和灾难恢复测试(DRT)。如果团队的成员辞职,需要确保替换他们的工作人员接受灾难恢复计划(DRP)和灾难恢复测试(DRT)政策和程序方面的培训。然后安排一个小组运行灾难恢复测试(DRT),以平滑灾难恢复过程。

虽然大型组织拥有自己执行灾难恢复测试(DRT)的内部专业知识,但许多小型公司将会向灾难恢复公司寻求帮助。除了多方面的灾难恢复即服务(DRaaS)之外,灾难恢复服务提供商还提供专业服务,例如持续测试和客户灾难恢复解决方案的全天候性能监控。

原文作者:Jacqueline Emigh