灾难恢复计划(DRP):DRP适用于拒绝长期访问主要设施基础设施的重大、通常是物理性服务中断。DRP是一种以信息系统为中心的计划,旨在在紧急情况发生后恢复备用站点上目标系统、应用程序或计算机设施基础设施的可操作性。一旦备用设施建立,DRP可由多个信息系统应急计划提供支持,以解决受影响的单个系统的恢复问题。DRP可以通过在备用位置恢复任务/业务流程或任务基本功能的支持系统来支持BCP或COOP计划。DRP只处理需要重新定位的信息系统中断。
3)按照GB/T30145-2013/ISO22301:2012和GB/T20988-2007定义
总结:
针对三个标准的理解,各个标准关于术语定义描述各有侧重,但笔者更加倾向于NSIT的定义。笔者认为:业务连续性计划是基于企业战略的、处理长期的、面向中断中和后维持业务连续性的规划,核心是业务连续;灾难恢复计划是面向重大的、灾难性的系统故障,在异地恢复业务暂时性正常运转的计划。灾难恢复解决的临时性的、针对异地恢复的临时性计划。业务连续性管理从涉及的内容看,包含了灾难恢复计划,还包括高可用性。业务连续性更多侧重策划、执行和管控,灾难恢复更注重执行。
以下内容,主要以IT的视角对业务连续和灾难恢复进行总结。
二、业务连续性管理
业务连续性管理具体包括:
具体流程和里面涉及的细节进行阐述。
1.BCP的启动阶段工作
1)BCP项目启动前准备活动
2)工作任务
3)BCP项目的关键角色
2.BIA分析
主要工作内容:
1)BIA过程
2)BIA分析方法
BIA的信息分析过程:整理(Organize)归纳(Correlate)分析(Analyses)和确认(Confirm)
BIA分析中断的影响,确定每项业务功能的恢复窗口,具体会涉及几个值:
RTO+WRT<=MTD
关于MTD与RPO、RTO和WRT的关系如下图:
关于网络和资源可用性指标
总结:组件越多,整体可靠性越低
3)风险评估
应当识别、评估和记录以下内容:
3.确定预防控制措施
主要的目标实施控制,以降低风险
1)数据备份方案的选择
数据备份开始位置:归档位。
2)高可用性
应用层(负载均衡+高可用)、数据层(rac)、设施层(HA)
3)电子备份解决方案
4)设施选择
完备场所(hotsit):拥有与主站点的所有软硬件设施,唯一缺的是数据。在几个小时就能投入运营
基本完备场所(warmsite):只配置了主要软硬件
基础场所(coldsite):只提供机房环境
软件备份:代码第三方托管
4.制定恢复策略
业务流程、设施、供应和技术、用户和用户环境、数据
5.制定BCP
文档化程序包括:计划程序、恢复程序、恢复解决方案、角色和任务、应急响应
a)确定业务关键功能
公司的业务计划通常就决定了公司关键的使命和业务功能。必须为这些功能设定优先级别
b)确定支持关键功能的资源和系统
在确定了关键的功能之后,就有必要找出实现这些功能究竟需要那些支持。
需要有人来对这些资源进行分析,这样的分析应该由那些理解资源并知道它们是如何为企业提供功能的人来完成。
c)估计潜在的灾难事件
确定所有可能的意外事故和灾难
BIA的结果作为以上的输入。
d)选择计划策略
制定有关如何恢复关键资源和评估应急方案
6)实施策略
一旦决定了策略,就需要将它们归档,这使得我们的努力从纯粹的计划阶段进入到了实际的实施和行动阶段。
需要对业务连续性计划做定期测试,因为环境总是在持续变化,每一次测试都能够带来一些改进。一般会形成以下计划:
1)具体测试类型包括:
各部分分头审核提意见
聚集在一起审核提意见
所有人聚集一起测试,选定场景,知道设备搬到异地备份结束。
只系统搬到异地,本地还运行,对比分析
本地全停用,异地启用,管理层批准,先要完成并行测试。
2)测试策略包含测试目标和范围
测试策略包含测试计划:基于预定的测试范围和目标
整合到变更控制流程中,主要包括:
8.应急事件处理流程
再造阶段(reconstittutionphase):当公司开始搬回原来的场所或搬进一个新设施时。
业务连续性计划:着重于恢复必须重建的业务流程而非IT组件