灾难恢复
恢复目标
| 服务类别 | RTO | RPO | 优先级 |
|---|---|---|---|
| 关键生产系统 | < 4小时 | < 1小时 | 1 -- 立即恢复 |
| 面向客户的服务 | < 8小时 | < 4小时 | 2 -- 高优先级 |
| 内部系统 | < 24小时 | < 24小时 | 3 -- 普通 |
| 归档/文档 | < 72小时 | < 1周 | 4 -- 低 |
恢复程序
场景:单系统故障
- 确定原因(硬件、软件、配置)
- 激活故障切换(如有)
- 从备份恢复系统或重新部署
- 从Git仓库应用配置
- 重新上线前进行完整性检查
- 加强监控24小时
场景:勒索软件
- 立即: 将所有受影响系统从网络隔离
- 确定加密范围
- 验证备份完整性(确认干净备份)
- 从经验证的备份恢复系统
- 轮换所有凭证
- 系统重新上线前关闭攻击向量
不支付赎金
BAUER GROUP原则上不支付赎金。付款会资助犯罪组织,且不保证数据恢复。
场景:数据中心故障
- 启动危机管理团队
- 切换至备用站点(如有)
- 按服务类别优先恢复
- 启动客户沟通
- 确保临时运行
- 主站点可用后进行完整恢复
故障切换系统
| 系统 | 切换类型 | 切换时间 |
|---|---|---|
| DNS | 自动(Anycast / 健康检查) | < 5分钟 |
| Web应用 | 手动(备份部署) | < 1小时 |
| 数据库 | 复制(关键系统) | < 15分钟 |
| 电子邮件 | 备用MX记录 | 自动 |
DR测试
| 测试 | 频率 | 范围 |
|---|---|---|
| 桌面推演 | 每半年 | 无实际系统变更的场景演练 |
| 恢复测试 | 每季度 | 单个系统的实际恢复 |
| 完整DR模拟 | 每年 | 包含计时的完整故障切换场景 |