云灾备的必要性
自然灾害
如洪水、暴雨、地震等导致数据中心损坏
技术故障
如电源故障、网络链接故障、数据中心设备老化起火
人为错误
如错误配置、未经授权的修改导致的系统错误
外部入侵
如病毒入侵、黑客攻击等来自外部的威胁
云灾备的优势
在传统做法中,实施较高要求的容灾和灾备系统,往往不光要求企业花费大量时间和精力,而且部署复杂且价格昂贵。这对于多数企业,特别是中小型企业,都是一个巨大的负担。使用公有云的基础设施来实现数据保护、备份归档和灾难备份,拥有传统IT无法比拟的巨大优势。
迅速启动并恢复受灾的数据中心,最快可实现实时恢复。
轻松实现灾备演练,让您更方便地进行灾备测试。
降低维护费用,资源弹性配置,按需购买。
减少人为误操作机会,可大幅度缩短恢复时间。
灾备方案和适用场景
不同的业务对于 RPO (Recovery Point Objective,恢复点目标) 和 RTO(RecoveryTime Object,恢复时间目标)的要求也不同。根据不同的要求,我们大概可以将灾备归类 Cold Backup , Pilot Light , Warm Standby 和 Hot Site. 以下是四种灾备方案和适用场景。
-
Hot Site 灾备方案
-
Warm Standby 灾备方案
-
Pilot Light 灾备方案
-
Cold Backup 灾备方案
-
Hot Site 灾备方案
-
实时同步/异步双向复制业务数据,应用层资源保持一定规模的配置,DNS 按权重解析到两个站点;当灾难发生时,DNS 解析到单个站点, 并迅速扩大应用层资源。
灾备方案目的
- 用户可以访问多活站点(Hot site)中的任一个
- 将大多数灾难的恢复时间减少到接近于零
灾备方案场景
适合核心业务,业务中断时间及数据丢失可能性最低。
灾备方案效果(RTO)
秒
级别灾备恢复
费用:
- 用户可以访问多活站点(Hot site)中的任一个
-
Warm Standby 灾备方案
-
实时复制业务数据,应用层保持小规模资源配置;当灾难发生时,迅速扩大应用层资源。
灾备方案目的
- 确保在灾备区域中有一个按比例缩小但功能齐全的生产环境副本。
- 利用灾备区域中的可用工作负载缩短恢复时间
- 更轻松地执行灾备测试或实施连续灾备测试,以增强对灾难恢复能力的信心。
灾备方案场景
适合关键业务,在本地机房出现故障的时候,可以直接切换流量到云端,保证业务的连续性。
灾备方案效果(RTO)
分钟
级别灾备恢复
费用:
-
Pilot Light 灾备方案
-
实时异步复制业务数据,当灾难发生时,启动应用层资源。
灾备方案目的
- 确保数据备份和复制所需资源(如数据库和对象存储)的可用性。
- 其他业务模块,如应用服务器,其应用代码和配置是提前设定好的,平时处于关闭状态,只在灾备测试或者灾难恢复的时候开启。
灾备方案场景
适合一般业务,当本地数据中心故障导致无法承载业务,可以借助此方式在相对短时间内恢复业务。
灾备方案效果(RTO)
小时
级别灾备恢复
费用:
- 确保数据备份和复制所需资源(如数据库和对象存储)的可用性。
-
Cold Backup 灾备方案
-
定期导出并备份业务数据到云端,当灾难发生时,在灾备区域恢复数据并部署应用层资源。 例如通过备份工具将数据库数据文件定期全量或增量备份到云端
灾备方案目的
- 防止数据丢失和损坏
- 提高业务在单可用区部署时的数据冗余度
- 跨区域数据备份,缓解区域级故障带来的影响
灾备方案场景(RTO)
适合低优先级的场景,降低 洪水、地震等导致数据中心损坏、误操作导致数据被删除、黑客攻击导致数据丢失等 带来的影响。
灾备方案效果
天
级别灾备恢复
费用:
亚马逊云科技灾备方案的优势
亚马逊云科技的灾备解决方案
亚马逊云科技的多区域灾备 Pilot Light Backup
详细介绍了如何在亚马逊云科技上实现跨区域的 pilot light 灾备方案,由于部分闲置的云组件会给客户增加额外的成本,因此在整个方案中,除了 VPC 预配置和 RDS 热备外,其余所有的组件都是灾难发生后通过脚本动态创建,达到最小的 Infra cost。当发生灾难时,用户通过预先定义好的灾备脚本,在灾备区域快速构建云资源。
亚马逊云科技的多区域 Cold Backup 容灾设计
详细介绍了如何在亚马逊云科技上实现跨区域的冷备方案,可以在不增加额外闲置成本的情况下恢复因区域故障导致的生产宕机。在此套环境下,除了网络基础架构预配置外,只做数据定期快照向灾备环境拷贝,其余所有的组件都是灾难发生后通过脚本动态创建,一旦某个生产区域出现故障,用户通过预先定义好的灾备脚本做灾备切换,在灾备区域快速构建云资源恢复生产环境。
为本地数据中心实现 Cold backup & Pilot light 容灾解决方案
该方案讲述了常见的企业IT基础架构及应用系统从 On-premise 环境到亚马逊云科技的云端两种灾备场景。
其他云服务商到 Amazon Cold Backup 容灾解决方案
该方案模拟在其他云服务商的 WordPress cluster 应用通过 Cold Backup 的方式备份到亚马逊云科技宁夏区域。RTO 和 RPO 目标均为 24 小时 。
云灾备相关产品
云灾备相关资讯
云上灾备管理工具的基础认识
利用 CloudEndure 可以方便地在 Amazon Web Services 不用区域之间,或者云下与 Amazon Web Services 云之间迁移或者灾备 Amazon Elastic Compute Cloud (EC2) 实例。
利用云灾备管理工具高效管理实例灾备配置
云灾备管理工具整合 CloudEndure 复制实例信息以及目的区域虚拟网和机型信息,存入 DynamoDB 数据库,通过计算,批量地对 CloudEndure 项目的启动蓝图进行配置,实现高效管理的目的。