发布于: Nov 30, 2022

【概要】步入云时代后,灾备的方式将获得全面的革新;充分利用云上诸如按用量计费,上至计算下至存储的全栈弹性能力,全套的自动化辅助服务等特性,将成为衔接三个维度至关重要的 “拼图”,为灾备领域开启全新的篇章。

灾备云服务是对传统灾备技术的一次革新在,现代企业的 IT 运营中,灾备的价值正在与日俱增。客户数据中心故障、服务器硬件损坏,网络攻击,或者地震火灾等事件不仅会引起客户的产线停摆、业务中断,还会造成数据丢失、影响客户商业声誉;对于涉及公共事业服务的企业或者上市公司,如果对灾难事件处理不善甚至还有可能造成社会事件。

为了保障关键业务的持续运营并满足与业务部门协定的服务等级协议,很多客户都需要建立灾备系统或者跨地域的容灾中心,但传统的灾备系统需要投入一套昂贵的重复 IT 资源,包括软件、计算、存储、网络等。异地容灾中心还需要单独建立容灾机房,为了保障容灾机房在灾难的情况下能顺利接管业务,还需要配备相应的技术人员保障容灾机房的运行。此外,灾备使用的技术栈与灾备系统范围也与灾难恢复难度、效率、实施和运维成本密切相关。

如果我们将以上三个灾备的维度及其关系加以归纳,将得到下图

这三个维度关系紧密且互相影响,在传统灾备方案中,客户常常不得不在其中进行取舍

  • 比如客户要获得灾备切换的高效与演练不中断复制的灾备技术方案,则需要投入可观的成本购买成对的具备此功能的中高端存储解决方案。
  • 如果客户需要保障 SLA 并且不打算投入太多资金在灾备构建上,则必然需要对灾备系统的范围进行激进的压缩限制并舍弃某些提升灾备深度的高阶技术。
  • 类似的,对成本与灾备覆盖度的追求需要建立在对 SLA 进行妥协的基础上。

步入云时代后,灾备的方式将获得全面的革新;充分利用云上诸如按用量计费,上至计算下至存储的全栈弹性能力,全套的自动化辅助服务等特性,将成为衔接三个维度至关重要的 “拼图”,为灾备领域开启全新的篇章。

 

使用 Amazon EBS 诠释云上灾备的守夜灯模式

亚马逊云科技所推崇的云上守夜灯模式的主旨是在大部分时间使用最低成本的资源承载灾备复制,而仅在需要开启灾备系统时利用云上的弹性特性将系统快速恢复至提供完全生产能力的资源配置状态。

为了进行更深入的解读,我们不妨回顾一下灾备端的数据在整体灾备中所处的角色,其通常由以下两个角色组成,这在 ISV 数据库厂商的复制方案里尤为常见:

  1. 持续接收从生产传输过来的数据增量
  2. 在演练/切换时承载灾备系统的数据访问

同一时间同一数据载体只能担任其中一个角色,如下图所示

在这种传统复制场景中,由于目标端平时只承载磁盘写入,利用 Amazon EBS 可以在复制 “目标系统” 阶段配置最低满足写入性能要求的磁盘类型 (如 st1/sc1),而在演练开始 2 以后使用 EBS 弹性类型修改特性动态改变磁盘类型至高性能类型磁盘 (如 gp3),以达到弹性降本的要求。不止于此,利用 Amazon EBS 的快照特性在灾备演练时将两个角色剥离开来,从而在保留弹性成本降低的前提下实现不中断的演练特性。

而克隆出来的系统在灾备演练完成后可以进行完全的清理,客户只需为其演练期间的成本付费。

Amazon CloudEndure 产品便是这个思想的最好诠释者。

 

相关文章