:5 大场景与 4 例实践合集
不少企业都基于虚拟化/超融合架构支持多种核心应用系统与数据库。这些场景不仅涉及多种类型的工作负载,在数据可靠性层面也需要不同级别的保护策略,一些用户还面临灾备演练、集中容灾等更多样的容灾需求,因此,构建全面可靠、易用高效、节约成本的基础设施容灾方案,成为了不少用户的当务之急。
作为 SmartX 超融合原生的灾备软件,SMTX 备份与容灾融合了数据备份与异步复制两种功能,可为 SMTX OS 和 SMTX ZBS 用户提供“RPO≧15 分钟、RTO 分钟级”的数据保护,支持“两地三中心”容灾、集中容灾中心建设、同中心双生产集群实现互备、机房迁移、灾备演练等 5 大应用场景,降低企业灾备建设的复杂度、资源投入与管理成本。以下,我们将结合 SMTX 备份与容灾 2.1 版本功能特性,解读 SmartX 原生容灾能力和 5 大应用场景,并分享 4 例企业用户基于 SmartX 超融合和 SMTX 备份与容灾构建的容灾方案与灾备实践。
图片
扫码下载《SmartX 超融合容灾备份解决方案》,了解基于不同环境和两种虚拟化的完整容灾备份方案与用户实践!
SmartX 原生灾备能力:全面可靠、高效易用
SMTX 备份与容灾通过“复制与恢复”功能为 SmartX 超融合(SMTX OS)和分布式存储(SMTX ZBS)集群提供原生的、无代理的容灾能力。基于异步复制技术,复制与恢复功能支持同一站点内或两个站点间的数据复制(***小 RPO 为 15 分钟)、故障转移与故障恢复,一旦灾难发生,可快速将业务切换至灾备集群,并迅速恢复业务运行。
支持不同站点架构下的数据保护与容灾
复制与恢复功能支持在同一个站点/不同站点的多个集群之间进行副本对象数据同步、故障转移和灾难恢复,实现集群/站点级别的容灾保护。
站点内复制:由同一个 CloudTower 统一管理生产集群和灾备集群资源,生产集群和灾备集群共用系统服务的产品许可,不需要重新导入并部署对应的系统服务。
站点间复制:支持站点级别容灾,若 CloudTower 单点故障或站点整体故障导致所关联的 CloudTower 不可用时,仍可在灾备站点进行保护对象的故障处理,***业务连续性。
图片
多重技术结合,实现高效数据同步
通过跳过未分配/全零/未改动的数据块、断点传输等技术优化,减少复制数据量。支持多卷/虚拟机并发复制,提升多复制任务执行时的传输速度。
图片
灵活的运行策略,满足不同业务场景的用户需求
支持自定义复制周期,在首次进行全量复制后可按周/日/小时/分钟为粒度设置增量复制周期,每次复制后为副本虚拟机创建快照作为恢复点(***多 16 个以应对数据损坏),根据恢复点保留策略自动清理恢复点和快照。
提供定制化的运行策略,支持设定复制时间窗口和复制任务数量/传输速率,确保复制服务在期望的时间段内执行,同时支持用户通过负载均衡有效控制复制服务所占用的系统资源,降低复制任务在高峰期运行时对其他业务的影响。
洞察多维度应用场景差异,选择***故障处理策略
支持批量故障转移(紧急故障转移和计划性故障转移)、故障恢复和***性故障转移。
紧急故障转移:当原对象不能继续提供服务时,使用历史恢复点拉起副本对象,实现业务的快速恢复,***程度降低因灾难导致的停机时长。通常应用于突发性灾难等计划外的转移场景。
计划性故障转移:结合复制和故障转移,在转移业务至副本对象前先将原对象的数据同步至副本对象,实现零数据丢失的业务切换,为业务连续性提供可靠的保障。通常应用于灾备演练、灾难预警或迁移复制对象等有计划的转移场景,着重于确保数据的可恢复性(RPO=0)。
故障恢复:在原对象恢复正常后,将故障转移期间副本对象产生的数据增量同步回原对象,由原对象继续提供服务并恢复周期性的自动复制。
***性故障转移:当原对象无法恢复,将原对象***切换到副本对象,并从复制计划移除原对象,将副本对象转化为普通资源对象,持续提供服务。
图片
多重策略减少虚拟机故障后停机时间
支持通过统一的管理界面来配置完善的故障处理策略,用户可提前编排虚拟机的恢复策略以及副本虚拟机的网络设定,实现应用系统在不同集群间快速的容灾。
支持编排故障处理中虚拟机的恢复顺序:通过指定启动顺序和启动延迟,按照设置的顺序恢复应用系统,确保关键虚拟机首先被恢复,提升业务连续性。
支持虚拟机网络映射:支持将原虚拟机使用的虚拟机网络映射到目标集群中指定的虚拟机网络,以确保副本虚拟机能够正常连通网络。
支持 IP 网络映射:支持设置 IP 映射规则,将原虚拟机的 IP 地址映射到可在目标集群使用的 IP 地址。进行故障转移时,复制服务会根据匹配的 IP 映射规则来设置副本虚拟机的信息,确保副本虚拟机在启动后能够使用正确的网路配置。
5 大应用场景:满足多种数据保护需求
场景一:“两地三中心”容灾
图片
用户可基于 SmartX 超融合构建同城双活集群和异地灾备集群,实现覆盖站点级别和城市级别的故障容灾。其中,同城集群可用域之间可通过数据副本实现实时同步,可用域故障后 VM 自动在另一可用域拉起,达到“RPO = 0,RTO 分钟级”的容灾效果;异地集群通过 SMTX 备份与容灾实现数据周期性复制,双活集群整体故障后可将业务切换至灾备集群,达到“RPO ≥ 15 分钟,RTO 分钟级”的容灾效果。
场景二:集中容灾中心
图片
用户可基于 SmartX 超融合构建集中容灾中心,通过 SMTX 备份与容灾为多个生产数据中心提供灾备保护。
统一容灾:***一个业务中心遭受灾难,容灾中心都可接管业务并进行数据恢复,便于业务的快速切换。
集中管理:副本数据集中管理,便于用户在不影响生产业务的情况下,对数据进行分析和挖掘,充分利用数据价值。
降低总拥有成本:通过复用灾备中心的方式规避了多地分散建设灾备集群所致的高额成本投入,显著提升整体容灾架构性价比和资源利用率。
场景三:同中心双生产集群实现互备
图片
基于 SmartX 超融合架构,在同中心两个生产集群中分别构建容灾资源池,实现互相灾备——生产集群既支持生产业务运行,也承载另一生产集群的副本虚拟机和备份数据。
大幅降低灾备建设成本:无需额外采购完整的灾备一体机,仅需扩展生产集群部分节点即可承载容灾资源;生产集群同时承担业务运行、备份存储和副本数据资源池,***化硬件利用率。
运维管理高效便捷:无需部署多套独立系统,减少异构存储系统的维护复杂度;CloudTower 集中管理备份与复制数据,降低多系统协调成本。
灾备资源池灵活多用:灾备资源规模可动态调整,避免过度投入,降低总体拥有成本;文件存储轻松应对业务规模变化,为多种业务提供高效存储支持。
场景四:机房迁移
图片
用户可利用 SMTX 备份与容灾,先将生产数据中心数据复制到灾备中心,再将数据跨集群迁移至新生产机房,降低迁移风险。
***迁移效率与数据安全:利用故障转移,将业务分批转移,支持虚拟机转移顺序的编排,快速拉起业务。搭配备份服务,亦可实现多重数据副本,确保数据安全性。
跨集群迁移虚拟机:支持在不同的物理服务器之间进行跨集群迁移。支持多种迁移方式,实现虚拟机灵活调度,保障业务连续性。
软硬解耦,搬迁风险低:数据通过数据同步存储在灾备机房的存储设备中,即使搬迁中出现硬件损坏,不影响业务。完成数据迁移后,允许在任意时间点进行物理搬迁.
场景五:灾备演练
* 该场景方案将在 2025 年 Q2 初支持
图片
结合 SMTX 备份与容灾的故障转移测试功能和 Everoute VPC 功能,用户可在既有环境中复制生产环境虚拟机进行灾备演练,而不影响生产环境的正常业务开展。
无需单独构建演练环境:借助 VPC 网络隔离特性,在当前环境中构建隔离区域,直接利用测试虚拟机进行灾备演练。
生产业务无感知:源端虚拟机业务不中断不停机,测试虚拟机独立于源端虚拟机,测试行为不会干扰源端虚拟机数据状态。
测试流量不干扰现有环境:演练过程中***网络流量波动、测试数据的注入都被限制在隔离区域,不会影响生产环境中的业务。
4 例用户实践
某头部汽车部件制造商:基于 SMTX 备份与容灾构建全栈化灾备管理体系
某头部汽车部件制造商在国内多个地区设有数据中心,支持生产业务与开发测试工作。其中,某地区工厂需要搬迁,新建数据中心需要在搬迁周期内完成高可用架构搭建。同时,用户也希望借此机会对两个地区的数据中心基础架构进行改造,通过统一的管理平台实现全域资源纳管,以单一平台支持两地集群的监控、策略配置、备份容灾等操作。
考虑到超融合架构软硬件解耦的特性,用户选择基于 SmartX 超融合构建两地数据中心基础设施,并针对同地区机房的两个生产集群实现了多重数据保护:
业务双活:同机房内部采用 25GbE Spine-Leaf 网络架构,两个生产集群通过负载均衡实现 I/O 无缝切换。
异步复制:用户在同机房构建了 4 节点超融合灾备集群,基于 SMTX 备份与容灾的复制与恢复功能,将两个生产集群(均为 9 节点)的虚拟机数据同步至灾备集群,网络采用单独的 10GbE,满足 RPO 15 分钟的要求。
数据备份:基于 SMTX 备份与容灾的备份与恢复功能,将两个生产集群的业务数据备份至外部 NAS 存储,网络复用云平台管理的 10GbE,满足 RPO 1 小时的要求。
图片
此次建设实践中,用户不仅基于 SmartX 超融合实现了统一的基础设施资源管理,还利用 SMTX 备份与容灾构建了分级容灾的多重保护体系,***化保障业务连续性的同时,降低容灾成本。
某日资柔性电路板制造商:基于 SmartX 超融合构建集中容灾中心,满足两地数据中心灾备需求
某日资柔性电路板制造商原采用 SmartX 超融合和传统三层架构支持生产业务系统。而传统架构上有部分服务器遭遇了勒索病毒攻击,考虑到超融合架构上的服务器并未受到勒索病毒影响,用户决定将更多核心生产业务迁移至 SmartX 超融合集群,并基于 SmartX 超融合(ELF 虚拟化)搭建集中容灾中心,为两地数据中心中的 3 个超融合集群提供统一的灾备保护,进一步巩固数据安全。
图片
目前,用户已在 A 地基于 SmartX 超融合构建了集中灾备中心,通过 SMTX 备份与容灾的复制与恢复功能,实现了“3 生产集群 : 1 灾备集群“的集中容灾布局,不仅为关键业务系统提供了可靠的数据保障,还规避了多地分散建设灾备集群所致的高额成本投入,显著提升整体容灾架构的性价比和资源利用效率。
某财务公司:同步实现同城数据中心容灾与信创转型
某财务公司基于业务升级计划上线了新的数据治理等系统,由于业务应用自身不具备容灾机制,需要通过底层基础架构实现容灾功能。根据公司先前的建设经验,需要分别部署两套 VMware 虚拟化集群和对应的集中式存储,通过存储 LUN 复制或架设存储网关来保障数据的可靠性,并通过虚拟机高可用或容灾产品来保障应用的连续性。而进一步调研后,用户发现该方案不仅面临大量的虚拟机存储规划和恢复策略配置工作,也难以满足 IaaS 层从硬件到软件的自主可控的要求。
在探索更多建设方案的过程中,用户开始考虑基于超融合构建同城两中心的容灾方案。经过全面的测试和评估,用户***终选择基于 SmartX 超融合信创基础设施进行同城容灾建设——用户同城双数据中心共部署两套基于海光架构服务器的 SmartX 超融合集群,承载新的业务系统及相关组件,包含国产数据库、中间件等。用户的两个自有数据中心建设在同城不同区域,相距 25 KM,通过 10GB 裸纤进行二层互联,共享应用业务和数据复制流量,两个数据中心间通过 SMTX 备份与容灾产品的复制与恢复功能,进行业务应用的复制和故障转移编排,达到“RPO>=15 分钟,RTO=分钟级”的同城容灾效果。
图片
得益于 SMTX 备份与容灾以虚拟机为单位的灵活保护策略,用户可批量地对虚拟机按照指定的时间间隔(RPO)将虚拟机的恢复点复制到目标集群,并支持通过 IP 地址映射和故障转移编排等功能,大幅降低用户的运维管理负担。
欲深入了解,请阅读:某财务公司:基于超融合实现同城数据中心容灾与信创转型。
某投资公司:以 SMTX 备份与容灾和 Everoute 保障超融合信创集群数据安全
某投资公司原使用 VMware 虚拟化和 NSX 支持生产业务系统,为迎接国产化转型浪潮,用户决定以国产超融合软件+信创硬件构建新集群,同时利旧原 VMware 集群的硬件搭建灾备集群,保障信创集群的稳定、连续运行。
在超融合选型时,用户***看重厂商的自研能力,尤其是平台的安全防护能力和备份容灾能力,需要具备与 VMware 同等的水平。经过多重测试验证,用户选择以 SmartX 超融合(采用原生虚拟化 ELF)搭配海光架构服务器构建信创集群,支持办公类应用系统及相关组件,包括国产数据库、中间件等。同时,采用 SMTX 备份与容灾和 Everoute,为信创集群提供双重保障:
利用 SMTX 备份与容灾的复制与恢复功能,将生产环境数据复制到基于原 VMware 硬件(Intel 架构服务器)搭建的 SmartX 超融合灾备集群。同时,利用备份与恢复功能,将生产环境虚拟机备份至利旧的 NAS 存储,提供数据可用性的同时降低灾备成本。
部署 Everoute 分布式防火墙,保障数据中心网络三层互联的同时实现网络流量的微分段防护。
图片
目前,该架构不仅成功帮助用户探索基础架构的信创转型,还可提供数据中心级别故障的防护与恢复能力,并在架构创新的同时降低硬件投入成本