灾难恢复和备份

XenServer 灾难恢复 (DR) 功能允许您从破坏整个池或站点的硬件故障中恢复虚拟机 (VM) 和 vApp。有关如何防止出现单服务器故障的信息,请参阅高可用性

注意:

要使用 DR 功能,您必须以 root 帐户身份登录,或具有池操作员或更高级别的角色。

了解 XenServer DR

XenServer DR 的工作原理是:将恢复业务关键型 VM 和 vApp 所需的全部信息存储在存储库 (SR) 中。然后将 SR 从主(生产)环境复制到备份环境。当主站点上受到保护的池出现故障时,可以从在辅助 (DR) 站点上重新创建的已复制存储恢复该池中的 VM 和 vApp,从而最大限度地减少对应用程序或用户造成的停机时间。

XenCenter 中的灾难恢复设置可以用于查询该存储并在灾难期间将选定的 VM 和 vApp 导入恢复池。当这些 VM 在恢复池中运行时,恢复池的元数据也会被复制。复制池元数据可以在主池恢复时将对 VM 设置进行的任何更改填充回主池。有时,同一个 VM 的信息可能位于多个位置。例如,位于主站点中的存储、位于灾难恢复站点中的存储,以及要将数据导入至的池中。如果 XenCenter 发现 VM 的信息位于两个或两个以上的位置,它可以确保其仅使用最新的信息。

可通过 XenCenter 和 xe CLI 使用灾难恢复功能。有关 CLI 命令,请参阅灾难恢复命令

提示:

还可以使用灾难恢复设置运行测试故障转移,以便对灾难恢复系统进行非中断性测试。在测试故障转移中,所有步骤都与故障转移过程相同。但是,VM 和 vApp 在恢复到灾难恢复站点后不会启动。测试完成后,将执行清理以删除在 DR 站点上重新创建的所有 VM、vApp 和存储。

XenServer VM 包含两个组件:

  • 由 VM 使用的虚拟磁盘,存储在 VM 所在池中配置的存储库 (SR) 中。

  • 描述 VM 环境的元数据。如果原始 VM 不可用或损坏,则需要此信息以重新创建 VM。大多数元数据配置数据会在创建 VM 时写入,而且仅在对 VM 配置进行了更改时才会更新。对于池中的 VM,此元数据的副本存储在池中的每个服务器上。

在 DR 环境中,将使用池元数据和有关池中所有 VM 和 vApp 的配置信息在辅助站点上重新创建 VM。每个 VM 的元数据都包含其名称、说明、通用唯一标识符 (UUID)、内存、虚拟 CPU、网络连接配置和存储配置。还包括 VM 启动选项 - 启动顺序、延迟间隔、高可用性和重新启动优先级。在高可用性或 DR 环境中重新启动 VM 时,将使用 VM 启动选项。例如,在灾难恢复期间恢复 VM 时,vApp 中的 VM 将按照 VM 元数据中指定的顺序,以指定的延迟间隔在 DR 池中重新启动。

DR 基础结构要求

要使用 XenServer DR,需要在主站点和辅助站点均设置适当的 DR 基础结构。

  • 用于池元数据 VM 所用虚拟磁盘的存储都必须从主(生产)环境复制到备份环境。例如,使用镜像的存储复制因设备而异。因此,请咨询存储解决方案供应商以了解如何处理存储复制。

  • 在恢复到 DR 站点上的池中的 VM 和 vApp 启动并运行后,必须复制包含 DR 池元数据和虚拟磁盘的 SR。该复制允许在主站点重新联机时将恢复后的 VM 和 vApp 复制回主站点(故障恢复)

  • DR 站点的硬件基础结构无需与主站点的硬件基础结构保持一致。但是,XenServer 环境的版本和修补级别必须相同。此外,还必须在目标池中配置足够的资源,才能重新创建和启动所有故障转移的 VM。

警告:

灾难恢复设置不会控制任何存储阵列功能。

使用灾难恢复功能的用户必须确保以某种方式在两个站点之间复制元数据存储。某些存储阵列包含可自动执行复制的“镜像”功能。如果您使用这些功能,则必须先禁用镜像功能(“镜像已损坏”), 然后再重新启动恢复站点上的 VM。

部署注意事项

请在启用灾难恢复之前查看以下步骤。

灾难发生之前执行的步骤

下一节将介绍在灾难发生之前执行的步骤。

  • 配置 VM 和 vApp。

  • 记下将 VM 和 vApp 映射到 SR 的方式,以及将 SR 映射到 LUN 的方式。命名 name_labelname_description 参数时要特别小心谨慎。如果 SR 的名称体现了将 VM 和 vApp 映射到 SR 的方式,以及将 SR 映射到 LUN 的方式,则从复制的存储恢复 VM 和 vApp 将更简单。

  • 安排 LUN 的复制。

  • 允许将池元数据复制到这些 LUN 上的一个或多个 SR。

  • 确保要将主池的元数据复制到的 SR 仅连接到一个池。

灾难发生之后执行的步骤

下一节将介绍在灾难发生之后执行的步骤。

  • 中断任何现有的存储镜像,使恢复站点可以对共享存储进行读/写访问。

  • 确保要用来恢复 VM 数据的 LUN 未连接到任何其他池,否则数据可能会被破坏。

  • 如果要防止恢复站点发生灾难,则必须允许将池元数据复制到恢复站点的上一个或多个 SR。

恢复之后执行的步骤

下一节将介绍在成功恢复数据之后执行的步骤。

  • 重新同步任何存储镜像。

  • 在恢复站点上,彻底关闭要移回到主站点的 VM 或 vApp。

  • 在主站点上,按照与上一节中所述故障转移过程相同的过程,将选定的 VM 或 vApp 故障恢复到主站点。

  • 要防止主站点在将来发生灾难,必须重新允许将池元数据复制到所复制的 LUN 上的一个或多个 SR。

灾难恢复和备份