XenCenter

Recuperación ante desastres (RAD)

La función de recuperación ante desastres (RAD) le permite recuperar VM y vApp de una falla catastrófica del hardware que inhabilita o destruye todo un grupo o sitio.

Para la protección contra fallos de un solo servidor, puede usar Alta disponibilidad. La alta disponibilidad reinicia las máquinas virtuales en un servidor alternativo en el mismo grupo.

Descripción de RAD

La recuperación ante desastres almacena toda la información necesaria para recuperar sus VM y vApps críticos para el negocio en repositorios de almacenamiento (SR). A continuación, estos repositorios de almacenamiento de información se replican desde su entorno principal (de producción) a un entorno de backup. Cuando falla un grupo protegido en el sitio primario, las VM y vApps de ese grupo se pueden recuperar del almacenamiento replicado y volver a crear en un sitio secundario (RAD). El resultado es un tiempo de inactividad mínimo de aplicaciones o usuarios.

Una vez que las máquinas virtuales recuperadas estén en funcionamiento en el grupo de DR, los metadatos del grupo de DR también se deben guardar en el almacenamiento que se replica. Esta acción permite restaurar las VM y vApps recuperadas en el sitio primario cuando vuelva a estar en línea.

Nota:

La recuperación ante desastres solo se puede utilizar con los tipos de almacenamiento LVM sobre HBA o LVM sobre iSCSI.

Las máquinas virtuales de Citrix Hypervisor constan de dos componentes:

  • Discos vDisk que utiliza la máquina virtual, almacenados en repositorios de almacenamiento (SR) configurados en el grupo donde se encuentran las máquinas virtuales.
  • Metadatos que describen el entorno VM. Los metadatos contienen toda la información necesaria para volver a crear la VM si la VM original no está disponible o está dañada. La mayoría de los metadatos se escriben cuando se crea la máquina virtual y solo se actualizan cuando se cambia la configuración de la máquina virtual. Para las máquinas virtuales de un grupo, se almacena una copia de estos metadatos en cada servidor del grupo.

En un entorno de recuperación ante desastres, las VM se vuelven a crear en un sitio secundario (RAD) a partir de los metadatos del grupo: información de configuración sobre todas las VM y vApps del grupo. Los metadatos de cada VM incluyen su nombre, descripción e identificador único universal (UUID), y su memoria, CPU virtual, redes y configuración de almacenamiento. También incluye las opciones de inicio de VM utilizadas al reiniciar la VM en un entorno de alta disponibilidad o RAD: orden de inicio, intervalo de retraso y prioridad de reinicio. Por ejemplo, al recuperar máquinas virtuales, las máquinas virtuales dentro de una vApp se reinician en el grupo RAD en el orden y con los intervalos de retardo especificados en los metadatos.

Nota:

Para usar la recuperación ante desastres, debe iniciar sesión como root o tener un rol de operador de grupo o superior.

Terminología sobre la recuperación

vApp: Grupo lógico de máquinas virtuales relacionadas que se administran como una sola entidad.

Sitio: grupo físico de grupos de recursos, almacenamiento y equipos de hardware de Citrix Hypervisor.

Sitio principal: Sitio físico que ejecuta máquinas virtuales o vApps que deben protegerse en caso de desastre.

Sitio secundario, sitio RAD: sitio físico cuyo propósito es servir como ubicación de recuperación para el sitio primario, en caso de desastre.

Conmutación por error: Recuperación de VM y vApps en un sitio secundario (recuperación) en caso de desastre en el sitio primario.

Conmutación por recuperación: Restauración de VM y vApps en el sitio primario desde un sitio secundario (recuperación).

Probar conmutación por error: Una conmutación por error “de prueba” en la que las VM y vApps se recuperan del almacenamiento replicado a un grupo en un sitio secundario (recuperación) pero no se inician. Se pueden ejecutar conmutaciones por error de prueba para comprobar que RAD está configurado correctamente y que los procesos son efectivos.

Metadatos de grupo: Información sobre las máquinas virtuales y vApps del grupo, como su nombre y descripción. Para las máquinas virtuales, la información de configuración incluye UUID, memoria, CPU virtual, configuración de redes y almacenamiento y opciones de inicio. Los metadatos del grupo se utilizan en RAD para volver a crear las VM y vApps desde el sitio principal en un grupo de recuperación en el sitio secundario.

Infraestructura de recuperación ante

Para utilizar la recuperación ante desastres, configure la infraestructura de DR adecuada tanto en los sitios principales como en los secundarios:

  • El almacenamiento utilizado tanto para los metadatos del grupo como para los discos virtuales utilizados por las VM se debe replicar desde su entorno principal (de producción) a un entorno de reserva. La replicación del almacenamiento, por ejemplo, mediante espejado, varía de un dispositivo a otro. Le recomendamos que utilice su solución de almacenamiento para gestionar la replicación del almacenamiento.
  • Después de que las VM y vApps recuperadas estén en funcionamiento en un grupo de su sitio de recuperación ante desastres, replique los SR que contienen los metadatos del grupo de recuperación ante desastres y los discos virtuales. Esta acción permite que las VM y vApps recuperadas vuelvan a restaurarse en el sitio primario (con error) una vez que el sitio primario vuelva a estar en línea.
  • La infraestructura de hardware de su sitio de DR no tiene que coincidir con el sitio principal. Sin embargo, el entorno de Citrix Hypervisor debe estar en el mismo nivel de versión y parche. Además, se deben configurar recursos suficientes en el grupo de destino para permitir que todas las máquinas virtuales de conmutación por error se vuelvan a crear e inicien.

Importante:

XenCenter y el asistente para recuperación ante desastres no controlan ninguna funcionalidad de arreglo de discos de almacenamiento. Asegúrese de que los metadatos del grupo y el almacenamiento utilizado por las máquinas virtuales que se van a reiniciar en caso de desastre se repliquen en un sitio de copia de seguridad. Algunas cabinas de almacenamiento contienen funciones de espejado para lograr la copia automáticamente. Si se utilizan estas funciones, inhabilite la funcionalidad de réplica antes de que las máquinas virtuales se reinicien en el sitio de recuperación.

Conmutación por error, conmutación por recuperación y conmutación por error de prueba con el asistente de recuperación ante desastres

El asistente de recuperación ante desastres simplifica la conmutación por error y la conmutación por recuperación. Los pasos involucrados en estos procesos se describen aquí:

Conmutación por error

  1. Elija un grupo de destino en su sitio secundario de recuperación ante desastres en el que quiera recuperar sus VM y vApps.

  2. Proporcione detalles de los destinos de almacenamiento que contienen los SR replicados desde su sitio principal. El asistente analiza los destinos y enumera todos los SR encontrados allí.

  3. Seleccione los SR que contienen los metadatos y los discos virtuales para las VM y vApps que quiere recuperar. El asistente analiza los SR y enumera todas las VM y vApps encontradas.

  4. Seleccione las máquinas virtuales y vApps que quiere recuperar en el sitio de recuperación ante desastres. Especifique si quiere que el asistente los inicie automáticamente cuando se hayan recuperado o si prefiere esperar e iniciarlos manualmente.

    El asistente realiza comprobaciones previas para asegurarse de que las VM y vApps seleccionadas se pueden recuperar en el grupo de recuperación ante desastres de destino. Por ejemplo, el asistente comprueba que todo el almacenamiento requerido por las VM y vApps seleccionados esté disponible.

Cuando se completan las comprobaciones previas y se resuelven los problemas, comienza el proceso de conmutación por error. Las VM y vApps seleccionadas se exportan desde el almacenamiento replicado al grupo de recuperación ante desastres. La conmutación por error ha finalizado.

Conmutación por recuperación

  1. Elija el grupo de destino del sitio principal en el que quiere restaurar las máquinas virtuales y vApps que se ejecutan actualmente en el sitio de recuperación ante desastres.

  2. Proporcione detalles de los destinos de almacenamiento que contienen los SR replicados de su sitio de recuperación ante desastres. El asistente analiza los destinos y enumera todos los SR encontrados.

  3. Seleccione los SR que contienen los metadatos y los discos virtuales para las VM y vApps que quiere restaurar. El asistente analiza los SR y enumera todas las VM y vApps encontradas.

  4. Seleccione las máquinas virtuales y vApps que quiere restaurar en el sitio principal. Especifique si quiere que el asistente los inicie automáticamente cuando se hayan recuperado o si prefiere esperar e iniciarlos manualmente.

    A continuación, el asistente realiza comprobaciones previas para asegurarse de que las VM y vApps seleccionadas se pueden recuperar en el grupo de destino en el sitio principal. Por ejemplo, el asistente comprueba que todo el almacenamiento requerido por las VM y vApps seleccionados esté disponible.

Cuando se completan las comprobaciones previas y se resuelven los problemas, comienza el proceso de conmutación por recuperación. Las VM y vApps seleccionadas que se ejecutan en su sitio de recuperación ante desastres se exportan del almacenamiento replicado al grupo seleccionado en su sitio principal.

La conmutación por recuperación ya está completa.

Si el asistente para recuperación ante desastres encuentra información para la misma máquina virtual en dos o más lugares, utiliza solo la información más reciente por máquina virtual. Por ejemplo, la información puede almacenarse en el almacenamiento del sitio principal, en el almacenamiento del sitio RAD y en el grupo al que se importan los datos.

Sugerencia:

Para facilitar la recuperación de VM y vApp, asigne un nombre a sus SR para indicar cómo se asignan sus VM y vApps a SR y los SR a LUNs.

También puede utilizar el asistente para recuperación ante desastres para ejecutar conmutaciones por error para realizar pruebas no disruptivas del sistema de recuperación ante desastres. En una conmutación por error de prueba, los pasos son los mismos que para la conmutación por error, pero las VM y vApps recuperadas se inician en un estado pausado en el sitio de recuperación ante desastres. La limpieza se realiza cuando finaliza la prueba para eliminar todas las máquinas virtuales, vApp y almacenamiento recreado en el sitio de recuperación ante desastres. Para obtener más información, consulte Probar conmutación por error.

Recuperación ante desastres (RAD)