Failover et Failback suite à un incident
Dernière mise à jour
Dernière mise à jour
Les opérations de Failover et Failback aident à garantir qu’une entreprise fonctionnera même si un sinistre frappe son site de production. Le Failover est un processus qui consiste à passer de la VM d'origine sur l'hôte source à son réplica sur un hôte du site de secours. Le Failback est un processus de retour du réplica à la VM d'origine.
Veeam Backup & Replication propose les opérations de Failober et Failback suivantes :
Le Failover est un processus qui consiste à passer de la VM d'origine sur l'hôte source à son réplica sur l'hôte cible.
Pendant le Failover, Veeam Backup & Replication remet en production une VM entièrement fonctionnelle depuis un point de restauration sur l'hôte cible. Ainsi, la VM est opérationnelle en quelques secondes, et les utilisateurs peuvent accéder aux services et applications dont ils ont besoin avec un minimum d'interruption.
Quand un Failover est lancé, l'état de la VM d'origine sur l'hôte source n'est en aucun cas affecté. Si le besoin de tester la capacité de récupération depuis le réplica et ses points de restauration est exprimé, il est possible d'effectuer un Failover pendant que la VM d'origine est en cours d'exécution. Après tous les tests nécessaires, il est possible d’annuler le Failover et revenir au mode de fonctionnement normal. Comme autre moyen de test, Veeam Backup & Replication propose également la technologie SureReplica. Pour plus d'informations, voir le chapitre SureReplica.
Dans un scénario de reprise après sinistre, après avoir testé le réplica et s'être assuré que la VM fonctionne de manière stable, il est nécessaire de passer à une autre étape pour effectuer un Failover permanent.
Si les VMs du site de production doivent être éteintes dans le cas d’une migration de site, d’une maintenance ou d’une mise à niveau logicielle des VMs primaires, une migration planifiée vers les réplicas peut être mise en œuvre.
Un Planned Failover permet de passer de la VM de production à son réplica avec un temps d’interruption le plus court possible. Il est également possible d'effectuer un Planned Failover dans le cas où l'administrateur est averti à l'avance de l'approche d'un sinistre qui nécessitera la mise hors ligne des serveurs primaires.
Dans le cas d’un nombre important de VMs exécutant des applications interdépendantes, il est important de pouvoir basculer ces VMs sur le site distant une par une, dans un ordre bien défini, comme faisant parties d'un même groupe applicatif. Pour effectuer cette opération automatiquement, Veeam Backup & Replication permet de préparer un Failover Plan.
Un Failover Plan permet de définir l'ordre dans lequel les VMs doivent être redémarrées ainsi que l’intervalle de temps devant être respecté entre chacune d'elles. Cet intervalle de temps permet de s'assurer que certaines VMs, comme un serveur DNS, sont déjà en cours d'exécution au moment où les VMs dépendantes démarrent. Le délai est défini pour chaque VM du Failover Plan, à l'exception de la dernière VM de la liste.
Le Failover Plan doit être créé en amont.
Dans le cas où le groupe de VMs serait indisponible ou éteint (offline), le Failover Plan correspondant à ce groupe applicatif peut être lancé manuellement. Lors de son lancement, il est possible de choisir le dernier état ou un point de restauration au choix pour remettre en production l’ensemble des VMs. Veeam Backup & Replication recherchera les points de restauration les plus proches du point choisi et les utilisera pour démarrer les répliques de VM. Les VMs sources ne seront pas mises hors tension.
Le Permanent Failover est l'un des deux moyens de finaliser un Failover (il est possible d’effectuer un Permanent Failover ou un Failback, cf partie suivante). Pour finaliser le processus de Failover, Veeam Backup & Replication permet la bascule permanente vers le réplica.
L’opération de Permanent Failover peut être effectuée dans le cas où l’administrateur souhaite passer de façon définitive de la VM d'origine à un réplica et utiliser ce réplica comme nouvelle VM d'origine.
À la suite du Permanent Failover, le réplica cesse d'exister en tant que réplica et reprend le rôle de la VM d'origine.
Pour ramener un réplica à son état antérieur au Failover, il est tout simplement possible d’annuler ce Failover.
Lorsque l'Undo Failover est lancé, l'administrateur repasse du réplica à la VM d’origine. Veeam Backup & Replication annule toutes les modifications apportées au réplica pendant qu'il était en état “Failover”.
Le scénario d’Undo Failover est utilisé dans le cas où le réplica est utilisé à des fins de tests ou de troubleshoot et qu'il faut revenir au mode opérationnel nominal.
Le Failback est l'un des deux moyens de finaliser un Failover. Lors d'un Failback, l'adminsitrateur repasse à la VM de production à partir du replica de VM, en déplaçant les E/S du site DR vers le site de production.
Veeam Backup & Replication propose les options suivantes pour effectuer un retour arrière (Failback) :
Revenir à la VM d'origine dans l'emplacement d'origine
Effectuer un Failback sur une VM déjà restaurée vers un nouvel emplacement. Cette VM doit être restaurée avant d'effectuer un Failback. Par exemple, une VM restaurée depuis une sauvegarde.
Effectuer un Failback sur une VM restaurée à partir d'un réplica vers un nouvel emplacement, ou vers n'importe quel emplacement mais avec des paramètres différents. La VM sera restaurée à partir du réplica pendant le processus de retour en arrière.
Les deux premières options permettent de réduire le temps de restauration et l'utilisation du trafic réseau car Veeam Backup & Replication n'a besoin de transférer que les différences entre la VM originale/restaurée et le réplica. Concernant la troisième option, Veeam Backup & Replication doit transférer l'ensemble des données de la VM, y compris sa configuration et le contenu du disque virtuel. Il est préférable d’utiliser la troisième option seulement s’il n’est pas possible d'utiliser la VM originale ou de la restaurer à partir d'une sauvegarde.
Lors d’un Failback, les changements sont uniquement envoyés à la VM originale/restaurée mais ne sont pas publiés. La VM originale/restaurée doit être testée pour vérifier si elle fonctionne avec ces changements.
En fonction des résultats du test, il est possible de procéder comme suit :
Lorsque le Failback est validé, cela confirme le fait de revenir sur la VM originale. Veeam Backup & Replication revient au mode de fonctionnement normal et reprend les activités de réplication pour la VM d'origine sur laquelle le retour arrière a été confirmé.
Si la VM d'origine ne fonctionne pas comme prévu après l'opération de Failback, il est tout simplement possible d’annuler le Failback et revenir sur le réplica.
Le schéma suivant peut aider quant au choix de l’opération à effectuer :