Les pannes non planifiées, les cyberattaques et les catastrophes naturelles peuvent survenir sans crier gare. Par conséquent, votre organisation pourrait perdre des données ou subir des périodes d’indisponibilité risquant de perturber ou d’interrompre vos activités opérationnelles essentielles. Les pannes non planifiées peuvent être coûteuses et avoir des effets durables sur vos activités. Dans le cadre de votre approche générale visant la continuité de vos activités, avec un minimum de temps d’arrêt, nous vous recommandons d’intégrer un plan de reprise informatique à vos activités de planification. Votre plan de reprise informatique doit identifier les données, les applications et les processus critiques. De plus, il doit définir comment procéder pour la reprise des services des TI afin de soutenir les opérations, les produits et les services de votre organisation.
Sur cette page
- Tolérance de votre organisation face aux possibles perturbations opérationnelles
- Fonctions, applications et données critiques de votre organisation, classées les selon leur priorité
- Création d’un plan de reprise informatique
- Choix d’une stratégie de reprise
- Tests de votre plan de reprise informatique
- En savoir plus
Votre plan de reprise informatique doit clairement identifier et documenter les éléments à rétablir après un incident, le moment et l’endroit approprié pour ce faire ainsi que les personnes responsables.
En général, il existe trois types de plans de reprise pertinents pour les organisations. Ceux-ci prennent en considération les événements majeurs pouvant causer une panne non planifiée et nécessitant d’appliquer des mesures d’intervention et de reprise.
- Plan d’intervention en cas d’incident : Plan centré sur les événements qui s’applique spécifiquement à un incident de sécurité qui affecte une organisation, comme une cyberattaque.
- Plan de continuité des activités : Plan pour assurer une reprise rapide des opérations les plus critiques en cas de catastrophe, comme défini dans l’analyse des répercussions sur les opérations.
- Plan de reprise après sinistre : Plan global pour un retour aux opérations complètes de votre organisation après une catastrophe.
Tolérance de votre organisation face aux possibles perturbations opérationnelles
Lors de la mise au point d’un plan de reprise efficace, vous devez adapter votre stratégie afin de répondre aux impacts associés aux incidents pouvant survenir dans votre organisation. Votre plan doit également préciser le niveau d’interruption acceptable pour votre organisation, le cas échéant. Il existe trois mesures clés à prendre en considération dans votre plan :
- Période d’indisponibilité maximale : Période totale d’indisponibilité de processus sans que cela cause des dommages importants à vos activités.
- Objectif de point de rétablissement : Mesure du niveau de perte de données tolérable pour votre organisation.
- Objectif de délai de rétablissement: Temps prévu et niveau de service nécessaires pour répondre aux attentes minimales du propriétaire du système.
Fonctions, applications et données critiques
Votre plan doit déterminer les données, les applications et les fonctions critiques de votre organisation. Les données critiques incluent les dossiers financiers, les actifs exclusifs et les données personnelles.
Les applications critiques sont les systèmes qui permettent d’exécuter vos fonctions d’affaires clés et qui sont essentiels à vos activités. Elles correspondent aux systèmes devant être rétablis immédiatement en cas de panne non planifiée pour la continuité des activités.
Pour établir vos fonctions, applications et données critiques, vous devez mener une évaluation des risques qui permettra d’identifier les menaces et les vulnérabilités. De plus, pour déterminer les participantes et participants et les parties prenantes concernés, vous pouvez appliquer différents scénarios particuliers (cyberattaque, panne majeure ou catastrophe naturelle). Une évaluation de tels scénarios vous aidera également à répondre à vos risques les plus probants, à mettre au point des stratégies d’atténuation et à établir les délais et les efforts de reprise.
Menez une analyse des répercussions sur les opérations (ARO) pour prédire les effets des interruptions ou des incidents sur vos activités, vos processus opérationnels, vos systèmes et vos finances. Lors de votre ARO, vous devez aussi évaluer les données collectées et les applications utilisées afin de déterminer leur criticité et d’établir les priorités pour une reprise immédiate.
Création d’un plan de reprise informatique
Réalisez les étapes suivantes lors de la création du plan de reprise informatique de votre organisation.
- Déterminez les parties prenantes, y compris les clientes et clients, les fournisseurs, les propriétaires opérationnels, les propriétaires des systèmes et les gestionnaires.
- Sélectionnez les membres de votre équipe d’intervention et affectez les rôles et responsabilités connexes.
- Réalisez l’inventaire de votre matériel, de vos logiciels et de vos actifs.
- Déterminez les fonctions, les applications et les données critiques de votre organisation, classez-les selon leur priorité.
- Établissez des objectifs de reprise clairs.
- Définissez les stratégies de sauvegarde et de reprise.
- Testez votre plan périodiquement.
- Mettez au point un plan de communication afin d’informer les principales parties prenantes.
- Mettez au point un programme de formation pour les employées et employés afin de vous assurer que toutes les personnes connaissent leurs rôles et leurs responsabilités, ainsi que l’ordre de déroulement des opérations en cas de panne non planifiée.
- Engagez des fournisseurs de services gérés, au besoin, pour fournir de l’aide supplémentaire et faciliter vos efforts de reprise.
Choix d’une stratégie de reprise
Il existe différentes options à considérer lors de la mise en œuvre d’une stratégie de reprise. Vous devez toutefois choisir une stratégie qui saura répondre à vos besoins d’affaires et à vos exigences de sécurité.
Site branché, site chaud, salle blanche
- Site branché
- Site de secours avec les mêmes serveurs et équipements que votre site principal.
- Fonctions identiques au site principal et exécution en continu afin d’assurer le relais en cas de panne.
- Synchronisation des données (période variant de quelques minutes à quelques heures) afin de réduire les risques de perte de données.
- Site chaud
- Site de secours doté d’une connectivité réseau et de quelques éléments d’équipement.
- Nécessite une configuration pour fonctionner au maximum de la capacité, comparativement à votre site principal.
- Synchronisation des données survenant moins souvent, ce qui peut ainsi causer certaines pertes de données.
- Salle blanche
- Site de secours présentant peu ou pas d’équipement.
- Nécessite plus de temps et de ressources pour la configuration et le rétablissement des activités opérationnelles.
- Synchronisation des données pouvant être difficile et longue, car les serveurs devront être migrés de votre site principal (ce qui peut mener à des risques plus élevés de perte de données).
Réplication du stockage
Une réplication de stockage est une copie de vos données en temps réel d’un emplacement vers un autre au moyen d’un réseau de stockage, d’un réseau local ou d’un réseau étendu. Puisque la réplication s’effectue en temps réel, on utilise souvent le concept de réplication synchrone pour y référer. Vous pouvez aussi exploiter une réplication asynchrone, qui crée une copie des données au moyen d’un horaire prédéfini.
Redondance de disques
Une redondance de disques réplique les données sur deux ou plusieurs disques durs. Le système de redondance pourra alors automatiquement basculer les données critiques sur un serveur ou un réseau de secours après une panne non planifiée de votre système principal. De plus, même si vous n’êtes pas en mesure de rétablir vos systèmes, la copie redondante pourra vous être d’un grand secours. Il est cependant important que la copie mise en miroir soit sauvegardée sur un serveur ou un emplacement séparé qui ne risque pas d’être affecté par une panne.
Reprise infonuagique ou locale
Une plateforme de reprise infonuagique vous permet une connectivité facile, à partir de n’importe où, au moyen d’une grande variété de dispositifs. Une telle plateforme favorise ainsi une sauvegarde fréquente de vos données. De plus, ce type de solution peut être moins coûteux du point de vue de l’achat et des opérations d’entretien, comparativement à une plateforme locale, car vous ne payez que pour l’espace nécessaire, au moment où vous en avez besoin. Le recours au nuage peut également permettre de réduire ou d’éliminer le recours à un site de reprise hors site séparé.
Tests de votre plan de reprise informatique
Les tests sont très importants. Ils permettent de repérer les incohérences et de traiter les points devant être réévalués. Assurez-vous toutefois d’utiliser un environnement de test afin d’éviter d’interrompre vos activités. Voici quelques exemples de stratégie de test :
- Liste de vérification : Lisez tous les éléments de la liste et expliquez les étapes du plan de reprise
- Parcours : Parcourez les étapes sans toutefois les réaliser
- Simulation : Simulez un incident ou une catastrophe afin de familiariser l’équipe de reprise à leurs rôles et à leurs responsabilités
- Tests parallèles : Établissez et testez les systèmes de reprise afin de voir s’il est possible de réaliser les opérations pour soutenir les processus clés. Vos systèmes principaux resteront en mode de production complet pendant ce temps.
- Tests de transfert : Configurez vos systèmes de reprise afin d’assurer une reprise de toutes vos activités opérationnelles, puis déconnectez vos systèmes principaux. Ce type de test occasionne des perturbations des activités et nécessite une planification supplémentaire.
En savoir plus
- Sauvegarder et récupérer vos données (ITSAP.40.002)
- Êtes-vous victime de piratage? (ITSAP.00.015)
- Rançongiciels : comment les prévenir et s’en remettre (ITSAP.00.099)
- Conseils de cybersécurité pour le télétravail (ITSAP.10.116)
- Avantages et risques liés à l’adoption des services fondés sur l’infonuagique par votre organisation (ITSE.50.060)
- Facteurs à considérer par les clients de services gérés en matière de cybersécurité (ITSM.50.030)
- Élaborer un plan d’intervention en cas d’incident (ITSAP.40.003)
- Plan de continuité des activités (ITSAP.10.005)
- Renforcement de la cyberrésilience grâce à une meilleure préparation en cas d’urgence (ITSM.10.014)