Les bonnes résolutions selon Garaia pour 2024

Oui oui oui, ho! ho! ho!, bonne année, meilleurs vœux et tout et tout.

Les bonnes résolutions, c’est top : projettons nous dans un mois : C’est un jeudi, vous revenez de votre nouvelle gym, fièr·e d’avoir arrêté la clope, un sandwich au cèleri et sans gluten dans la poche, heureu·x·se de la reprise , ce soir, des moments “jeux de société” avec vos enfants, enthousiaste à l’idée de pouvoir ensuite continuer votre programme du “1 livre par mois” (c’est vrai que la lecture vous a manqué et en plus vous avez commencé par du lourd: “Les nouvelles nourritures “, tout le monde dit que c’est bien!!)

Plus tard, vous irez à votre formation pour acquérir la nouvelle compétence professionnelle qui va élargir vos horizons. Mais avant, vous avez rendez-vous avec Claude, à qui vous devez donner les clefs pour évoluer dans son rôle, c’est vrai que votre management laissait un peu à désirer à la fin de l’année.

C’est bon, on a bien toutes les résolutions bateau ? 😅

… et là, vous sortez de l’ascenseur quand Andrea vous dit, ou plutôt vous hurle : “LE SITE EST DOWN, L’APPLI DOWN, TOUT EST DOWN!”

En tant qu’executif, vous restez calme bien-sûr mais le stress monte.

Vous posez quelques questions, et la sentence tombe : Le serveur est tombé. Pire, c’est tout le data center d’UBH qui est tombé.

Vous demandez : “On a le backup d’hier ?”
Andrea vous répond “Oui (vous soufflez), mais dans le data center” (Argh)
– Mais non! toutes les transactions d’aujourd’hui sont perdues ?
– On a bien le backup de dimanche sur le disque du patron… suggère Andrea.
– Donc soit on attend que UBH redémarre et nous redonne nos backups (s’ils le peuvent un jour), soit on redémarre aujourd’hui et on a travaillé 3 jours pour rien?
– Oui, à condition qu’on arrive à avoir un nouveau serveur dans la journée, en ce moment, ils annoncent 48h de delai, vous achève Andrea.

Bref, votre journée est foutue, votre semaine est foutue,
– ce soir vous allez manger un mauvais kébab en regardant votre équipe tenter de remettre l’infra sur pieds, tout en vous lamentant sur les objectifs qui ne seront du coup jamais atteints.
– en rentrant vous allez regarder TikTok parce que “OMG get real Gide!” et y’a pas intérêt que les gosses fassent des histoires pour aller se coucher “sinon ça va barder”… “au fait chéri(e), tu crois que je peux me faire encore rembourser l’abonnement de la gym?”.

A la poubelles vos bonne résolutions et Rendez-vous le 31 décembre 2024 !

Ça fait peur hein? (et un peu rire, on espère), mais sachez que cette situation (un peu romancée) est pourtant celle que nous ont décrit nos clients lors de la chute d’un celèbre data center, il y a quelques temps, ou plus simplement suite à la faille de l’alimentation d’un serveur, au crash d’un disque, etc.

Et si… Et s’il avait été possible d’éviter tout ça ? Finalement c’est si simple, surtout quand on est bien accompagné 😀 .

1. Je virtualise mon infrastructure

Première étape, on virtualise.

Votre serveur n’est plus un serveur, c’est un ensemble de resources (processeur, RAM, disque, réseaux) que vous pouvez isoler, sauvegarder, exporter, et manipuler un peu comme un fichier.

Qu’est ce que ça change pour vos organisation, que devez vous adapter ? Rien. C’est rigoureusement la même chose pour commencer. Corrolaire : il n’y a pas de contexte dans lequel un serveur virtuel ne peut se substituer à un serveur physique.

Qu’est ce que ça coûte ? Rien. La couche de virtualisation prend zéro cpu et quelques mégas de RAM par machine. Mieux, c’est à terme le moyen de réaliser d’importantes économies. C’est d’ailleurs grâce à elles que les leaders du public cloud peuvent opérer un business model si profitable.

Mais l’idée là est avant tout de vous rendre résilient.

2. Je deviens redondant

Une machine virtuelle sur un serveur c’est bien, mais la même machine virtuelle sur plusieurs serveurs c’est mieux.

Plutôt que de dépendre du backup sur le disque du patron, avoir vos machines virtuelles réparties sur plusieurs sites vous garantit la capacité de redémarrer vos services sans délai depuis l’un ou l’autre site de façon transparente.

3. Je fais des snapshots / de la réplication

Vous avez une infrastructure redonée sur deux sites différents ? Bien ! Quid de la fraîcheur de vos données? Les fameuses “transactions du jour” : Une stragégie de réplication de vos ressources est indispensable pour optimiser vos scénrios de disaster recovery.

4. Je fais des backups

Avec la redondance et la réplication, vous avez une infrastructure incassable. Mais que se passe t il lorsque vous vous rendez compte qu’une erreur d’écriture a été faite il y a 3 semaines, qu’un fichier a été effacé par erreur vendredi dernier ?

L’infra est synchronisée, les erreurs sont propagées. Seul recours, une stratégie de backups efficaces. Et si on vous gardait l’historique de vos fichiers sur 7 jours, 4 semaines, 3 mois et 1 an (soit 15 points de sauvegarde par fichier), dédupliqués, chiffrés, compressés et surtout vérifiés ? Ça n’empêche pas l’erreur humaine, mais permet d’y remédier, et c’est pas la mer à boire.

5. Je monitore et j’anticipe

Bien sûr, on entend tous parler du dernier crash d’un data center, mais pour une société touchée par un crash de datacenter (tout de même rares), combien tombent à cause d’un disque système plein à craquer, d’une fuite de resources, et d’autres problèmes strictement internes ?

C’est pourtant évitable: quelques sondes bien placées et des alertes configurées, et on évite le drame.

Bonus : J’adapte mes process

Vous avez maintenant la capacité de lancer des machines virtuelles en quelques secondes, cela vous donne une flexibilité nouvelle que vous devriez exploiter.

Adaptation des process de développement, CI/CD, compartimentation des process, limite des resources par application, tests A/B, tout un monde de possibilités s’ouvre à vous et Garaia peut vous donner des idées pour les mettre en place !

Leave a Reply

Your email address will not be published. Required fields are marked *