Panne chez OVH, un incident sans précédent pour l’hébergeur français !

Panne chez OVH : Octave Klaba communique sur l’incident

Octave Klaba, fondateur et DG d’OVH a annoncé via twitter « Nous avons un souci d'alimentation de SBG1/SBG4. Les 2 arrivées électriques EDF sont down (!!) et les 2 chaines de groupes électrogènes se sont mis en défaut (!!!). L’ensemble de 4 arrivées elec n'alimentent plus la salle de routage. Nous sommes tous sur le problème ».

Sur le site d’OVH, on pouvait lire :

« Ce matin, nous avons eu 2 incidents séparés qui n'ont rien à voir l'un avec l'autre. Le 1er incident touche notre site de Strasbourg (SBG) et le 2eme Roubaix (RBX). Sur SBG nous avons 3 datacentres en fonctionnement et 1 en construction. Sur RBX, nous avons 7 datacentres en fonctionnement.

SBG:
Sur SBG nous avons eu un problème électrique. L'alimentation a été rétablie et les services sont en cours de redémarrage. Certains clients sont UP et d'autres pas encore.
Si votre service n'est pas encore UP, le délai de rétablissement est compris entre 5 minutes et 3-4 heures. Notre système de monitoring nous permet de savoir quel client est encore impacté et nous nous travaillons pour les fixer.

RBX:
Nous avons eu un problème sur le réseau optique qui permet à RBX d'être connecté avec les points d'interconnexion que nous avons à Paris, Francfort, Amsterdam, London, Bruxelles. L'origine du problème est un bug software sur les équipements optiques qui a provoqué la perte de la configuration et la coupure de la connexion avec notre site de RBX. Nous avons remis le backup de la configuration software dés que nous avons diagnostiqué l’origine du problème et le DC est à nouveau joignable. L'incident sur RBX est clos. Avec le constructeur, nous cherchons l'origine du bug software et aussi comment ne plus subir ce genre d’incident critique.

Nous sommes en train de récupérer les détails pour vous fournir les informations sur le temps de rétablissement à SBG de tous les services / tous les clients. Aussi, nous allons donner tous les détails techniques sur l'origine de ces 2 incidents.

Nous sommes sincèrement désolés. Nous venons de vivre 2 évènements simultanés et indépendants qui ont impactés tous les clients de RBX entre 8h15 et 10h37 et tous les clients de SBG entre 7h15 et 11h15. Nous continuons à travailler sur les clients qui ne sont pas encore UP à SBG. »

En tout état de cause le plan de reprise d'activité qui a été mis en oeuvre fonctionnait sur le papier mais pas dans la vraie vie. Il est ainsi primordiale pour les entreprises de tester et valider les PRA mis en oeuvre.

Panne OVH : que s'est-il passé ?

Du jamais vu ce jeudi matin pour OVH (On Vous Héberge) avec cette succession en chaine de problèmes techniques qui ont impacté leurs clients. Parmi les 12 sites de stockage d’OVH mondiaux, deux gros sites français ont deux pannes distinctes qui ont bloqué des milliers de sites internet. L’incident de Strasbourg concerne une panne électrique et les équipements de secours n’ont pas pris le relais tandis qu’à Roubaix, c’est un système de fibre optique qui est tombé en panne.

Pour l’hébergeur français acteur important du cloud computing, cette panne qui a duré plusieurs heures devrait permettre de renforcer la procédure pour tout sécuriser et éviter que cela ne se reproduise.