Notice #10994
Investigations

Incident sur notre plateforme KVM

Nous investiguons sur cet incident potentiel.

La plateforme est stable depuis maintenant plus de 24 grace au dernier patch déployé. L'incident est donc maintenant pleinement résolu.

Nos équipes continuent tout de même d'analyser les informations récoltées durant cet incident pour garantir que ce dernier ne se provoque plus.

Un mail sera envoyé à la totalité des clients impacté en début de semaine, afin de revenir sur les causes de cet incident et l'attribution du geste commercial.

L'infrastructure est maintenant stable depuis plusieurs heures. Nous maintenons notre surveillance renforcée sur l'ensemble du parc, au cas où une anomalie se présente.

Si l'infrastructure garde sa stabilité actuelle, nous clôturerons cette incident. Un nouvel email vous sera envoyé en début de semaine avec plus de détails sur ce dernier, et les informations concernant le geste commercial prévu.

Le patch vient d'être déployé sur les hôtes concernés. Nous gardons une équipe sur place afin d'être en mesure d'intervenir au plus vite si ce dernier n'est pas suffisant. Les VMs impacté vont être redémarré par nos équipes dans les prochaines minutes.

Nous continuons bien évidemment de surveiller au plus près l'infrastructure.

L'hôte HVM01 est de nouveau en ligne. Nos correctifs d'hier soir nous ont permis de réduire les instabilités, et de collecter plus d'informations sur les perturbations restantes. Un nouveau patch est en cours de développement pour corriger les problématiques restantes.

Une première équipe technique est dépêchée vers le datacenter pour prendre en charge l'incident de HMV01. ETA 10h30

Depuis 02:52 l’hote HVM01 esr indisponible, nous allons le relancer dès que possible.

HVM02 à subi un nouveau reboot vers 07:39.

HVM03 et 04 ne sont impactés par aucun souci pour l’instant.

Notre patch de hier permet aussi d’avoir une trace plus précise concernant les reboot intempestifs.

Nous investiguons toujours sur l’incident.

Nous venons de déployer un patch sur nos noeuds d'hébergement pour corriger l'incident constaté ce jour sur nos noeuds.

En parallèle nos équipes sont en train de finir de concevoir le script de migration des VPS vers la nouvelle plateforme.

Depuis 16H24 nous avons rencontré des perturbations sur nos différentes plateformes provoquant des redémarrages inopinées de nos noeuds. Nous avons pu circonscrire le problème sur les noeuds HVM03 et HVM04 pour l'instant, cependant les noeuds HMV01 et HVM02 sont toujours sujets à des redémarrages inopinées ces dernières heures.

En parallèle à notre plateforme actuelle nous préparions une nouvelle plateforme d'hébergement VPS nous offrant plus de possibilités telles que la possibilité d'avoir du stockage HDD et donc des VM avec des disques durs plus importants.

Cette plateforme étant prête à recevoir les VPS de nos clients nous allons engager une procédure de migration de l'intégralité de nos anciens noeuds vers cette nouvelle plateforme qui est plus robuste et plus stable, les opérations vont débuter par les noeuds HVM01 et HVM02.

Ces opérations peuvent prendre du temps, car nous devons convertir les VM pour quelles soient compatibles avec nos nouvelles plateformes, l'opération peut prendre plusieurs minutes par VM et donc rallonge considérablement le temps de migration.

Nous avons donc pris la décision de mener deux opérations en parallèles deux opérations :
Une première équipe va travailler à essayer d'isoler l'incident qui affecte notre hyperviseur afin de corriger le problème impactant nos noeuds.
Une seconde équipe va travailler à migrer les premières VM vers la nouvelle plateforme pour ne pas perdre de temps en cas d'échec de notre première opération.

Nos équipes font tout leur possible pour restaurer la qualité de service dont vous bénéficiez depuis notre retour en mars 2017 et un geste commercial vous sera automatiquement attribué à résolution de l'incident.

  • Site internet
  • Espace Client
  • Noeuds d'hébergement KVM
Incidents Précédents
Aucun incident signalé sur les 7 derniers jours.