Content Security Policy

Les cas d'indisponibilité d'un site (downtime) les plus courants

Par DivUP le 25 février 2020

Même avec beaucoup de précautions, les problèmes techniques pour un site sont parfois inévitables : erreur 500, timeout... Quels sont les cas les plus courants ? Pourquoi le monitoring d'un site est-il important ?

Les erreurs de downtime les plus souvent enregistrées par DivUP sur les sites sont les suivantes.

N°1 : Temps de réponse élevé (Connection Timed Out)

La réponse du serveur est beaucoup trop longue. C'est le TTFB (time to first byte), appelé également temps de latence. Il s'agit du temps que le navigateur doit attendre avant de recevoir son premier octet de données du serveur. On recommande généralement un TTFB inférieur à 200ms.

Lorsqu'un site est surchargé ou que des opérations grourmandes sont en cours (par exemple un import de données), le TTFB a tendance à augmenter fortement. Le serveur ne dispose plus d'assez de resource pour délivrer une réponse rapide (CPU en overload, mémoire saturée).

DivUP alerte lorsque le temps de réponse est trop important. Il est possible de définir un seuil d'alerte entre 3 et 9 secondes. Un temps de réponse élevé est généralement le prémisse d'un problème plus grave.

Downtime

N°2 : Erreur HTTP 503 (Service indisponible)

Il s'agit de la suite logique d'un temps de réponse trop élevé. Le serveur est surchargé : il reçoit trop de demandes et n'arrive pas à les gérer.

Nous sommes dans le cas d'une hausse inattendue du trafic, des attaques de logiciels malveillants, de spams ou encore une mauvaise programmation du système de gestion de contenu.

Mais ce peut être simplement une opération programmée de maintenance de l'application. Le site informe que le service sera indisponible pendant quelques minutes.

Downtime error

N°3 : Erreur HTTP 500 (Internal Server Error)

Un problème côté serveur est apparu. Il s'agit d'un avertissement extrêmement générique, généralement dû à des problèmes de configuration, de programmation ou d'autorisations du site Web.

L'erreur 500 apparaît le plus souvent à la suite d'une mise à jour. Elle peut être sur toutes les pages ou uniquement sur certaines actions (erreur dans le code).

D'après Google il s'agirait de l'erreur HTTP la plus rencontrée par les bots.

N°4 : Surcharges quotidiennes

Beaucoup de sites exécutent des scripts gourmands la nuit (tâche CRON), à des heures où le traffic est le plus calme. Ce sont souvent des exports ou des imports de données.

DivUP a detecté de nombreuses fois des erreurs ou des temps de réponse élevés à des heures fixes.

Downtime quotidien

N°5 : Serveur injoignable (could not connect)

Il est cette fois impossible de contacter le serveur. Ce peut être une panne d'infrastructure (panne électrique, câble coupé), ou un problème de DNS mal configuré.

Le nom de domaine interrogé ne pointe donc sur rien. Par analogie, c'est un peu comme composer un numéro de téléphone inexistant ou appartenant à une ligne coupée.

Monitoring

Surveillez la disponibilité de votre site

Soyez alerté en temps réel des anomalies liées à la disponibilité de votre site ou application web. Avec DivUP choisissez la surveillance continue et détectez lorsque votre site est indisponible (problème réseau, panne de serveur...). En savoir plus...

Websites

250+ sites surveillés

Requests

210000+ requêtes par jour

Notifications

1500+ notifications