This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved. |
1. Introduction
L'objectif de la supervision avec Checkmk est de vous fournir à tout moment une image claire
de l'état réel de votre infrastructure informatique. L'enregistrement de toutes ces informations
dans des bases de données vous permet de revenir à tout moment sur le passé, de créer des graphiques de performance et d'identifier les corrélations qui ont pu conduire à des problèmes.
Et même si, par exemple, un simple coup d’œil aux graphiques d’un système de fichiers donne déjà une idée approximative du moment où l’espace pourrait venir à manquer, cette impression rapide est souvent trompeuse. Elle omet des éléments centraux de la gestion des capacités . Les facteurs saisonniers, par exemple, laissent une grande marge d’erreur . Les exigences imposées à votre infrastructure informatique peuvent varier, par exemple, pendant les périodes de vacances, les jours fériés ou même en fonction des saisons, et ces facteurs ne sont pas toujours anodins ou évidents.
Les effets ponctuels constituent un autre facteur important dans le calcul des prévisions. Par exemple, si une régression linéaire est utilisée à des fins d’extrapolation lors d’une opération de nettoyage à grande échelle sur un système de fichiers, l’espace de stockage consommé par le processus lui-même pourrait donner l’impression que votre système de fichiers sera complètement vide dans un avenir proche. Le fait qu’il s’agisse d’une conclusion erronée est immédiatement évident et démontre de manière frappante pourquoi des prévisions bien plus fiables nécessitent des méthodes bien plus robustes.
Les éditions commerciales de Checkmk proposent de telles méthodes robustes qui, sur la base des données historiques collectées, permettent une interprétation intelligente et, si elles sont correctement configurées, de bonnes prévisions.
Dans cet article, nous vous montrerons comment les configurer.
2. Configuration dans Checkmk
2.1. Création d'un graphique de prévision
La manière la plus simple de créer un graphique de prévision consiste à accéder à la vue détaillée de n'importe quel service générant des métriques. Dans cette vue détaillée, vous trouverez la ligne « Service Metrics » (Prévisions) juste en dessous des graphiques du service. À côté des valeurs actuelles de chacune de ces métriques, vous trouverez un bouton permettant d'accéder à l'action spéciale «
» (Créer une prévision) pour les métriques.

Ouvrez maintenant le menu d'action et sélectionnez « New forecast graph… ».

Après quelques instants, vous pourrez déjà voir le premier graphique de prévision pour la métrique que vous avez choisie.

2.2. Les paramètres du modèle
Il est maintenant temps de sélectionner les paramètres spécifiques permettant de calculer la prévision pour cette métrique — vous les trouverez juste en dessous du graphique. Étant donné que ces paramètres dépendent fortement de votre environnement particulier et de l'objectif de la prévision, il est très important d'examiner attentivement les options et leurs effets possibles.

Minimum - Maximum - Moyenne
Le dernier champ de la ligne « Metric » peut déjà avoir une influence considérable sur la pertinence de la prévision. La valeur par défaut à ce stade est toujours l’option « Maximum », car dans le contexte de la gestion des capacités, cette option fournit le plus souvent une indication de la prévision elle-même — à savoir les goulots d’étranglement lors des pics de charge. Par exemple, si vous ne considérez que les valeurs moyennes pour le service « CPU utilization », vous pourriez constater que l’utilisation moyenne reste acceptable. Cependant, dans un avenir proche, ce n’est qu’au moment où la situation se présentera réellement que vous remarquerez, lors de la supervision, que votre CPU atteint constamment ses limites lors des pics de charge.
Prendre en compte l'historique
Cette option vous permet de déterminer quelle période des données historiques doit servir de base au calcul de la prévision. D’une manière générale, on peut dire qu’un grand nombre de points de données est nécessaire pour obtenir un bon ajustement. Toutefois, si vous souhaitez toujours prendre comme base les valeurs mesurées du mois précédent, par exemple, vous pouvez le faire en sélectionnant l’option « Last month». Cela ne signifie pas les 30 derniers jours, mais plutôt le mois civil précédent.
Une autre raison de limiter la période pourrait être, par exemple, une mise à niveau de composants individuels sur un serveur. L'inclusion de données antérieures à cette mise à niveau pourrait éventuellement fausser la prévision.
Prévisions pour l'avenir
La prévision commence le dernier jour de la période sélectionnée sous « Consider history of ». Cela mérite d’être mentionné, car selon la sélection, une prévision est également calculée pour une période durant laquelle des données de mesure réelles ont déjà été accumulées. Au sein de ce chevauchement, il est donc déjà possible de voir à quel point la prévision était proche des valeurs réelles.
Par ailleurs, il ne reste plus qu’à préciser ici que plus vous essayez de vous projeter dans l’avenir, plus la prévision deviendra naturellement imprécise. Cependant, cette évidence est très bien illustrée dans le graphique de prévision par l’ombrage orange qui ne cesse de s’étendre.
Flexibilité des tendances
Lors de l’observation et de l’analyse des périodes — dans ce cas, les valeurs enregistrées pour vos services —, ce que l’on appelle les ruptures structurelles ou points de changement jouent un rôle très important. Pour simplifier, ces points de changement correspondent aux moments, au sein des périodes, où l’on observe des variations plus ou moins importantes. Lors de l’analyse des périodes, Checkmk identifie désormais toute une série de ces points de changement et les utilise afin de les réutiliser dans la prévision et ainsi la rendre plus précise. L’intensité avec laquelle Checkmk ajuste la courbe du graphique de prévision à ces points de changement peut être déterminée à l’aide des cinq options d’Trend flexibility. Si l’ajustement est trop important — ce que l’on appelle un surajustement —, la fonction de prévision ressemblerait trop étroitement à une simple mise à jour (en fait une copie) de la série chronologique précédente. Un sous-ajustement, en revanche, rendrait la prévision extrêmement imprécise. Checkmk fournit une valeur par défaut qui convient à de nombreuses situations et que vous pouvez utiliser avec Medium. Si votre graphique de prévision est trop imprécis (sous-ajustement), vous devrez augmenter la flexibilité de la courbe de tendance en sélectionnant High ou Very High. Dans le cas contraire (c'est-à-dire en cas de surajustement), vous disposerez toujours des deux options Low et None (linear), bien que nous ne recommandions pas d'utiliser None (linear), car celle-ci n'est disponible que par souci d'exhaustivité.
Modélisation de la saisonnalité
À ce stade, vous devrez déterminer comment le graphique de prévision doit traiter les demandes récurrentes et saisonnières pesant sur votre infrastructure. Deux périodes sont automatiquement prises en compte dans les graphiques de prévision : les besoins récurrents hebdomadaires, tels que ceux liés à une semaine de travail de cinq jours et aux week-ends, et les besoins annuels ou saisonniers, tels que ceux liés aux jours fériés et aux congés du personnel. Checkmk reconnaît automatiquement cette saisonnalité ; il vous suffit donc de sélectionner la manière dont vous souhaitez qu’elle soit prévue.
L'option « Additive » (Prévision de saisonnalité) n'intègre ces besoins modifiés dans la prévision qu'une seule fois. Comme son nom l'indique, l'augmentation ou la diminution de la demande est simplement ajoutée à la tendance.
En sélectionnant l'option « Multiplicative », en revanche, la demande saisonnière future augmente ou diminue proportionnellement à la tendance.
Intervalle de confiance
À ce stade, vous devrez déterminer le niveau de confiance de votre prévision. En termes simples, c’est ici que vous spécifiez la probabilité selon laquelle les valeurs attendues se situent dans l’intervalle de confiance résultant de ce niveau. L’objectif d’une telle sélection est, à partir du niveau le plus élevé possible, d’obtenir toujours un intervalle aussi étroit que possible. Plus les données historiques disponibles sont nombreuses, plus les graphiques de prévision peuvent y parvenir avec succès. Il est important que ce choix n’influence pas l’« ajustement » réel. Seule la zone qui l’entoure (c’est-à-dire la visualisation de l’intervalle) devient proportionnellement plus grande à des niveaux plus élevés.
Afficher les données historiques depuis la dernière
Dans le graphique de prévision, sur le côté gauche, vous voyez — séparée par une ligne jaune verticale — la visualisation d’un nombre spécifié de jours de données réelles. Vous pouvez spécifier le nombre de jours à afficher ici. Cette valeur n’a aucun effet sur le calcul de la prévision elle-même, mais influence uniquement l’affichage.
Afficher les informations dans le graphique graphique
Et la dernière option n'influence, là encore, que l'affichage du graphique. Si vous checkez «Model parameters», les paramètres précédemment sélectionnés s'afficheront sous le graphique final. Cela facilite l'interprétation du graphique par le lecteur.
3. Options de diagnostic
3.1. Erreurs possibles et messages d'erreur
Impossible de créer un graphique
Le message d'erreur « Cannot create graph - Metric historical data has less than 2 days of valid values » est assez explicite. Pour pouvoir effectuer des prévisions fiables, Checkmk a besoin de plus de deux jours complets de données de mesure historiques. Avec moins de points de mesure comme base, un ajustement même partiellement fiable n'est tout simplement pas possible.
