Checkmk
to checkmk.com
Important

This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved.

1. Mode de fonctionnement

Les opérations informatiques distinguent deux types d’interruption : les interruptions planifiées et les interruptions imprévues. Au départ, le système de supervision ne peut pas savoir si une interruption détectée était planifiée ou non. Grâce au concept d’interruption planifiée, le système peut être informé des interruptions planifiées d’un ordinateur hôte ou d’un service en définissant une interruption planifiée pour l’objet correspondant. Si un ordinateur hôte ou un service se trouve dans une telle période de maintenance, cela a les effets suivants :

  • Dans les vues, une icône apparaît à côté des ordinateurs hôtes et des services concernés : Les ordinateurs hôtes et les services sont signalés par un cône de signalisation (Icon for displaying a scheduled downtime.). Si un ordinateur hôte et tous ses services sont placés en période de maintenance, les services reçoivent l'icône « Icon for displaying a derived scheduled downtime for a service. » avec un serveur et un petit cône de signalisation. Dans l'historique, les périodes de maintenance en cours sont signalées par « Icon for displaying a started scheduled downtime. » et celles terminées par « Icon for displaying a finished scheduled downtime. ».

  • Les notifications de problème sont désactivées pendant la période de maintenance.

  • Les ordinateurs hôtes/services concernés ne sont pas signalés comme présentant un problème dans l'Overview.

  • Les périodes de maintenance planifiées sont spécialement prises en compte dans l'analyse de disponibilité.

  • À titre d'information, une notification spéciale sera déclenchée au début et à la fin d'une période de maintenance planifiée.

2. Saisie des périodes de maintenance programmées

La définition des périodes de maintenance s'effectue à l'aide d'instructions. Toutes les actions relatives aux périodes de maintenance sont disponibles ici dans une seule case de dialogue :

Dialog for defining a scheduled downtime.
Le dialogue permettant de définir une période de maintenance planifiée dans les éditions commerciales

Le champ « Comment » doit toujours être renseigné. Vous pouvez inclure une URL, telle que https://www.example.com, dans ce champ ; celle-ci sera remplacée par un lien cliquable. Il existe plusieurs façons de définir la période de maintenance — depuis la simple option « 2 hours », qui définit la période de maintenance comme commençant dès maintenant, jusqu'à la saisie d'une période de maintenance explicite permettant également de définir une période de maintenance future.

2.1. Périodes de maintenance planifiées régulièrement

CEE Certaines opérations de maintenance sont effectuées régulièrement — un redémarrage automatique hebdomadaire d’un serveur, par exemple. La saisie manuelle d’une période de maintenance à chaque occasion serait fastidieuse. Si vous souhaitez simplement désactiver les notifications, vous pouvez configurer des périodes de temps et les jeux de règles « Notification period for hosts » et « Notification period for services ». Ces options comportent toutefois diverses restrictions — l’une des plus importantes étant que des autorisations de configuration globales sont requises pour définir des périodes de temps.

À cette fin, les éditions commerciales proposent le concept de périodes de maintenance planifiées, automatiques et récurrentes. Celles-ci peuvent être définies de deux manières différentes.

Configuration à l'aide d'une instruction

La première méthode consiste à utiliser l’option Repeat.

Select the recurrence period.

Elle vous permet de sélectionner la période de maintenance pendant laquelle elle doit se répéter. Saisissez la première occurrence via Start et End. La période de maintenance est calculée à partir de l’heure de début saisie ici. Les options suivantes sont disponibles :

never

La période de maintenance ne se répète pas, c'est-à-dire qu'elle n'est exécutée qu'une seule fois (réglage par défaut).

hour

La période de maintenance se répète toutes les heures à la même heure.

day

Quotidiennement, à la même heure chaque jour.

week

Se répète tous les sept jours, le même jour de la semaine et à la même heure que lors de la première occurrence.

second week

Identique à l'option hebdomadaire, mais tous les 14 jours.

fourth week

Identique à l'option hebdomadaire, mais tous les 28 jours.

same nth weekday (from beginning)

Cela vous permet de mettre en place des récurrences mensuelles en fonction du jour de la semaine. Ainsi, par exemple, si la date de début est le deuxième lundi du mois, une période de maintenance sera alors programmée pour le deuxième lundi de chaque mois suivant.

same nth weekday (from end)

Similaire à l'option précédente, sauf qu'elle est calculée à partir de la fin du mois — par exemple « tous les derniers vendredis du mois ».

same day of the month

Dans ce cas, le jour de la semaine n’a pas d’importance. Ici, c’est la date du mois qui est utilisée. Ainsi, si la date de début est le 5, la période de maintenance sera programmée pour avoir lieu le 5 de chaque mois.

Configuration à l'aide de règles

Une autre méthode élégante pour configurer des périodes de maintenance périodiques consiste à les définir à l’aide de règles. Grâce aux balises de l’hôte, vous pouvez définir des éléments tels que, par exemple : Chaque serveur Windows de production a une période de maintenance planifiée tous les dimanches de 22 h 00 à 22 h 10.

Vous pouvez en fait obtenir presque les mêmes résultats en utilisant la recherche d'ordinateurs hôtes pour trouver tous les serveurs concernés, puis en saisissant la période de maintenance via une instruction. Mais cela ne fonctionne qu'avec les serveurs existants.

Si, à l'avenir, un nouvel ordinateur hôte est ajouté à la supervision, il ne sera pas couvert par cette entrée. En revanche, si vous utilisez des règles, cela ne posera aucun problème. Un autre avantage des règles est que la directive de maintenance peut être modifiée très facilement ultérieurement, simplement en modifiant les règles.

Les règles relatives aux périodes de maintenance récurrentes se trouvent respectivement sous Setup > Hosts > Host monitoring rules > Recurring downtimes for hosts et Setup > Services > Service monitoring rules > Recurring downtimes for services.

Defining a regular scheduled downtime using a rule.

2.2. Options avancées

Outre les périodes de maintenance régulières que nous venons de décrire, il existe d’autres options pour définir des périodes de maintenance. Celles-ci se trouvent dans l’Advanced options :

The advanced options for scheduled downtimes.

L'option « Only for hosts: Set child hosts in downtime » est utile pour les routeurs et les commutateurs, mais aussi pour les ordinateurs hôtes de virtualisation, par exemple. De cette manière, Checkmk définira également automatiquement une période de maintenance sur tous les ordinateurs hôtes directement connectés, ainsi que sur les ordinateurs hôtes indirectement connectés via l'ordinateur hôte en question (si l'option « Include indirectly connected hosts (recursively) » est sélectionnée).

Avec l'option « Only start downtime if host/service goes DOWN/UNREACH…​ », la période de maintenance planifiée ne commence pas automatiquement à l'heure prévue, mais seulement lorsqu'un état de problème réel apparaît pour l'ordinateur hôte. Cette option est utile lorsque, par exemple, vous savez qu'un ordinateur hôte va entrer dans un état d'DOWN pendant quelques minutes, mais que la prévision de l'heure de l'événement ne peut être réalisée.

Exemple : Vous définissez une période de maintenance de 14 h 00 à 16 h 00 et activez l'option « Only start downtime if host/service goes DOWN/UNREACH…​ » avec une durée de 30 minutes. À 14 h 00, la période de maintenance planifiée ne s'activera pas, mais restera en veille. Dès que l'ordinateur hôte entrera dans un état « DOWN » (en maintenance) ou « UNREACH » (en maintenance), la période de maintenance planifiée commencera et l'icône de pause bleue apparaîtra. Cette situation perdurera pendant toute la durée indiquée dans l'option, quel que soit l'état réel de l'ordinateur hôte, et si nécessaire au-delà de l'heure de fin spécifiée pour la période de maintenance.

Setting a flexible scheduled downtime.

Par conséquent, avec les périodes de maintenance planifiées flexibles, l'heure de début/fin correspond uniquement à la plage horaire au cours de laquelle la période de maintenance planifiée peut commencer. Si aucun état de problème ne survient au cours de cette plage horaire, la période de maintenance planifiée sera simplement ignorée. Ces conditions s'appliquent bien sûr également aux services.

3. Activation des périodes de maintenance planifiées

Cliquez sur On service: Schedule downtime ou On host: Schedule downtime pour activer les paramètres que vous venez de définir pour les services ou les ordinateurs hôtes concernés.

Si vous venez de planifier des périodes de maintenance pour les services, par exemple dans la vue de la table « Services of Host », vous pouvez également cliquer sur « Schedule downtime on host » pour vous assurer que les périodes de maintenance planifiées ne concernent pas les services, mais directement l'ordinateur hôte associé.

Confirmation that the scheduled downtime should actually be applied to the host.

4. Edition et suppression des périodes de maintenance planifiées

Les périodes de maintenance planifiées disposent de leur propre vue dans Checkmk — celle-ci est accessible via Monitor > Overview > Scheduled downtimes :

View of scheduled downtimes.

Comme dans toutes les vues, vous pouvez affiner la sélection à l’aide d’un filtre « Icon for displaying the filter bar. ». À l’aide des instructions « Icon for displaying a command. », vous pouvez, dans cette vue, supprimer une ou plusieurs périodes de maintenance, voire les modifier rétroactivement (uniquement dans les éditions commerciales), par exemple si les durées doivent être prolongées lorsque la période de maintenance s’avère plus longue que prévu.

Editing a scheduled downtime.

5. Historique

La vue de la table «Monitor > History > Downtime history» n'affiche pas les périodes de maintenance planifiées en cours, mais leur historique — c'est-à-dire tous les événements marquant le début ou la fin d'une période de maintenance planifiée (qu'il s'agisse d'une fin naturelle ou d'une instruction de suppression).

Overview of past scheduled downtimes.

6. Périodes de maintenance planifiées et disponibilité

Comme mentionné au début, les périodes de maintenance planifiées ont une incidence sur l'évaluation de l'analyse de la disponibilité. Par défaut, toutes les périodes de maintenance planifiées sont calculées dans leur propre « pool » et affichées dans la colonne « Downtime ».

Availability analysis of the hosts.

La manière précise dont les périodes de maintenance planifiées doivent être prises en compte peut être définie via l'Availability > Change computation options :

Selection for taking scheduled downtimes into account.

Honor scheduled downtimes

Les périodes de maintenance planifiées sont incluses dans les graphiques de disponibilité et affichées dans une colonne distincte. Il s’agit du paramètre par défaut.

Exclude scheduled downtimes

Les périodes de maintenance planifiées sont totalement ignorées lors du calcul des 100 %. Tous les pourcentages de disponibilité se réfèrent donc uniquement aux temps restants, afin de répondre à la question : quel pourcentage du temps hors maintenance l'objet était-il disponible ?

Ignore scheduled downtimes

Les périodes de maintenance planifiées ne sont pas prises en compte — seuls les états réels de l'objet sont pertinents.

Sous «Phases», vous trouverez l’option supplémentaire «Treat phases of UP/OK as non-downtime». Si cette option est sélectionnée, les périodes pendant lesquelles un objet fait l’objet d’une maintenance mais est simultanément «OK» ou «UP» ne sont pas considérées comme des périodes de maintenance planifiées. Ainsi, seul le temps planifié ayant entraîné une interruption réelle sera inclus dans les calculs.


Last modified: Wed, 13 Aug 2025 11:48:14 GMT via commit 17bc4f250
Sur cette page