This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved. |
1. Mode de fonctionnement
Les opérations informatiques distinguent deux types d’interruption : les interruptions planifiées et les interruptions imprévues. Au départ, le système de supervision ne peut pas savoir si une interruption détectée était planifiée ou non. Grâce au concept d’interruption planifiée, le système peut être informé des interruptions planifiées d’un ordinateur hôte ou d’un service en définissant une interruption planifiée pour l’objet correspondant. Si un ordinateur hôte ou un service se trouve dans une telle période de maintenance, cela a les effets suivants :
Dans les vues, une icône apparaît à côté des ordinateurs hôtes et des services concernés : Les ordinateurs hôtes et les services sont signalés par un cône de signalisation (
).
Si un ordinateur hôte et tous ses services sont placés en période de maintenance, les services reçoivent l'icône «
» avec un serveur et un petit cône de signalisation.
Dans l'historique, les périodes de maintenance en cours sont signalées par «
» et celles terminées par «
».Les notifications de problème sont désactivées pendant la période de maintenance.
Les ordinateurs hôtes/services concernés ne sont pas signalés comme présentant un problème dans l'Overview.
Les périodes de maintenance planifiées sont spécialement prises en compte dans l'analyse de disponibilité.
À titre d'information, une notification spéciale sera déclenchée au début et à la fin d'une période de maintenance planifiée.
2. Saisie des périodes de maintenance programmées
La définition des périodes de maintenance s'effectue à l'aide d'instructions. Toutes les actions relatives aux périodes de maintenance sont disponibles ici dans une seule case de dialogue :

Le champ « Comment » doit toujours être renseigné.
Vous pouvez inclure une URL, telle que https://www.example.com, dans ce champ ; celle-ci sera remplacée par un lien cliquable.
Il existe plusieurs façons de définir la période de maintenance — depuis la simple option « 2 hours », qui définit la période de maintenance comme commençant dès maintenant, jusqu'à la saisie d'une période de maintenance explicite permettant également de définir une période de maintenance future.
2.1. Périodes de maintenance planifiées régulièrement
Certaines opérations de maintenance sont effectuées régulièrement — un redémarrage automatique hebdomadaire d’un serveur, par exemple.
La saisie manuelle d’une période de maintenance à chaque occasion serait fastidieuse.
Si vous souhaitez simplement désactiver les notifications, vous pouvez configurer des périodes de temps et les jeux de règles « Notification period for hosts » et « Notification period for services ».
Ces options comportent toutefois diverses restrictions — l’une des plus importantes étant que des autorisations de configuration globales sont requises pour définir des périodes de temps.
À cette fin, les éditions commerciales proposent le concept de périodes de maintenance planifiées, automatiques et récurrentes. Celles-ci peuvent être définies de deux manières différentes.
Configuration à l'aide d'une instruction
La première méthode consiste à utiliser l’option Repeat.

Elle vous permet de sélectionner la période de maintenance pendant laquelle elle doit se répéter. Saisissez la première occurrence via Start et End. La période de maintenance est calculée à partir de l’heure de début saisie ici. Les options suivantes sont disponibles :
never |
La période de maintenance ne se répète pas, c'est-à-dire qu'elle n'est exécutée qu'une seule fois (réglage par défaut). |
hour |
La période de maintenance se répète toutes les heures à la même heure. |
day |
Quotidiennement, à la même heure chaque jour. |
week |
Se répète tous les sept jours, le même jour de la semaine et à la même heure que lors de la première occurrence. |
second week |
Identique à l'option hebdomadaire, mais tous les 14 jours. |
fourth week |
Identique à l'option hebdomadaire, mais tous les 28 jours. |
same nth weekday (from beginning) |
Cela vous permet de mettre en place des récurrences mensuelles en fonction du jour de la semaine. Ainsi, par exemple, si la date de début est le deuxième lundi du mois, une période de maintenance sera alors programmée pour le deuxième lundi de chaque mois suivant. |
same nth weekday (from end) |
Similaire à l'option précédente, sauf qu'elle est calculée à partir de la fin du mois — par exemple « tous les derniers vendredis du mois ». |
same day of the month |
Dans ce cas, le jour de la semaine n’a pas d’importance. Ici, c’est la date du mois qui est utilisée. Ainsi, si la date de début est le 5, la période de maintenance sera programmée pour avoir lieu le 5 de chaque mois. |
Configuration à l'aide de règles
Une autre méthode élégante pour configurer des périodes de maintenance périodiques consiste à les définir à l’aide de règles. Grâce aux balises de l’hôte, vous pouvez définir des éléments tels que, par exemple : Chaque serveur Windows de production a une période de maintenance planifiée tous les dimanches de 22 h 00 à 22 h 10.
Vous pouvez en fait obtenir presque les mêmes résultats en utilisant la recherche d'ordinateurs hôtes pour trouver tous les serveurs concernés, puis en saisissant la période de maintenance via une instruction. Mais cela ne fonctionne qu'avec les serveurs existants.
Si, à l'avenir, un nouvel ordinateur hôte est ajouté à la supervision, il ne sera pas couvert par cette entrée. En revanche, si vous utilisez des règles, cela ne posera aucun problème. Un autre avantage des règles est que la directive de maintenance peut être modifiée très facilement ultérieurement, simplement en modifiant les règles.
Les règles relatives aux périodes de maintenance récurrentes se trouvent respectivement sous Setup > Hosts > Host monitoring rules > Recurring downtimes for hosts et Setup > Services > Service monitoring rules > Recurring downtimes for services.

2.2. Options avancées
Outre les périodes de maintenance régulières que nous venons de décrire, il existe d’autres options pour définir des périodes de maintenance. Celles-ci se trouvent dans l’Advanced options :

L'option « Only for hosts: Set child hosts in downtime » est utile pour les routeurs et les commutateurs, mais aussi pour les ordinateurs hôtes de virtualisation, par exemple. De cette manière, Checkmk définira également automatiquement une période de maintenance sur tous les ordinateurs hôtes directement connectés, ainsi que sur les ordinateurs hôtes indirectement connectés via l'ordinateur hôte en question (si l'option « Include indirectly connected hosts (recursively) » est sélectionnée).
Avec l'option « Only start downtime if host/service goes DOWN/UNREACH… », la période de maintenance planifiée ne commence pas automatiquement à l'heure prévue, mais seulement lorsqu'un état de problème réel apparaît pour l'ordinateur hôte. Cette option est utile lorsque, par exemple, vous savez qu'un ordinateur hôte va entrer dans un état d'DOWN pendant quelques minutes, mais que la prévision de l'heure de l'événement ne peut être réalisée.
Exemple : Vous définissez une période de maintenance de 14 h 00 à 16 h 00 et activez l'option « Only start downtime if host/service goes DOWN/UNREACH… » avec une durée de 30 minutes. À 14 h 00, la période de maintenance planifiée ne s'activera pas, mais restera en veille. Dès que l'ordinateur hôte entrera dans un état « DOWN » (en maintenance) ou « UNREACH » (en maintenance), la période de maintenance planifiée commencera et l'icône de pause bleue apparaîtra. Cette situation perdurera pendant toute la durée indiquée dans l'option, quel que soit l'état réel de l'ordinateur hôte, et si nécessaire au-delà de l'heure de fin spécifiée pour la période de maintenance.

Par conséquent, avec les périodes de maintenance planifiées flexibles, l'heure de début/fin correspond uniquement à la plage horaire au cours de laquelle la période de maintenance planifiée peut commencer. Si aucun état de problème ne survient au cours de cette plage horaire, la période de maintenance planifiée sera simplement ignorée. Ces conditions s'appliquent bien sûr également aux services.
3. Activation des périodes de maintenance planifiées
Cliquez sur On service: Schedule downtime ou On host: Schedule downtime pour activer les paramètres que vous venez de définir pour les services ou les ordinateurs hôtes concernés.
Si vous venez de planifier des périodes de maintenance pour les services, par exemple dans la vue de la table « Services of Host », vous pouvez également cliquer sur « Schedule downtime on host » pour vous assurer que les périodes de maintenance planifiées ne concernent pas les services, mais directement l'ordinateur hôte associé.

4. Edition et suppression des périodes de maintenance planifiées
Les périodes de maintenance planifiées disposent de leur propre vue dans Checkmk — celle-ci est accessible via Monitor > Overview > Scheduled downtimes :

Comme dans toutes les vues, vous pouvez affiner la sélection à l’aide d’un filtre «
».
À l’aide des instructions «
», vous pouvez, dans cette vue, supprimer une ou plusieurs périodes de maintenance, voire les modifier rétroactivement (uniquement dans les éditions commerciales), par exemple si les durées doivent être prolongées lorsque la période de maintenance s’avère plus longue que prévu.

5. Historique
La vue de la table «Monitor > History > Downtime history» n'affiche pas les périodes de maintenance planifiées en cours, mais leur historique — c'est-à-dire tous les événements marquant le début ou la fin d'une période de maintenance planifiée (qu'il s'agisse d'une fin naturelle ou d'une instruction de suppression).

6. Périodes de maintenance planifiées et disponibilité
Comme mentionné au début, les périodes de maintenance planifiées ont une incidence sur l'évaluation de l'analyse de la disponibilité. Par défaut, toutes les périodes de maintenance planifiées sont calculées dans leur propre « pool » et affichées dans la colonne « Downtime ».

La manière précise dont les périodes de maintenance planifiées doivent être prises en compte peut être définie via l'Availability > Change computation options :

Honor scheduled downtimes |
Les périodes de maintenance planifiées sont incluses dans les graphiques de disponibilité et affichées dans une colonne distincte. Il s’agit du paramètre par défaut. |
Exclude scheduled downtimes |
Les périodes de maintenance planifiées sont totalement ignorées lors du calcul des 100 %. Tous les pourcentages de disponibilité se réfèrent donc uniquement aux temps restants, afin de répondre à la question : quel pourcentage du temps hors maintenance l'objet était-il disponible ? |
Ignore scheduled downtimes |
Les périodes de maintenance planifiées ne sont pas prises en compte — seuls les états réels de l'objet sont pertinents. |
Sous «Phases», vous trouverez l’option supplémentaire «Treat phases of UP/OK as non-downtime». Si cette option est sélectionnée, les périodes pendant lesquelles un objet fait l’objet d’une maintenance mais est simultanément «OK» ou «UP» ne sont pas considérées comme des périodes de maintenance planifiées. Ainsi, seul le temps planifié ayant entraîné une interruption réelle sera inclus dans les calculs.
