This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved. |
1. Introduction
Dans notre guide du débutant, nous vous avons montré comment mettre en place les bases nécessaires à la supervision du serveur Checkmk. L'article suivant vous explique comment enrichir cette supervision de contenus pertinents. En effet, Checkmk ne se contente pas de vérifier si le serveur Checkmk est en fonctionnement ; il existe de nombreux autres paramètres qui peuvent être contrôlés, puis optimisés.
2. Identification des processus
Dans l'identification des processus, par exemple, il existe des règles prédéfinies pour des services spécifiques en vue de la supervision. Vous pouvez y accéder via Setup > Services > Discovery rules > Discovery of individual services > Process discovery.
Pour chaque ordinateur hôte disposant de la fonctionnalité d'hôte « cmk/check_mk_server:yes », les services suivants seront automatiquement détectés grâce aux règles fournies :
Process myhost active check helpers
Process myhost agent receiver
Process myhost alert helper
Process myhost apache
Process myhost automation helpers
Process myhost checker helpers
Process myhost cmc
Process myhost dcd
Process myhost event console
Process myhost fetcher helpers
Process myhost jaeger
(non visible en permanence)Process myhost livestatus proxy
Process myhost notification spooler
Process myhost notify helper
Process myhost piggyback hub
(non visible en permanence)Process myhost rabbitmq
(uniquement lorsque le hub de ferroutage est activé)Process myhost real-time helper
(uniquement lorsque les checks en temps réel sont activés)Process myhost redis-server
Process myhost rrd helper
Process myhost rrdcached
Vous pouvez désactiver ou supprimer toutes les règles dont vous n'avez pas besoin. Nous vous recommandons de désactiver les règles dont vous n'avez pas besoin, en particulier si vous ne souhaitez utiliser aucune de ces règles. En effet, si vous supprimez toutes les règles au lieu de simplement les désactiver, celles-ci seront recréées lors de votre prochaine importation d'un correctif Checkmk.
Pour savoir ce que vous pouvez faire avec ces services, consultez l'article Comprendre et configurer les services. Pour savoir exactement ce que font les processus inclus dans la supervision en tant que services, consultez l'article sur les services de l'instance.
3. Supervision du système (plugins)
Le catalogue des plugins de supervision propose également diverses options pour la supervision de votre système. Certaines d'entre elles sont peut-être déjà activées par défaut dans votre système, ce qui signifie que vous n'avez pas besoin de plugins supplémentaires. Le tableau suivant en donne un aperçu complet :
Nom du plugin / Titre de |
Fonction |
Paramètres |
Sortie |
bi_aggregation / |
Affiche l'état d'une agrégation BI. Indique également si l'agrégation est actuellement en mode maintenance ou si elle a reçu une confirmation. |
Nom de l'agrégation |
Un service par agrégation BI |
bi_aggregation_connection / |
Informations d'état pour l'agent spécial agent_bi. Comprend les erreurs de connexion, les données d'instance manquantes et les agrégations manquantes dues à des données manquantes. |
n/a |
Un service par connexion |
check-mk / |
Récupère les informations d'état à partir des sources de données configurées, par exemple à partir des agents configurés, des agents spéciaux, du protocole SNMP, des données ferroutées et des cartes de gestion. L'état global du service, qui dépend des résultats, peut être configuré à l'aide du jeu de règles «Status of the Checkmk services». Met également à jour tous les services passifs et toutes les données ferroutées reçues de l'ordinateur hôte. |
n/a |
n/a |
check-mk-inventory / |
Créé automatiquement sur les nouvelles instances. Passe automatiquement à « WARN » dès qu’un service des balises de l’hôte change. La configuration est possible via le jeu de règles « Periodic service discovery ». Une mise à jour automatique de la configuration Checkmk avec les services détectés peut également être activée ici. |
n/a |
un service pour chaque ordinateur hôte prenant en charge cette vérification |
checkmk_agent / Agent |
Garantit le bon fonctionnement du mécanisme de déploiement des agents Checkmk (le cas échéant). Vérifie l'heure de la dernière connexion réussie au serveur de déploiement et la présence de messages d'erreur, affiche le nombre de plugins d'agent déployés et de checks locaux. D'autres paramètres sont possibles, voir la description du plugin |
n/a |
un service |
cmk_site_statistics / |
Surveille le nombre d'ordinateurs hôtes et de services sur les instances Checkmk, en indiquant le nombre total d'ordinateurs hôtes, le nombre d'ordinateurs hôtes qui ne sont pas UP , et le nombre d'ordinateurs hôtes qui sont UP , DOWN , en mode maintenance, et UNREACH. Indique le nombre total de services, le nombre de services qui ne sont pas OK , et le nombre de services qui sont OK , en mode maintenance, s'exécutant sur des ordinateurs hôtes défaillants, WARN , UNKNOWN, et CRIT. La vérification est toujours OK et ne peut pas être configurée par l'utilisateur. |
Nom de l'instance Checkmk |
Un service par instance Checkmk en cours d'exécution sur un serveur Checkmk |
livestatus_status / |
Reçoit diverses données de performance provenant d'un noyau de supervision OMD via Livestatus. Fournit des informations sur les performances du noyau de supervision, le nombre de vérifications exécutées par seconde, etc. Détermine si certains paramètres ont été désactivés (par exemple, les notifications). Les états peuvent être configurés via les paramètres de contrôle. |
Nom de l'instance OMD |
Un service par instance OMD en cours d'exécution. |
mkbackup / |
Vérifie l'état des tâches de sauvegarde sur une Checkmk Appliance. Envoie un rapport (CRIT) si la tâche échoue ou si sa prochaine exécution est en retard. |
ID de la tâche |
Un service par tâche de sauvegarde |
mkbackup_site / Instance |
Vérifie l'état des tâches de sauvegarde d'une instance Checkmk. Envoie un rapport (CRIT) si la tâche échoue ou si sa prochaine exécution est en retard. |
ID de l'instance, suivi de |
un service par instance et par tâche de sauvegarde |
mkeventd_status / Event Console |
Reçoit diverses valeurs de performance d'une instance de type « Event Console Checkmk ». Avertissement en cas de dépassement des limites d'événements actifs, enregistrement des métriques de performance liées à la Event Console. La vérification n'est pas configurable par l'utilisateur. |
Nom de l'instance Checkmk |
Un service par instance Checkmk en cours d'exécution |
mknotifyd_connection_v2 / Spouleur de notification |
Vérifie l'état des connexions TCP individuelles entre le spouleur de notification Checkmk et un spooler distant. Un service est créé pour chaque connexion TCP entrante et sortante. L'état passe à « CRIT » si la connexion n'est pas établie. |
Nom de l’instance suivi du nom de l’instance distante connectée, séparés par un tiret. S’il y a plusieurs connexions entrantes provenant du même ordinateur hôte distant, un index est ajouté. Cette vérification n’est pas configurable par l’utilisateur. |
Un service par instance et par connexion |
mknotifyd / Spouleur de notification |
Vérifie l'état du spouleur de notification Checkmk. « WARN » si des fichiers spool différés restent trop longtemps ou si des fichiers spool endommagés sont détectés. « CRIT » si le spouleur ne fonctionne pas. Cette vérification n'est pas configurable par l'utilisateur. |
Nom de l'instance |
un service par instance |
omd_apache / |
Génère des statistiques sur les requêtes traitées par le serveur web Apache sur les sites OMD. Il enregistre le nombre de requêtes, le nombre d'octets envoyés et le temps nécessaire au traitement des requêtes. Ces données sont regroupées par type de requête, par exemple les vues de la table Checkmk ou les appels AJAX NagVis, mais également par type de contenu, par exemple les images, les feuilles de style, etc. La vérification utilise un fichier journal spécifique, qui doit se trouver sous |
Nom de l'instance |
un service par instance |
omd_broker_queues / |
Surveille le nombre de notifications dans les files d'attente du broker pour chaque application du site. Le nom du service contient le nom de l'instance et de l'application. Ce check est toujours OK. |
nom de l'instance et de l'application |
Un service par instance de site |
omd_broker_status / |
Surveille l'état général du broker de messages sur chaque instance. Affiche la mémoire utilisée par le broker, le nombre de files et le nombre de shovels en cours d'exécution. Ce check est toujours OK. |
Nom de l'instance |
Un service par instance sur laquelle un broker est installé et en cours d'exécution |
omd_diskusage / |
Surveille l'utilisation du disque d'une instance afin de faciliter la recherche d'anomalies si nécessaire. Une liste des répertoires actuellement surveillés est disponible dans la description du plugin. Ce check est toujours d'OK et ne peut pas être configuré par l'utilisateur. |
Nom de l'instance |
un service par instance |
omd_status / |
Vérifie l'état des instances OMD détectées sur le système à l'aide de |
Nom de l'instance |
un service par instance sur laquelle l'option « Autostart » est définie sur « |
site_object_counts / |
Collecte des informations sur le nombre de types d'ordinateurs hôtes différents ou d'instructions de vérification utilisées sur les instances Checkmk. Les paramètres et les fonctionnalités de la vérification sont très complets. Pour plus d'informations, consultez la description du plugin de supervision. La vérification est toujours en état « OK ». |
n/a |
un service |
