This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved. |
1. Le noyau de supervision
Le noyau de supervision est au cœur du système Checkmk. Ses tâches consistent à :
lancer régulièrement des checks et collecter leurs résultats,
fournir les états actuels à l'interface graphique,
détecter les changements d'état et générer des notifications à partir de ceux-ci.
Le schéma d'architecture ci-dessous présente le noyau du processeur et ses connexions avec les principaux composants des éditions commerciales :

1.1. Nagios
La communauté Checkmk
est une construction basée sur le noyau du projet libre Nagios, bien établi.
Celui-ci offre de nombreuses fonctions utiles et a fait ses preuves depuis de nombreuses années auprès de millions d’utilisateurs à travers le monde.
Cette flexibilité inhérente est l’une des raisons du succès de Nagios.
Même si Nagios offre des performances exceptionnelles — étant flexible, rapide, stable et éprouvé —, il existe néanmoins des situations où ses limites sont atteintes. Lorsqu’un grand nombre d’ordinateurs hôtes et de services sont sous supervision, trois problèmes en particulier apparaissent :
La charge CPU élevée lors de l'exécution des checks
Le temps de redémarrage prolongé lors de la modification d’une configuration
Le fait que le système ne soit pas disponible pendant un tel redémarrage
1.2. Le Checkmk Micro Core (CMC)
Comme Checkmk est utilisé depuis un certain temps dans des environnements de plus en plus vastes, nous avons lancé en 2013 un nouveau développement de notre propre noyau du processeur, spécialement destiné aux éditions commerciales.
Le Checkmk Micro Core — ou CMC — surmonte les limites de Nagios mentionnées ci-dessus.
Le CMC n’est pas simplement un fork de Nagios, mais dispose d’une base de code entièrement propre.
Il utilise un logiciel unique et a été parfaitement adapté à Checkmk.
Ses principaux avantages sont les suivants :
Une grande efficacité lors de l'exécution des contrôles — Cela s'applique aussi bien aux contrôles actifs qu'aux contrôles basés sur Checkmk. Lors d'un test de performance, un PC de bureau (Core i7) a atteint plus de 600 000 contrôles par minute.
Activation rapide des modifications - Une configuration comprenant 20 000 ordinateurs hôtes et 600 000 services peut être chargée en 0,5 seconde.
Modifications de configuration en cours d'exploitation - Les checks en cours d'exécution et les connexions Livestatus ne sont pas interrompus. La procédure est indétectable pour les utilisateurs de la supervision.
Requêtes de disponibilité rapides - Grâce à l'utilisation de caches spéciaux, les analyses de disponibilité — même sur de longues périodes de temps — peuvent être calculées sans temps d'attente perceptible.
Fonctionnalités supplémentaires - Le CMC utilise de nombreuses fonctionnalités supplémentaires, telles que, par exemple, des périodes de maintenance planifiées récurrentes et des confirmations avec des délais d'expiration automatiques.
D'autres éléments ont également été optimisés. Par exemple, les données de performance sont transmises sans détours directement du noyau du processeur au daemon de cache RRD, les notifications sont créées en mode « KeepAlive » et les vérifications d'hôte sont exécutées par un assistant ICMP intégré. Tout cela réduit la création de processus coûteux et économise les ressources du processeur.
Ces caractéristiques apportent de nombreux avantages, même dans les petites installations :
La moindre exigence en puissance de traitement permet à la virtualisation de se substituer au matériel dans de nombreux cas.
L'activation transparente des modifications permet des changements de configuration fréquents.
Les besoins tels que la supervision du cloud, où des serveurs peuvent être ajoutés et supprimés en succession rapide, peuvent ainsi être satisfaits.
Les deux diagrammes ci-dessous montrent la charge et l’utilisation du processeur pour un serveur Checkmk avant et après le passage de Nagios au CMC. Ces graphiques ont été aimablement fournis par la société DFi Service SA. À ce moment-là, ils effectuaient la supervision de 1 205 ordinateurs hôtes et de 13 555 services sur un serveur à 10 cœurs.


Un autre projet présente des résultats similaires. Les graphiques suivants illustrent une migration d’un nœud Nagios vers le CMC dans un environnement comptant 56 602 services répartis sur 2 230 ordinateurs hôtes surveillés, le tout sur une machine virtuelle dotée de deux cœurs :



L'ampleur de la différence dans un cas particulier dépend naturellement de nombreux facteurs. Dans le cas ci-dessus, une instance plus petite qui n'avait pas été restructurée fonctionne sur le même serveur. Sans cela, la différence en termes de charge CPU et de charge disque serait encore plus marquée.
D'autres aspects du CMC sont expliqués dans les articles suivants :
2. Foire aux questions (FAQ)
2.1. Le CMC peut-il également exécuter des plugins Nagios classiques ?
Le CMC peut bien sûr également exécuter des checks Nagios classiques, tant en mode actif qu'en mode passif.
2.2. Checkmk continuera-t-il à prendre en charge Nagios ?
Checkmk est compatible avec Nagios et continuera à prendre en charge le noyau Nagios. De même, les éditions commerciales continueront à proposer Nagios en tant que noyau optionnel — mais uniquement pour faciliter la migration de Checkmk Community vers les éditions commerciales.
2.3. Puis-je basculer entre Nagios et le CMC ?
Il est facile de basculer entre les deux cœurs, à condition que votre configuration ait été créée exclusivement à l’aide du menu de configuration de l’interface web de Checkmk. Vous trouverez plus de détails à ce sujet dans l’article « Migration vers le CMC ». Par défaut, les éditions commerciales créent de nouvelles instances avec le CMC comme cœur.
2.4. Le CMC est-il disponible gratuitement ?
Le CMC est inclus en tant que composant dans les éditions commerciales, qui sont disponibles par abonnement. Checkmk Ultimate peut être testé sans engagement pendant une période de temps limitée et utilisé de manière permanente à petite échelle sans licence.
