1. Einleitung
Im Leitfaden für Einsteiger haben wir Ihnen gezeigt, wie man die Basis schafft, um den Checkmk-Server zu überwachen. Im folgenden Artikel geht es nun darum, diese Überwachung sinnvoll mit Leben zu füllen. Schließlich kann Checkmk nicht nur prüfen, ob der Checkmk-Server läuft, sondern es gibt noch weitaus mehr Parameter, die geprüft — und in der Folge auch optimiert — werden können.
2. Prozesserkennung
In der Prozesserkennung beispielsweise existieren vorgefertigte Regeln für spezifische Services zur Selbstüberwachung. Dorthin gelangen Sie über Setup > Services > Discovery rules > Discovery of individual services > Process discovery.
Für jeden Host, der das Host-Merkmal cmk/check_mk_server:yes trägt, werden dank den mitgelieferten Regeln automatisch folgende Services gefunden:
Process myhost active check helpers
Process myhost agent receiver
Process myhost alert helper
Process myhost apache
Process myhost automation helpers
Process myhost checker helpers
Process myhost cmc
Process myhost dcd
Process myhost event console
Process myhost fetcher helpers
Process myhost jaeger
(nicht permanent sichtbar)Process myhost livestatus proxy
Process myhost notification spooler
Process myhost notify helper
Process myhost piggyback hub
(nicht permanent sichtbar)Process myhost rabbitmq
(nur bei aktiviertem Piggyback-Hub)Process myhost real-time helper
(nur bei aktivierten Realtime-Checks)Process myhost redis-server
Process myhost rrd helper
Process myhost rrdcached
Jede Regel, die Sie nicht benötigen, können Sie sowohl deaktivieren als auch löschen. Wir empfehlen, nicht benötigte Regeln zu deaktivieren, insbesondere, wenn Sie keine der Regeln nutzen wollen. Denn wenn Sie alle Regeln löschen — anstatt sie nur zu deaktivieren — , dann werden beim nächsten Einspielen eines Checkmk-Patches alle Regeln erneut erstellt.
Was Sie nun mit diesen Services anfangen können, lesen Sie im Artikel Services verstehen und konfigurieren. Was genau die Prozesse leisten, die hier als Services ins Monitoring aufgenommen werden, finden Sie im Artikel über die Instanzdienste beschrieben.
3. Selbstüberwachung des Systems (Plugins)
Auch im Katalog der Check-Plugins gibt es diverse Möglichkeiten zur Selbstüberwachung Ihres Systems. Teilweise sind diese bereits standardmäßig in Ihrem System aktiviert, so dass Sie kein zusätzliches Plugin benötigen. Die folgende Tabelle gibt dennoch eine Gesamtübersicht:
| Plugin-Name / Manual Page Titel |
Funktion | Parameter | Ausgabe |
|---|---|---|---|
bi_aggregation / |
Gibt den Status eines BI-Aggregats aus. Zeigt auch an, ob sich das Aggregat derzeit in einer Wartungszeit befindet oder quittiert wurde. |
Name des Aggregats |
ein Service pro BI-Aggregat |
bi_aggregation_connection / |
Status-Informationen zum Spezialagenten agent_bi. Beinhaltet Verbindungsfehler, fehlende Instanz-Daten und fehlende Aggregate aufgrund fehlender Daten. |
n/a |
ein Service pro Verbindung |
check-mk / |
Ruft Statusinformationen aus den konfigurierten Datenquellen ab, z.B. von konfigurierten Agenten, Spezialagenten, SNMP, Piggyback-Daten und Management-Boards. Der von den Ergebnissen abhängige Gesamtstatus des Services kann mit dem Regelsatz Status of the Checkmk services konfiguriert werden. Aktualisiert auch alle passiven Services und eventuelle Piggyback-Daten des Hosts. |
n/a |
n/a |
check-mk-inventory / |
Wird auf neuen Instanzen automatisch erstellt. Geht automatisch auf WARN, sobald sich ein Service der Host-Merkmale ändert. Eine Konfiguration ist über den Regelsatz Periodic service discovery möglich. Hier kann auch ein automatisches Update der Checkmk-Konfiguration mit den gefundenen Services aktiviert werden. |
n/a |
ein Service für jeden Host, der diesen Check unterstützt |
checkmk_agent / |
Stellt die ordnungsgemäße Funktion des Checkmk-Agent-Bereitstellungsmechanismus (falls verwendet) sicher. Überprüft den Zeitpunkt der letzten erfolgreichen Verbindung zum Bereitstellungsserver und das Vorliegen von Fehlermeldungen, zeigt die Anzahl der bereitgestellten Agentenplugins und lokalen Checks. Weitere Einstellungen sind möglich, siehe die Plugin-Beschreibung |
n/a |
ein Service |
cmk_site_statistics / |
Überwacht die Anzahl der Hosts und Services von Checkmk-Standorten, meldet die Gesamtzahl der Hosts, die Anzahl der Hosts, die nicht UP sind, sowie die Anzahl der Hosts, die UP, DOWN, in Wartungszeit und UNREACH sind. Meldet die Gesamtzahl der Services, die Anzahl der Services, die nicht OK sind, sowie die Anzahl der Services, die OK sind, sich in Wartungszeit befinden, auf ausgefallenen Hosts laufen, WARN, UNKNOWN und CRIT sind. Der Check ist immer OK und nicht vom Benutzer konfigurierbar. |
Name der Checkmk-Instanz |
ein Service pro laufender Checkmk-Instanz auf einem Checkmk-Server |
livestatus_status / |
Erhält über Livestatus verschiedene Performance-Daten eines OMD Monitoring-Kerns. Gibt damit Auskunft über die Leistung des Kerns, die Anzahl der pro Sekunde ausgeführten Checks usw. Stellt fest, ob bestimmte Einstellungen deaktiviert wurden (z. B. Benachrichtigungen). Zustände können über Check-Parameter konfiguriert werden. |
Name der OMD-Instanz |
ein Service pro laufender OMD-Instanz. |
mkbackup / |
Prüft den Status von Backup-Aufträgen auf einer Checkmk Appliance. Meldet CRIT, wenn der Auftrag fehlschlägt oder seine nächste Ausführung überfällig ist. |
ID des Auftrags |
ein Service pro Backup-Auftrag |
mkbackup_site / |
Prüft den Status der Backup-Aufträge einer Checkmk-Instanz. Meldet CRIT, wenn der Auftrag fehlschlägt oder seine nächste Ausführung überfällig ist. |
ID der Instanz, gefolgt von |
ein Service pro Instanz und Backup-Auftrag |
mkeventd_status / |
Erhält diverse Performancewerte einer Instanz vom Typ Checkmk Event Console. Warnung bei aktiven Ereignislimits, Aufzeichnung von Performance-Metriken bzgl. der Event Console. Der Check ist nicht vom Benutzer konfigurierbar. |
Name der Checkmk-Instanz |
ein Service pro laufender Checkmk-Instanz |
mknotifyd_connection_v2 / |
Prüft den Status einzelner TCP-Verbindungen vom Checkmk-Benachrichtigungs-Spooler zu einem Remote-Spooler. Für jede ein- und ausgehende TCP-Verbindung wird ein Service erstellt. Der Status geht auf CRIT, wenn die Verbindung nicht aufgebaut ist. |
Name der Instanz, gefolgt vom Namen der verbundenen Remote-Instanz, getrennt durch einen Strich. Gibt es mehr als eine eingehende Verbindung vom gleichen Remote-Host, wird ein Index angehängt. Der Check ist nicht vom Benutzer konfigurierbar. |
ein Service pro Instanz und Verbindung |
mknotifyd / |
Prüft den Status des Checkmk-Benachrichtigungs-Spooler. WARN, wenn zurückgestellte Spool-Dateien zu lange liegen bleiben oder beschädigte Spool-Dateien gefunden werden. CRIT, wenn Spooler nicht läuft. Der Check ist nicht vom Benutzer konfigurierbar. |
Name der Instanz |
ein Service pro Instanz |
omd_apache / |
Erstellt Statistiken über die Anfragen, die vom Apache Webserver auf OMD-Instanzen bearbeitet werden. Er zeichnet die Anzahl der Anfragen, die gesendeten Bytes und die für die Bearbeitung der Anfragen benötigte Zeit auf. Es wird gruppiert nach Art der Anfrage, z. B. Checkmk-Tabellenansichten, NagVis-AJAX-Aufrufe, aber auch nach Typ, z. B. für Bilder, Stylesheets usw. Der Check verwendet eine bestimmte Logdatei, die sich unter |
Name der Instanz |
ein Service pro Instanz |
omd_broker_queues / |
Überwacht die Anzahl der Benachrichtigungen in Broker-Warteschlangen jeder Instanz-Applikation. Service-Name enthält die Instanz und den Applikationsnamen. Der Check ist immer OK. |
Instanz und Applikationsname |
ein Service pro Instanz-Applikation |
omd_broker_status / |
Überwacht den allgemeinen Status des Message Brokers auf jeder Instanz. Zeigt den vom Broker belegten Speicher, die Zahl der Warteschlangen und die Zahl der Shovels im Status running. Der Check ist immer OK. |
Name der Instanz |
ein Service pro Instanz, auf der ein Broker installiert ist und läuft |
omd_diskusage / |
Überwacht die Festplattenauslastung einer Instanz, um bei Bedarf die Suche nach Anomalien zu erleichtern. Eine Liste der aktuell überwachten Verzeichnisse finden Sie in der Plugin-Beschreibung. Der Check ist immer OK und nicht vom Benutzer konfigurierbar. |
Name der Instanz |
ein Service pro Instanz |
omd_status / |
Prüft den Status der OMD-Instanzen, die auf dem System gefunden wurden, mithilfe von |
Name der Instanz |
ein Service je Instanz, auf der die Option Autostart auf |
site_object_counts / |
Sammelt Informationen über die Anzahl unterschiedlicher Host-Typen oder genutzter Check-Kommandos auf den Checkmk-Instanzen. Einstellung und Funktionalität des Checks sind umfangreich, weitere Informationen hierzu finden Sie in der Plugin-Beschreibung. Der Check ist immer im Status OK. |
n/a |
ein Service |
