Checkmk
to checkmk.com

1. Checkmk-spezifische Begriffe

Agent

Ein Agent sammelt die für das Monitoring relevanten Daten von einem Host ein. Das kann ein kleines, auf dem Host installiertes Programm sein (der Checkmk-Agent), ein unabhängig von Checkmk auf dem Host laufender SNMP-Agent, ein Spezialagent, der sich die Informationen über eine vom Zielsystem bereitgestellte API besorgt — oder ein aktiver Check, der netzwerkbasierte Dienste abfragt.

Agent Updater

Der Agent Updater ist ein Agentenplugin in den CEE Checkmk Enterprise Editions, das die automatischen Aktualisierungen der Agenten ermöglicht.

Agentenbäckerei

Mit der Agentenbäckerei (englisch: agent bakery) können Agenten in den CEE Checkmk Enterprise Editions individuell paketiert und optional auch automatisch verteilt werden.

Agentenplugin

Ein Agentenplugin erweitert die Funktionen des standardmäßig ausgelieferten Checkmk-Agenten. Es ist ein kleines Programm oder Skript, das vom Checkmk-Agenten aufgerufen wird und die Ausgabe des Agenten um weitere Sektionen mit zusätzlichen Monitoring-Daten anreichert. Ein Beispiel für ein Agentenplugin ist der Agent Updater.

Aktiver Check

Ein aktiver Check ist ein kleines Programm oder Skript, das eine direkte Verbindung zu einem Dienst im Netzwerk oder Internet aufbaut und von dort die Monitoring-Daten abfragt. Aktive Checks werden für netzwerkbasierte Dienste wie HTTP, SMTP oder IMAP genutzt, z.B. check_http für das Abfragen von Webseiten. Ein aktiver Check kümmert sich sowohl um die Erhebung als auch um die Auswertung der Daten. Im Gegensatz dazu wird ein Check-Plugin manchmal auch als passiver Check bezeichnet, da es nur vorhandene Daten auswertet.

Änderungen aktivieren

Änderungen an der Konfiguration wirken sich erst auf das Monitoring aus, nachdem sie in einem zweiten Schritt aktiviert wurden; ähnlich, wie es zum Beispiel Partitionierungsprogramme handhaben: Konfigurieren, prüfen, anwenden.

API-Integrationen

Wenn im Setup von Checkmk von API integrations die Rede ist, sind Monitoring-Daten gemeint, die zwar das Datenformat des Checkmk-Agenten nutzen, aber aus einer anderen Quelle stammen. Solche Quellen können Datenquellenprogramme, Spezialagenten oder Hosts sein, die ihre Daten per Piggyback (huckepack) liefern. Sollen per API-Integration empfangene Daten im Monitoring verwendet werden, muss in den Eigenschaften eines Hosts API integrations aktiviert sein.

Automationsbenutzer

Spezielles Konto für die Abfrage und Konfiguration von Checkmk abseits der Weboberfläche, also zum Beispiel über API, Kommandozeile, Skript oder Webdienst. Der Automationsbenutzer hat standardmäßig ein zufällig ausgewürfeltes Automationspasswort (englisch automation secret).

Benachrichtigung

Mit einer Benachrichtigung (englisch: notification) wird ein Checkmk-Benutzer über Probleme oder andere Monitoring-Ereignisse aktiv informiert, per HTML-E-Mail, SMS, Slack oder ähnlichem. Wer wie benachrichtigt wird, legen die Benachrichtigungsregeln fest. Wenn zum Beispiel Herr Hirsch eine E-Mail mit der Information erhält, dass der Service Filesystem / auf dem Host myserver123 von WARN nach CRIT gewechselt ist, dann deshalb, weil Herr Hirsch Kontakt für diesen Host ist und in einer Benachrichtigungsregel steht, dass alle Kontakte des Hosts eine E-Mail erhalten sollen, wenn einer seiner Services nach CRIT wechselt.

Business Intelligence (BI)

Business Intelligence in Checkmk ermöglicht es, aus vielen einzelnen Statuswerten den Gesamtzustand einer übergeordneten Ebene abzuleiten und übersichtlich darzustellen. Das kann die abstrakte Gruppierung einzelner Komponenten oder eine geschäftskritische Anwendung sein. So lässt sich etwa der Zustand einer Anwendung E-Mail, bestehend aus diversen Hosts, Switches und Diensten wie SMTP und IMAP, über eine einzige Visualisierung erfassen. Auch die Formulierung gänzlich ungreifbarer und nicht-technischer Belange ist hier möglich, zum Beispiel die termingerechte Verfügbarkeit eines auszuliefernden Produkts: Dieses Ziel liegt in der Zukunft und hängt von vielen Aspekten ab, der Supply Chain, einem funktionierenden Maschinenpark, verfügbarem Personal etc. Etwaige Gefährdungen für dieses abstrakte Ziel ließen sich über das BI-Modul erfassen.

Check

Ein Check im Sinne von Checkmk ist das Prüfen eines Hosts oder Services gemäß erstellter Regeln und eines Check-Plugins, also der Vorgang, der den Status von Hosts und Services bestimmt. Anders ausgedrückt: Das Ausführen eines Check-Plugins mit dem Ergebnis OK, DOWN, UNREACH, WARN, CRIT, PEND oder UNKNOWN.

Mehr unter Regeln.

Check-Plugin

Check-Plugins sind in Python geschriebene Module, die auf der Checkmk-Instanz ausgeführt werden und die Services eines Hosts erstellen und auswerten. Ein Beispiel: Das Check-Plugin df, zu finden innerhalb einer Instanz unter ~/share/check_mk/checks/ (legacy) oder ~/lib/python3/cmk/base/plugins/agent_based/, erstellt aus den Daten eines Agenten in der Instanz Services für die vorhandenen eingebundenen Dateisysteme eines Hosts und überprüft diese Services anhand der Daten, also etwa wie viel freien Speicherplatz es noch gibt.

Checkmk-Erweiterungspaket (MKP)

MKP ist das Checkmk-eigene Dateiformat zum Zusammenfassen und Verteilen von Erweiterungen, also eigenen Check-Plugins, Agentenplugins, Zeitreihen-Graph-Definitionen, Benachrichtigungsskripten, Tabellenansichten, Dashboards und so weiter.

Dashboard

Ein Dashboard ist eine frei konfigurierbare Übersicht, bestehend aus Tabellenansichten und/oder so genannten Dashboard-Elementen (englisch: dashlet). Diese Elemente gibt es zum Beispiel in Form von Listen (etwa Host-Probleme), Zeitreihen-Graphen oder kleinen Tachometern, die einzelne Werte wie etwa eine CPU-Temperatur visualisieren.

Mehr unter Dashboards.

Edition

Checkmk-Editionen sind die unterschiedlichen Software-Varianten von Checkmk, die geladen und installiert werden können. Also die Open Source Edition CRE Checkmk Raw Edition, die per Subskription erhältliche CSE Checkmk Enterprise Standard Edition, deren kostenlose, aber auf 25 Hosts beschränkte Schwester CFE Checkmk Enterprise Free Edition sowie die mandantenfähige CME Checkmk Enterprise Managed Services Edition.

Event Console (EC)

Bei der Überwachung von Hosts und Services geht es in Checkmk um Zustände. Die Event Console ist das Modul, das sich im Gegensatz dazu um Ereignisse kümmert, also die Überwachung aus Quellen wie Syslog oder SNMP-Traps, aber optional auch Windows Event Log, Log-Dateien und eigenen Anwendungen. Ein Beispiel: Eine Warnmeldung des SMTP-Dienstes auf einem Mailserver würde weder den Status/Zustand von dessen Host noch Services ändern — dennoch ist es eine relevante Information, die ins Monitoring gehört. Mit der Event Console können solche Ereignisse in Checkmk dargestellt werden.

Host

Ein Host im Sinne von Checkmk ist jedes eigenständige, physische oder virtuelle System, das von Checkmk überwacht wird. In der Regel handelt es sich um Dinge mit eigener IP-Adresse (Server, Switches, SNMP-Geräte, virtuelle Maschinen), aber auch um beispielsweise Docker Container oder andere logische Objekte ohne eine solche Adresse. Jeder Host hat immer einen der Zustände UP, DOWN, UNREACH oder PEND und immer mindestens einen Service.

Noch weiter heruntergebrochen: Ein Host ist für Checkmk intern lediglich ein Strukturierungselement, das zu überwachende Elemente beinhaltet, also Services. Jeder Host hat zwangsläufig mindestens einen Service, um überhaupt die Erreichbarkeit zu verifizieren (etwa PING oder der Checkmk-Agent selbst, also der Service Check_MK). Insofern meint Host kaum mehr als die Überschrift, unter der eine Anzahl an Services gruppiert ist.

Host-Gruppe

Hosts werden in Checkmk primär über Ordner verwaltet. Host-Gruppen ermöglichen eine zweite Ebene der Gruppierung von Hosts über die Ordnerstruktur, um Hosts im Monitoring z.B. in Tabellenansichten auswählen zu können. Host-Merkmale, Labels und Ordner werden genutzt, um Hosts über Regeln solchen Gruppen zuzuordnen. Hosts können aber auch explizit einer Host-Gruppe zugeordnet werden.

Mehr unter Host-Gruppen

Host-Merkmal

Host-Merkmale (englisch: host tags) sind Schlagworte, die Hosts zugeordnet werden können, um diese später etwa im Monitoring für Tabellenansichten oder in der Konfiguration für Regeln gezielt ansprechen zu können. Host-Merkmale sind in Gruppen eingeteilt, beispielsweise lässt sich eine Merkmalsgruppe Betriebssysteme mit den Merkmalen Linux und Windows einrichten. Einige Merkmalsgruppen sind bereits vordefiniert, etwa zur Art des verwendeten Checkmk-Agenten oder zur IP-Adressfamilie, über die festgehalten wird, ob ein Host über IPv4, IPv6 oder beide Versionen überwacht werden soll. Sie haben außerdem vorher festgelegte Werte und einen Standard, welcher jedem Host zugeordnet ist, solange er nicht mit einer anderen Option aus der Gruppe überschrieben wurde.

Mehr unter Host-Merkmale.

Host-Status

Der Host-Status beschreibt den Zustand des Hosts, also ob dieser über das Netz erreichbar ist (UP), nicht auf Anfragen aus dem Netz antwortet (DOWN) oder ob der Weg durch ausgefallene zwischengeschaltete Geräte (Switches, Router etc.) versperrt ist (UNREACH). Für frisch ins Monitoring aufgenommene, noch nie abgefragte Hosts gibt es zudem den Zustand PEND, welcher aber kein Status im eigentlichen Sinne ist.

Instanz

Instanz (englisch: site) nennt sich ein laufendes Checkmk-Monitoring-Projekt. Checkmk lässt sich parallel auf demselben Server in mehreren, unabhängigen Instanzen betreiben, um beispielsweise unterschiedliche Checkmk-Versionen oder -Editionen auszuprobieren oder ein separates Monitoring für (neue) Hosts zu betreiben, die (noch) nicht ins produktive Monitoring aufgenommen werden sollen.

Konfigurationsumgebung

Die Checkmk-Weboberfläche teilt sich auf in Monitoring- und Konfigurationsumgebung. Letztere bezeichnet die Bereiche, in denen Regeln gebaut, Host und Services hinzugefügt und eingestellt, Benutzer verwaltet oder generelle Optionen gesetzt werden. Zur Konfigurationsumgebung geht es über das Setup-Menü in der Navigationsleiste.

Kontakt

Kontakte werden Checkmk-Benutzer genannt, die für bestimmte Hosts und Services zuständig sind. Die Zuordnung von Kontakten zu Hosts und Service geschieht über Kontaktgruppen. Kontakte können auch Benutzerkonten sein, die rein für die Benachrichtigungen existieren, beispielsweise für die Weiterleitung an ein Ticketsystem.

Mehr unter Kontaktgruppen.

Label

Hosts können mit Host-Merkmalen versehen, aber auch mit direkten Auszeichnungen versehen werden. Diese Labels sind ebenfalls in Gruppen unterteilt, wobei die Gruppe (oder auch der Schlüssel) vor dem Doppelpunkt steht und der Wert danach. Solche beliebige Schlüssel-Wert-Paare (os:linux, os:windows, foo:bar etc.) können bei einem Host ohne vorherige Konfiguration einer Merkmalsgruppe direkt gesetzt werden und lassen sich später für die Filterung in Regeln und Tabellenansichten und andere Dinge nutzen. Sie verfügen daher über keinen vorher definierten Umfang und haben auch keinen Standardwert wie Host-Merkmale, sind dafür aber deutlich dynamischer. Insbesondere kann Checkmk von Containersystemen wie Kubernetes, Azure oder AWS automatisch erzeugte Objekte selbständig als Hosts ins Monitoring übernehmen und diese dann mit automatisch aus deren Metadaten generierten Labels anreichern.

Mehr unter Labels.

Livestatus

Livestatus ist die wichtigste Schnittstelle in Checkmk. Durch sie bekommen Checkmk-Benutzer schnellstmöglich und live Zugriff auf alle Daten der überwachten Hosts und Services. So werden z.B. die Daten im Snapin Overview direkt über diese Schnittstelle abgerufen. Dass die Daten direkt aus dem RAM geholt werden, vermeidet langsame Festplattenzugriffe und gibt einen schnellen Zugriff auf das Monitoring, ohne das System zu sehr zu belasten.

Lokaler Check

Ein lokaler Check ist eine (selbst geschriebene) Erweiterung, die in Form eines Skripts in einer beliebigen Sprache auf dem überwachten Host läuft. Im Gegensatz zu normalen Checks läuft die Statusberechnung direkt auf dem Host. Die Ergebnisse werden der regulären Agentenausgabe hinzugefügt.

Mehr unter Lokale Checks.

Metrik

Mess- und berechenbare Werte zu Hosts und Services, etwa Temperatur, Auslastung oder Verfügbarkeit, die beispielsweise für Graphen herangezogen werden können. Vergangene Werte werden in RRDs (Round-Robin-Datenbank) gespeichert und halten diese in der Standardeinstellung bis zu 4 Jahre vor.

Monitoring-Umgebung

Die Checkmk-Weboberfläche teilt sich auf in Monitoring- und Konfigurationsumgebung. Erstere bezeichnet die Bereiche, in denen der Status der überwachten Infrastruktur angezeigt wird; dazu zählen etwa das Inventar, Dashboards, Listen mit Hosts, Services, Ereignissen oder Problemen, historische Daten und so weiter. Zur Monitoring-Umgebung geht es über das Monitor-Menü in der Navigationsleiste.

Navigationsleiste

Die Navigationsleiste ist die Hauptnavigation der Checkmk-Oberfläche, auf der linken Seite u.a. mit den Menüs Monitor, Setup und Customize.

Physische Appliance

Die physische Appliance ist ein 19"-Server mit einer vorinstallierten, für Checkmk vorbereiteten Firmware, der sofort in Rechenzentren eingesetzt werden kann. Sie kommt mit einer grafischen Konfigurationsoberfläche, die jegliche Linux-Kenntnisse überflüssig macht.

Piggyback

Manche Hosts im Monitoring werden nicht direkt abgefragt, weil es sich nicht um physischen Geräte, sondern virtuelle Maschinen oder Container handelt, oder die Daten nur von einem Drittsystem bereitgestellt werden können. Diese Drittsysteme (die physischen Gastgeber) liefern die Daten quasi als Anhang in ihrer eigenen Agentenausgabe mit. Ein Docker-Server würde also zum Beispiel neben den eigenen Daten die Daten der Container huckepack (englisch: piggyback) mitliefern.

Regel

Regeln sind die Grundlage der Konfiguration von Hosts und Services in Checkmk. Regeln in einem Regelsatz steuern immer einen einzelnen, fokussierten Aspekt eines Hosts oder Services. Sie lassen sich mit Bedingungen versehen, sowie innerhalb eines Regelsatzes beliebig aufeinander "stapeln". Die Auswertung erfolgt dann von oben nach unten, so dass es Standardregeln geben kann, wenn keine Bedingung greift, aber auch sehr spezielle Regeln, die nur einen ganz bestimmten Host betreffen. Viele Regelsätze in Checkmk haben bereits vordefinierte Standardwerte, so dass nur für abweichende Anforderungen Regeln erstellt werden müssen.

Mehr unter Regeln.

Regelsatz

Ein Regelsatz steht für einen bestimmten Aspekt eines Hosts oder Services, beispielsweise die Schwellwerte der CPU-Auslastung. In jedem Regelsatz können beliebig viele einzelne Regeln erstellt werden. So könnte etwa der Regelsatz CPU utilization on Linux/UNIX zwei Regeln enthalten, die den Service auf bestimmten Hosts bei 90 Prozent und auf anderen schon bei 70 Prozent auf den Status WARN setzen.

Seitenleiste

Die Seitenleiste (englisch: sidebar) lässt sich aus der Navigationsleiste per Mausklick einblenden. In die Seitenleiste können Benutzer diverse Snapins aufnehmen, die die Navigation erleichtern oder wichtige Statusdaten auf einen Blick zeigen.

Mehr unter Seitenleiste.

Service

Ein Service ist ein logisches Objekt, welches einen oder mehrere Teilaspekte eines Hosts zusammenfasst. Also beispielsweise Größe, Auslastung und Trends von Dateisystemen, CPU-Auslastung, Temperaturen, Alter und Anzahl laufender Programme, Ports, Sensoren und so weiter. Jeder Service im Monitoring hat zu jedem Zeitpunkt einen der Zustände OK, WARN, CRIT, UNKNOWN oder PEND, ist immer genau einem Host zugeordnet und enthält optional eine oder mehrere Metriken.

Service-Erkennung

Sobald ein Host dem Monitoring hinzugefügt wird, erkennt Checkmk automatisch alle verfügbaren Services, die ins Monitoring aufgenommen werden können — und hält diese Liste auch im laufenden Betrieb stets aktuell. Die Service-Erkennung (englisch: service discovery) lässt sich aber auch jederzeit manuell über die Konfiguration eines Hosts starten.

Service-Gruppe

Analog zu den Hosts lassen sich auch Services in Gruppen zusammenfassen, um diese Gruppen später in Tabellenansichten zu filtern oder in der Konfiguration gezielt anzusprechen. Gruppieren lässt sich nach Ordnern, Host-Merkmalen, Host- und Service-Labels sowie via regulären Ausdrücken gefilterten Host- und Service-Namen.

Mehr unter Service-Gruppen.

Service-Status

Der Service-Status ist immer OK WARN, CRIT oder UNKNOWN und beschreibt, in welchem Zustand sich der Service aktuell befindet — gemäß den gesetzten Regeln. Für frisch ins Monitoring aufgenommene, noch nie abgefragte Services gibt es zudem den Zustand PEND, welcher aber kein Status im eigentlichen Sinne ist.

Mehr unter Services.

Snapin

Snapins, auch Seitenleistenelemente genannt, sind die einzelnen Bausteine, die sich in der Seitenleiste platzieren lassen, beispielsweise Overview und Master control. Zugriff auf die Snapins liefert das Plus-Symbol unten in der Seitenleiste.

Mehr unter Seitenleiste.

SNMP

Das „Simple Network Management Protocol“ dient der Überwachung und Konfiguration von Netzwerkgeräten wie Routern, Switches oder Firewalls. Checkmk unterstützt dieses Protokoll — da es aber vergleichsweise ineffizient ist, sollten Sie SNMP nur bei Geräten einsetzen, die keine besseren Möglichkeiten zur Überwachung anbieten, wie beispielsweise Spezialagenten.

Mehr unter SNMP.

Spezialagent

Auf einigen Systemen lässt sich der reguläre Checkmk-Agent nicht installieren und SNMP steht nicht (befriedigend) zur Verfügung. Stattdessen bieten diese Systeme Management-APIs, die auf Telnet, SSH oder HTTP/XML basieren. Über einen Spezialagenten, der auf dem Checkmk-Server läuft, fragt Checkmk diese Schnittstellen ab, womit der Host per API in Checkmk integriert wird.

Mehr unter Spezialagenten.

Tabellenansicht

Neben den Dashboards sind die Tabellenansichten (englisch: views) die in der Checkmk-Oberfläche am häufigsten genutzten Darstellungen von Hosts, Services und anderen Objekten. Diese werden als Tabellen mit den im aktuellen Kontext relevanten Attributen angezeigt. Zum Beispiel sind All hosts und Host problems Tabellenansichten im Monitoring. Mitgelieferte Tabellenansichten können in ihrer Anzeige angepasst werden, und sie können als Basis für neue Ansichten dienen. Es ist auch möglich, Tabellenansichten komplett neu zu erstellen.

Verteiltes Monitoring

Checkmk unterscheidet zwischen verteiltem Monitoring und einem verteilten Setup. Verteiltes Monitoring bedeutet, dass das gesamte Monitoring-System aus mehr als einer Checkmk-Instanz besteht und die Daten an einer Stelle zusammen angezeigt werden. Oder anders: Das Monitoring besteht dann aus einer Zentralinstanz und mindestens einer Remote-Instanz und die Daten der Remote-Instanz werden auch in der Zentrale angezeigt. Ein verteiltes Monitoring kann optional mit einem verteilten Setup kombiniert werden.

Verteiltes Setup

Checkmk unterscheidet zwischen verteiltem Monitoring und einem verteilten Setup. Verteiltes Setup bedeutet, dass das gesamte Monitoring-System aus mehr als einer Checkmk-Instanz besteht und die Konfiguration an einer einzigen Stelle vorgenommen wird. Oder anders: Das Monitoring besteht dann aus einer Zentralinstanz und mindestens einer Remote-Instanz und die Konfiguration der Remote-Instanz kommt aus der Zentrale. Ein Verteiltes Setup beinhaltet immer auch ein verteiltes Monitoring.

Virtuelle Appliance

Die virtuelle Appliance ist ein für VirtualBox oder VMware ESXi erstelltes System mit einer vorinstallierten, für Checkmk vorbereiteten Firmware. Sie beinhaltet eine grafischen Konfigurationsoberfläche, die jegliche Linux-Kenntnisse überflüssig macht.

Wartungszeit

Wartungszeiten (englisch: scheduled downtimes) sind geplante Ausfälle, etwa für Aktualisierungen bestimmter Hosts. Wartungszeiten setzen beispielsweise die Benachrichtigungen temporär außer Kraft, werden bei der Verfügbarkeitsberechnung extra berücksichtigt und sorgen dafür, dass zugehörige Hosts und Services zeitweilig nicht als Probleme auftauchen.

Mehr unter Wartungszeiten.

WATO

Das „Web Administration Tool“ war bis zur Checkmk-Version 1.6.0 das GUI-Werkzeug zur Konfiguration von Checkmk. Mit der Einführung von WATO hatten Benutzer erstmals die Möglichkeit, Checkmk über eine Weboberfläche statt über Konfigurationsdateien anzupassen. WATO wurde in der Version 2.0.0 ersetzt durch das Setup-Menü in der Navigationsleiste.

Mehr unter Setup-Menü.

Werk

Die Software-Entwicklung von Checkmk ist in sogenannten Werks organisiert. Jede Änderung, Fehlerbehebung oder Neuerung, die einen Einfluss auf die Erfahrung des Benutzers hat, wird in einem eigenen Werk erfasst, samt Hinweisen zu Auswirkungen und etwaigen Inkompatibilitäten. Die Liste der Werks gibt es direkt in Checkmk über das Help-Menü in der Navigationsleiste und auf der Checkmk-Homepage.

Mehr unter Werks.

Zeitraum

In Checkmk lassen sich Dinge wie Benachrichtigungen, Verfügbarkeitsberechnungen und selbst die generelle Ausführung von Checks auf bestimmte Zeiten beschränken. Mit Zeiträumen (englisch: time periods) lassen sich zum Beispiel tägliche Arbeitszeiten definieren, Urlaube und Feiertage festlegen oder Wochenenden von Wochentagen trennen. Diese Zeiträume können anschließend in Regeln genutzt werden.

Mehr unter Zeiträume.

Auf dieser Seite