1. Einleitung
Ein großer Vorteil von Checkmk gegenüber vielen anderen Monitoring-Systemen ist die große Zahl von gut gepflegten mitgelieferten Check-Plugins. Damit diese eine einheitlich hohe Qualität haben, gibt es standardisierte Kriterien, die jedes Plugin erfüllen muss, welche wir hier vorstellen.
Dazu ein wichtiger Hinweis: gehen Sie nicht davon aus, dass alle mit Checkmk mitgelieferten Plugins sich bereits an alle aktuellen Richtlinien halten. Vergessen Sie Copy & Paste. Orientieren Sie sich lieber an den Hinweisen in diesem Artikel.
Wenn Sie Plugins nur für Ihren eigenen Bedarf entwickeln, sind Sie natürlich völlig frei und nicht an die Richtlinien gebunden.
1.1. Qualität
Für Check-Plugins, die offiziell Teil von Checkmk sind oder es werden wollen, gelten viel höhere Ansprüche an Qualität, als für solche, die man nur „für sich selbst“ schreibt. Dabei geht es sowohl um äußere Qualität (also Verhalten aus Sicht des Benutzers) als auch um innere Qualität (Lesbarkeit des Codes, etc.).
Schreiben Sie das Plugin so gut und hochwertig wie Sie können.
1.2. Umfang eines Check-Plugins
Jedes Check-Plugin muss mindestens folgende Komponenten umfassen:
Das Check-Plugin selbst.
Eine Man page.
Bei Plugins mit Check-Parametern eine Definition für den zugehörigen Regelsatz.
Metrikdefinitionen für Graphen und Perf-O-Meter, falls der Check Metrikdaten ausgibt.
Eine Definition für die Agentenbäckerei, falls es ein Agentenplugin gibt.
Mehrere vollständige unterschiedliche Beispielausgaben des Agenten bzw. SNMP-Walks.
2. Benennung
2.1. Name des Check-Plugins
Die Wahl des Namens für das Plugin ist besonders kritisch, da dieser später nicht geändert werden kann.
Der Name des Plugins muss kurz, spezifisch genug und verständlich sein. Beispiel:
firewall_status
ist nur dann ein guter Name, wenn das Plugin für alle oder zumindest viele Firewalls funktioniert.Der Name besteht aus Kleinbuchstaben und Ziffern. Als Trenner ist der Unterstrich erlaubt.
Das Wort
status
oderstate
hat im Namen nichts verloren, denn schließlich überwacht jedes Plugin einen Status. Gleiches gilt für das überflüssige Wortcurrent
. Verwenden Sie also anstelle vonfoobar_current_temp_status
einfach nurfoobar_temp
.Check-Plugins, bei denen das Item ein Ding repräsentiert (z.B. Fan, Power supply), sollen im Singular benannt werden (z.B.
casa_fan
,oracle_tablespace
). Check-Plugins bei denen jedes Item eine Anzahl oder Menge darstellt hingegen werden im Plural (z.B.user_logins
,printer_pages
) benannt.Produktspezifische Check-Plugins sollen den Produktnamen als Präfix haben (z.B.
oracle_tablespace
).Herstellerspezifische Check-Plugins, die sich nicht auf ein bestimmtes Produkt beziehen, sollen mit einem Präfix versehen werden, das den Hersteller wiedergibt (z.B.
fsc_
für Fujitsu Siemens Computers).SNMP-basierte Check-Plugins, die einen allgemeinen Teil der MIB verwenden, der womöglich von mehr als einem Hersteller unterstützt wird, sollen nach der MIB benannt werden, nicht nach dem Hersteller (z.B. die
hr_*
-Check-Plugins)
2.2. Name des Services
Benutzen Sie bekannte, gut abgegrenzte Abkürzungen (z.B. CPU, DB, VPN, IO,…).
Schreiben Sie Abkürzungen in Großbuchstaben.
Verwenden Sie Groß- und Kleinschreibung wie in natürlichen englischen Sätzen (z.B.
CPU utilization
, nichtCpu Utilization
) — Eigennamen sind eine Ausnahme.Verwenden Sie für Produktnamen die Schreibweise des Herstellers (z.B.
vSphere
).Nutzen Sie amerikanisches Englisch (z.B.
utilization
, nichtutilisation
).Folgen Sie Namenskonventionen, sofern diese existieren. So sollten alle Services für Interfaces das Template
Interface %s
nutzen.Halten Sie Beschreibungen kurz, denn Service-Namen werden in Dashboards, Views und Reports abgeschnitten, wenn diese zu lang sind.
2.3. Name der Metriken
Metriken, für die schon eine sinnvolle Definition existiert, sollen wiederverwendet werden.
Ansonsten gelten analoge Regeln wie bei den Namen von Check-Plugins (produktspezifisch, herstellerspezifisch, etc.)
2.4. Name der Check-Gruppe für den Regelsatz
Hier gilt das gleiche wie bei den Metriken.
3. Aufbau des Check-Plugins
3.1. Genereller Aufbau
Die eigentliche Python-Datei unter ~/share/check_mk/checks/
soll folgenden Aufbau haben (Reihenfolge einhalten):
Datei-Header mit GPL-Hinweis.
Name und E-Mail-Adresse des ursprünglichen Autors, falls das Plugin nicht vom Checkmk-Projekt selbst entwickelt wurde.
Eine kurze Beispielausgabe des Agenten.
Standardwerte für die Check-Parameter (
factory_settings
).Hilfsfunktionen, falls vorhanden.
Die Parse-Funktion, falls vorhanden.
Die Discovery-Funktion.
Die Check-Funktion.
Die
check_info
-Deklaration.
3.2. Coding-Richtlinien
Autor
Wenn das Plugin nicht vom Checkmk-Team entwickelt wurde, kann der Name und die E-Mail-Adresse des Autors hinterlegt werden, direkt nach dem Datei-Header.
Lesbarkeit
Vermeiden Sie lange Zeilen. Die maximale erlaubte Länge sind 100 Zeichen.
Die Einrückung erfolgt durch jeweils vier Leerzeichen. Verwenden Sie kein Tabulatorzeichen.
Orientieren Sie sich am Python-Standard PEP 8.
Beispielausgabe des Agenten
Das Hinzufügen einer Beispielausgabe vom Agenten erleichtert das Lesen des Codes ungemein. Dabei ist es wichtig, dass auch verschiedene mögliche Varianten der Ausgabe im Beispiel vorkommen. Machen Sie das Beispiel nicht länger als notwendig. Bei SNMP-basierten Checks geben Sie einen SNMP-Walk an:
# Example excerpt from SNMP data:
# .1.3.6.1.4.1.2.3.51.2.2.7.1.0 255
# .1.3.6.1.4.1.2.3.51.2.2.7.2.1.1.1 1
# .1.3.6.1.4.1.2.3.51.2.2.7.2.1.2.1 "Good"
# .1.3.6.1.4.1.2.3.51.2.2.7.2.1.3.1 "No critical or warning events"
# .1.3.6.1.4.1.2.3.51.2.2.7.2.1.4.1 "No timestamp"
Wenn es z.B. aufgrund verschiedener Firmwareversionen des Zielgerätes verschiedene Ausgabeformate gibt, dann geben Sie für jeden ein Beispiel an, mit einem Hinweis auf die Version.
Ein gutes Beispiel dafür finden Sie im Check-Plugin multipath
.
SNMP-MIBs
Bei der Definition des snmp_info
soll in Kommentaren der lesbare Pfad zur OID angegeben werden.
Beispiel:
'snmp_info' : (".1.3.6.1.2.1.47.1.1.1.1", [
OID_END,
"2", # ENTITY-MIB::entPhysicalDescription
"5", # ENTITY-MIB::entPhysicalClass
"7", # ENTITY-MIB::entPhysicalName
]),
Verwendung von lambda
Vermeiden Sie komplizierte Ausdrücke mit lambda
.
Erlaubt ist lambda
bei der Scan-Funktion lambda oid: …
und wenn man bestehende Funktionen lediglich mit einem bestimmten geänderten Argument aufrufen möchte, z.B.:
"inventory_function" : lambda info: inventory_foobar_generic(info, "temperature")
Schleifen über SNMP-Agentendaten
Bei Checks, die in einer Schleife über SNMP-Daten gehen, sollen Sie keine Indizes verwenden wie hier:
for line in info:
if line[1] != '' and line[0] ...
Besser ist es, jede Zeile gleich in sinnvolle Variablen auszupacken:
for *sensor_id, state_state, foo, bar* in info:
if sensor_state != '1' and sensor_id ...
Parse-Funktionen
Verwenden Sie Parse-Funktionen wann immer das Parsen der Agentenausgabe nicht trivial ist.
Das Argument der Parse-Funktion soll dann immer info
heißen und bei der Discovery- und Check-Funktion nicht mehr info
, sondern parsed
.
Somit wird dem Leser deutlich, dass dies das Ergebnis der Parse-Funktion ist.
Checks mit mehreren Teilresultaten
Ein Check, der in einem Service mehrere Teilzustände liefert (z.B. aktuelle Belegung und Wachstum), muss diese mit yield
zurückgeben.
Checks, die nur ein Resultat liefern, müssen dies mit return
tun.
if "abs_levels" in params:
warn, crit = params["abs_levels"]
if value >= crit:
yield 2, "...."
elif value >= warn:
yield 1, "...."
else:
yield 0, "..."
if "perc_levels" in params:
warn, crit = params["perc_levels"]
if percentage >= crit:
yield 2, "...."
elif percentage >= warn:
yield 1, "...."
else:
yield 0, "..."
Die Markierungen (!)
und (!!)
sind veraltet und dürfen nicht mehr verwendet werden.
Diese sollen durch yield
ersetzt werden.
Schlüssel in check_info[…]
Legen Sie in Ihrem Eintrag in check_info
nur solche Schlüssel an, die verwendet werden.
Die einzigen verpflichtenden Einträge sind "service_description"
und "check_function"
.
Fügen Sie "has_perfdata"
und andere Schlüssel mit booleschen Werten nur dann ein, wenn der Wert True
ist.
3.3. Agentenplugins
Wenn Ihr Check-Plugin ein Agentenplugin benötigt, dann beachten Sie folgende Regeln:
Legen Sie das Plugin nach
~/share/check_mk/agents/plugins
für unixoide Systeme und setzen Sie die Ausführungsrechte auf755
.Bei Windows heißt das Verzeichnis
~/share/check_mk/agents/windows/plugins
.Shell- und Python-Skripte sollen keine Endung haben (
.sh
oder.py
weglassen).Verwenden Sie bei Shell-Skripten
#!/bin/sh
in der ersten Zeile. Verwenden Sie#!/bin/bash
nur dann, wenn Sie Features der Bash brauchen.Fügen Sie den Standard Checkmk-Datei-Header mit dem GPL-Hinweis ein.
Ihr Plugin darf auf dem Zielsystem keinerlei Schaden verursachen, vor allem auch dann nicht, wenn das Plugin von dem System eigentlich nicht unterstützt wird.
Vergessen Sie den Hinweis auf das Plugin nicht in der Man page des Check-Plugins.
Wenn die Komponente, die das Plugin überwacht, auf einem System gar nicht existiert, darf das Plugin auch keinen Sektions-Header ausgeben.
Wenn das Plugin eine Konfigurationsdatei benötigt, soll es diese (bei Linux) im Verzeichnis
$MK_CONFDIR
suchen und die Datei soll den gleichen Namen wie das Plugin haben, nur mit der Endung.cfg
und ohne ein möglichesmk_
am Anfang. Bei Windows gilt das analog. Das Verzeichnis ist hier%MK_CONFDIR%
.Schreiben Sie unter Windows keine Plugins in PowerShell. Dieses ist nicht portabel und außerdem sehr ressourcenhungrig. Verwenden Sie VBScript.
Schreiben Sie keine Plugins in Java.
3.4. Was man nicht tun sollte
Verwenden Sie kein
import
in Ihrer Check-Plugin-Datei. Alle erlaubten Python-Module sind bereits importiert.Verwenden Sie zum Parsen und zur Verrechnung von Zeitangaben nicht
datetime
sonderntime
. Das kann alles, was Sie brauchen. Wirklich!Argumente, die eine Ihrer Funktionen übergeben bekommt, darf diese auf keinen Fall modifizieren. Dies gilt insbesondere für
params
undinfo
.Wenn Sie wirklich mit regulären Ausdrücken arbeiten wollen (diese sind langsam!), so holen Sie sich diese mit der Funktion
regex()
. Verwenden Sie nichtre
direkt.Selbstverständlich dürfen Sie nirgendwo
print
verwenden, anderweitige Ausgaben nachstdout
machen oder sonst irgendwie mit der Außenwelt kommunizieren!Die SNMP-Scan-Funktion darf keine OIDs außer
.1.3.6.1.2.1.1.1.0
und.1.3.6.1.2.1.1.2.0
holen. Ausnahme: sie hat vorher durch Check einer dieser beiden OIDs sichergestellt, dass weitere OIDs nur von einer eng eingegrenzten Zahl von Geräten geholten werden.
4. Verhalten des Check-Plugins
4.1. Exceptions
Ihr Check-Plugin darf nicht nur sondern soll sogar stets davon ausgehen, dass die Ausgabe des Agenten syntaktisch valide ist. Das Plugin darf auf keinen Fall versuchen, etwaige unbekannte Fehlersituationen in der Ausgabe selbst zu behandeln!
Warum?
Checkmk hat eine sehr ausgefeilte automatische Behandlung von solchen Fehlern.
Es kann für den Benutzer ausführliche Absturzberichte (crash reports) erzeugen und setzt auch den Zustand des Plugins zuverlässig auf UNKNOWN.
Dies ist viel hilfreicher als wenn der Check z.B. einfach nur unknown SNMP code 17
ausgibt.
Generell soll die Discovery-, Parse- und/oder Check-Funktion in eine Exception laufen, wenn die Ausgabe des Agenten nicht in dem definierten, bekannten Format ist, aufgrund dessen das Plugin entwickelt wurde.
4.2. saveint() und savefloat()
Die Funktionen saveint()
und savefloat()
konvertieren einen String in int
bzw. float
und ergeben eine 0
, falls der String nicht konvertierbar ist (z.B. leerer String).
Verwenden Sie diese Funktionen nur dann, wenn der leere bzw. ungültige Wert ein bekannter und erwartbarer Fall ist. Ansonsten würden Sie wichtige Fehlermeldungen damit unterdrücken (siehe oben).
4.3. Nicht gefundenes Item
Ein Check, der das überwachte Item nicht findet, soll einfach None
zurückgeben und nicht eine eigene Fehlermeldung dafür generieren.
Checkmk wird in diesem Fall eine standardisierte konsistente Fehlermeldung ausgeben und den Service auf UNKNOWN setzen.
4.4. Schwellwerte
Viele Check-Plugins haben Parameter, die Schwellwerte für bestimmte Metriken definieren und so festlegen, wann der Check WARN bzw. CRIT wird. Beachten Sie dabei die folgenden Regeln, die dafür sorgen, dass sich Checkmk konsistent verhält:
Die Schwellen für WARN und CRIT sollen immer mit
>=
und<=
überprüft werden. Beispiel: ein Plugin überwacht die Länge einer E-Mail-Warteschlange. Die kritische obere Schwelle ist 100. Das bedeutet, dass der Wert 100 bereits kritisch ist!Wenn es nur obere oder nur untere Schwellwerte gibt (häufigster Fall), dann sollen die Eingabefelder im Regelsatz mit Warning at und Critical at beschriftet werden.
Wenn es obere und untere Schwellwerte gibt, soll die Beschriftung wie folgt lauten: Warning at or above, Critical at or above, Warning at or below und Critical at or below.
4.5. Ausgabe des Check-Plugins
Jeder Check gibt eine Zeile Text aus - die Plugin-Ausgabe. Um ein konsistenten Verhalten von allen Plugins zu erreichen, gelten folgende Regeln:
Bei der Anzeige von Messwerten steht genau ein Leerzeichen zwischen dem Wert und der Einheit (z.B.
17.4 V
). Die einzige Ausnahme: bei%
steht kein Leerzeichen:89.5%
.Bei der Anzeige von Messwerten ist die Bezeichnung des Wertes in Großbuchstaben geschrieben, gefolgt von einem Doppelpunkt. Beispiel:
Voltage: 24.5 V, Phase: negative, Flux-Compensator: operational
Zeigen Sie in der Plugin-Ausgabe keine internen Schlüssel, Codewörter, SNMP-Interna oder anderen Müll an, mit dem der Benutzer nichts anfangen kann. Verwenden Sie sinnvolle menschenlesbare Begriffe. Verwenden Sie die Begriffe, die Benutzer üblicherweise erwarten. Beispiel: Verwenden Sie
route monitor has failed
anstelle vonrouteMonitorFail
.Wenn das Check-Item eine zusätzliche Spezifikation hat, dann setzen Sie diese in eckige Klammern an den Anfang der Ausgabe (z.B.
Interface 2 - [eth0] …
).Bei Aufzählungen wird mit einem Komma getrennt und danach mit einem Großbuchstaben fortgesetzt:
Swap used: …, Total virtual memory used: …
4.6. Standardschwellwerte
Jedes Plugin, das mit Schwellwerten arbeitet, soll sinnvolle Standard-Schwellwerte definieren. Dabei gelten folgende Regeln:
Die im Check verwendeten Standardschwellwerte sollen auch 1:1 im zugehörigen Regelsatz als Standardparameter definiert sein.
Die Standardschwellwerte sollen in
factory_settings
definiert werden (falls der Check ein Dictionary als Parameter hat).Die Standardschwellwerte sollen fachlich fundiert gewählt werden. Gibt es vom Hersteller eine Vorgabe? Gibt es „Best Practices“?
Im Check muss unbedingt dokumentiert sein, woher die Schwellwerte kommen.
4.7. Nagios vs. CMC
Stellen Sie sicher, dass Ihr Check auch mit Nagios als Monitoring-Kern funktioniert. Meist ist das automatisch der Fall, aber nicht immer.
5. Metriken
5.1. Format der Metriken
Die Metrikdaten werden vom Check-Plugin immer als
int
oderfloat
zurückgegeben. Strings sind nicht erlaubt.Wenn Sie in dem Sechstupel von einem Metrikwert Felder auslassen möchten, dann verwenden Sie
None
an deren Stelle. Beispiel:[("taple_util", utilization, None, None, 0, size)]
Wenn Sie Einträge am Ende nicht benötigen, dann kürzen Sie einfach das Tupel. Verwenden Sie kein
None
am Ende.
5.2. Benennung der Metriken
Die Namen von Metriken bestehen aus Kleinbuchstaben und Unterstrichen. Ziffern sind erlaubt, allerdings nicht am Anfang.
Die Namen von Metriken sollen analog zu den Check-Plugins kurz aber spezifisch benannt sein. Metriken, die von mehreren Plugins verwendet werden, sollen generische Namen haben.
Vermeiden Sie das sinnlose Füllwort
current
. Der Messwert ist ja immer der gerade aktuelle.Die Metrik soll nach dem „Ding“ benannt werden, nicht nach der Einheit. Also z.B.
current
anstelle vonampere
odersize
anstelle vonbytes
.
Wichtig: Verwenden Sie immer die kanonische Größenordnung. Wirklich! Checkmk skaliert die Daten von sich aus sinnvoll. Beispiele:
Domäne | kanonische Einheit |
---|---|
Dauer |
Sekunde |
Dateigröße |
Byte |
Temperatur |
Celsius |
Netzwerkdurchsatz |
Oktette pro Sekunde (nicht Bits/s!) |
Prozentwert |
Wert von 0 bis 100 (nicht 0.0 bis 1.0) |
Ereignisse pro Zeit |
1 pro Sekunde |
Elektrische Leistung |
Watt (nicht mW) |
5.3. Kennzeichen für Metrikdaten
Setzen Sie "has_perfdata"
in check_info
nur genau dann auf True
, wenn der Check wirklich Metrikdaten ausgibt (oder ausgeben kann).
5.4. Definition für Graph und Perf-O-Meter
Die Definition für Graphen soll analog zu den Definitionen in ~/web/plugins/metrics/check_mk.py
erfolgen.
Erzeugen Sie keine Definitionen für PNP-Graphen.
Auch in der Raw Edition werden diese anhand der Metrikdefinition in Checkmk selbst erzeugt.
6. Definition des Regelsatzes
6.1. Name der Check-Gruppe
Check-Plugins mit Parametern erfordern zwingend die Definition eines Regelsatzes.
Die Verbindung zwischen Plugin und Regelsatz erfolgt über die Check-Gruppe (Eintrag "group"
in check_info
).
Über die Gruppe werden alle Checks zusammengefasst, welche über den gleichen Regelsatz konfiguriert werden.
Falls Ihr Plugin sinnvollerweise mit einem bestehenden Regelsatz konfiguriert werden soll, dann verwenden Sie eine bestehende Gruppe.
Falls Ihr Plugin so spezifisch ist, dass es auf jeden Fall eine eigene Gruppe benötigt, dann legen Sie eine eigene Gruppe an, wobei der Name der Gruppe einen Bezug zum Plugin haben soll.
Falls abzusehen ist, dass es später noch weitere Plugins mit dem gleichen Regelsatz geben kann, verwenden Sie entsprechend einen generischen Namen.
6.2. Standardwerte von ValueSpecs
Definieren Sie bei Ihren Parameterdefinitionen (ValueSpecs) die Standardwerte genau so, wie die wirklichen Defaults des Checks sind (falls das geht).
Beispiel: Wenn der Check ohne Regel die Schwellwerte (5, 10)
für WARN und CRIT annimmt, dann soll das ValueSpec so definiert sein, dass automatisch auch 5
und 10
als Schwellwerte angeboten werden.
6.3. Wahl der ValueSpecs
Für manche Arten von Daten gibt es spezialisierte ValueSpecs.
Ein Beispiel ist Age
für eine Anzahl von Sekunden.
Diese müssen überall da verwendet werden, wo sie sinnvoll sind.
Verwenden Sie z.B. nicht Integer
in so einem Fall.
7. Include-Dateien
Für etliche Arten von Checks gibt es bereits fertige Implementierungen in Include-Dateien, die Sie nicht nur verwenden können, sondern sollen. Wichtige Include-Dateien sind:
|
Überwachung von Temperaturen |
|
Elektrische Wechselstromphase (z.B. bei USV) |
|
Lüfter |
|
Netzwerkschnittstellen |
|
Füllstände von Dateisystemen |
|
Überwachung von RAM (Hauptspeicher) |
|
Prozesse eines Betriebssystems |
Wichtig: Verwenden Sie vorhandene Include-Dateien nur dann, wenn diese für den jeweiligen Zweck auch gedacht sind und nicht, wenn diese nur so ungefähr passen!
8. Man pages
Jedes Check-Plugin muss eine Man page haben. Falls Sie in einer Check-Plugin-Datei mehrere Plugins programmiert haben muss natürlich jedes davon eine eigene Man page haben.
Die Man page ist für den Benutzer gedacht! Schreiben Sie Informationen, die diesem helfen. Es geht nicht darum, zu dokumentieren, was Sie programmiert haben, sondern darum, dass der Benutzer die für ihn wichtigen, nützlichen Informationen bekommt.
Die Man page muss sein
vollständig,
präzise,
knapp,
hilfreich.
Eine Man page besteht aus mehreren, teilweise optionalen, Bereichen:
8.1. Titel
Mit dem Makro title:
bestimmen Sie die Überschrift.
Sie besteht aus:
dem exakten Gerätenamen oder der Gerätegruppe, für welche der Check geschrieben ist,
der Information, was der Check überwacht (z.B. System Health).
Diese beiden Teile werden mit einem Doppelpunkt voneinander getrennt. Nur auf diese Weise können bestehende Checks leicht durchsucht und vor allem auch gefunden werden.
8.2. Agentenkategorien
Das Makro agents:
kann verschiedene Kategorien haben.
Grundsätzlich werden drei Bereiche unterschieden:
Agenten: In diesem Fall werden die Betriebssysteme angegeben, für welche der Check gebaut wurde und zur Verfügung steht, zum Beispiel
linux
oderlinux, windows, solaris
.SNMP: In diesem Fall gibt es nur den Eintrag
snmp
.Aktive Checks: Wenn ein aktiver Check in die Oberfläche von Checkmk integriert wurde, nehmen Sie die Kategorie
active
.
8.3. Katalogeintrag
Über den Header catalog:
legen Sie fest, wo im Katalog der Check-Plugins die Man page einsortiert wird.
Falls eine Kategorie fehlt (z.B. ein neuer Hersteller), so muss dieser in der Datei cmk/utils/man_pages.py
in der Variable catalog_titles
definiert werden.
Aktuell kann diese Datei nicht über Plugins in local/
erweitert werden, so dass Änderungen hier nur die Entwickler von Checkmk machen können.
Beachten Sie die genaue Groß-/Kleinschreibung von Produkt- und Firmennamen!
Das gilt nicht nur für den Katalogeintrag, sondern auch für alle anderen Texte, in denen diese vorkommen.
Beispiel: NetApp
wird immer NetApp
geschrieben und nicht netapp
, NETAPP
, Netapp
, oder dergleichen.
Google hilft, die richtige Schreibung zu finden.
8.4. Beschreibung des Plugins
Folgende Informationen müssen in der description:
der Man page enthalten sein:
Welche Hard- oder Software überwacht der Check genau? Gibt es Besonderheiten von bestimmten Firmware- oder Produktversionen der Geräte? Beziehen Sie sich dabei nicht auf eine MIB, sondern auf Produktbezeichnungen. Beispiel: Dem Benutzer ist nicht geholfen, wenn Sie schreiben „Dieser Check funktioniert bei allen Geräten, welche die Foobar-17.11-MIB unterstützen". Schreiben Sie, welche Produktlinien oder dergleichen unterstützt werden.
Welcher Aspekt davon wird überwacht? Was macht der Check?
Unter welchen Bedingungen wird der Check OK, WARN oder CRIT?
Wird für den Check ein Agentenplugin benötigt? Falls ja: wie wird dieses installiert? Das muss auch ohne Agentenbäckerei gehen.
Gibt es weitere Voraussetzungen, damit der Check funktioniert (Vorbereitung des Zielsystems, Installation von Treibern, etc.). Diese sollen nur dann aufgeführt werden, wenn Sie nicht sowieso normalerweise erfüllt sind (z.B. das Mounten von
/proc
unter Linux).
Schreiben Sie nichts, was alle Checks insgesamt betrifft. Wiederholen Sie z.B. nicht generelle Dinge, wie man SNMP-basierte Checks einrichtet.
8.5. Item
Bei Checks, die ein Item haben (also auch ein %s
im Service-Namen), muss in der Man page unter item:
beschrieben sein, wie dieses gebildet wird.
Wenn das Check-Plugin kein Item benutzt, können Sie diese Zeile komplett auslassen.
8.6. Service-Erkennung
Schreiben Sie unter inventory:
unter welchen Bedingungen der Service bzw. die Services dieses Checks automatisch gefunden werden, also wie sich die Service-Erkennung (service discovery) verhält.
Ein Beispiel aus nfsmounts
:
inventory:
All NFS mounts are found automatically. This is done
by scanning {/proc/mounts}. The file {/etc/fstab} is irrelevant.
Achten Sie darauf, dass der Text ohne tiefere Kenntnisse einer MIB oder des Codes verständlich ist. Schreiben Sie also nicht:
One service is created for each temperature sensor, if the state is 1.
Stattdessen ist es besser, möglichst alles zu übersetzen:
One service is created for each temperature sensor, if the state is "active".