Monitoraggio di OpenShift

This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved.

1. Premessa

Esiste già un articolo separato sul monitoraggio di Kubernetes che descrive l'impostazione di un monitoraggio di Kubernetes e dei suoi vari sapori. Tuttavia, poiché OpenShift in generale e in particolare la sua configurazione funzionano in modo un po' diverso, abbiamo deciso di creare un articolo separato per descrivere l'impostazione di un monitoraggio di OpenShift e rispettivamente dei cluster Kubernetes in esecuzione in esso. Nel resto di questo articolo, ci riferiremo a questi stessi cluster - per semplicità e leggibilità - come cluster OpenShift. Il monitoraggio dei cluster OpenShift è possibile solo con una delle edizioni commerciali di Checkmk.

2. Introduzione

Checkmk ti aiuta a monitorare i tuoi cluster OpenShift. A partire dalla versione 2.3.0, puoi utilizzare una qualsiasi delle nostre edizioni commerciali per monitorare i seguenti oggetti:

Cluster
Deployment
Nodi
Pod
DaemonSet
StatefulSet
Cronjob

Per un elenco completo di tutti i plug-in di controllo disponibili per il monitoraggio di Kubernetes, consulta il nostro Catalogo dei plug-in di controllo.

2.1. Impostazione dell'ambiente di monitoraggio

Poiché i cluster OpenShift possono subire cambiamenti importanti anche molto rapidamente in termini di numero e posizione dei singoli componenti, ti consigliamo di creare un'istanza Checkmk separata per il monitoraggio di un ambiente OpenShift, che potrà poi essere connessa al sito centrale come di consueto tramite la procedura di monitoraggio distribuito.

2.2. Il processo di monitoraggio di OpenShift in Checkmk

Checkmk monitora i tuoi cluster OpenShift in due modi:

Checkmk recupera le informazioni di base direttamente dal tuo cluster tramite l'API di Kubernetes, che può già essere utilizzata per recuperare gli stati dei nodi e dei container. Anche la maggior parte dei metadati dei pod e dei deployment viene ottenuta in questo modo. Per un monitoraggio completo, tuttavia, manca ancora qualcosa: le domande su quanto carico, ad esempio, un particolare deployment sta generando sulla CPU o quanta memoria sta occupando un DaemonSet non possono trovare risposta con questo metodo.
Poiché Prometheus è già installato di default nei cluster OpenShift, Checkmk può interrogare esattamente questa istanza di Prometheus all'interno del tuo ambiente OpenShift e preparare i dati risultanti nel modo consueto di Checkmk. Per un monitoraggio completo del tuo ambiente OpenShift, ti consigliamo vivamente di impostare questa connessione. Inoltre, l'utilizzo delle dashboard di Kubernetes è utile solo se sono disponibili i dati appropriati sul workload.

3. Creare i prerequisiti nel cluster

Per poter monitorare l'ambiente OpenShift in Checkmk, devi prima creare i prerequisiti nel tuo cluster.

3.1. Creare un namespace e un account di servizio

Per prima cosa, devi creare un namespace e un account di servizio per Checkmk nel tuo cluster OpenShift. Il modo più veloce per farlo è tramite la CLI di OpenShift (in breveoc ).

Nell'esempio che segue, chiameremo questo namespace checkmk-monitoring. Se vuoi o devi scegliere un nome diverso, dovrai apportare questa modifica al momento della creazione dell'account del servizio.

user@host:~$ oc create namespace checkmk-monitoring
namespace/checkmk-monitoring created

L'account di servizio con il ruolo associato e il cosiddetto RoleBinding possono essere creati specificando il nostro file YAML già pronto pubblicato su GitHub. Controlla il suo contenuto e poi esegui il comando seguente:

user@host:~$ oc apply -f https://raw.githubusercontent.com/Checkmk/checkmk_kube_agent/checkmk_docs/deploy/kubernetes/checkmk-serviceaccount.yaml
serviceaccount/checkmk created
clusterrole.rbac.authorization.k8s.io/checkmk-metrics-reader created
clusterrolebinding.rbac.authorization.k8s.io/checkmk-metrics-reader-binding created

In alternativa, puoi prima scaricare questo file YAML, personalizzarlo secondo le tue esigenze e poi applicare oc apply -f a questa copia locale del file.

3.2. Ottenere endpoint, token e certificato API

Con lo strumento da linea di comando oc puoi leggere tutte le informazioni del tuo cluster che di solito devi specificare per configurare lo special agent. Se hai cambiato il nome del servizio o il namespace, devi modificare queste informazioni come descritto nei comandi seguenti.

Recuperare l'endpoint dell'API di Kubernetes

L'endpoint dell'API di Kubernetes viene visualizzato da oc con il seguente comando:

user@host:~$ oc cluster-info
Kubernetes control plane is running at https://api.myopenshift.example.com:6443

Questo indirizzo, compresa la porta specificata, sarà successivamente incluso nel campo API server connection > Endpoint della regola di Kubernetes.

Recuperare l'endpoint dell'API di Prometheus

Ottenere l'indirizzo dell'endpoint API dell'istanza di Prometheus nel tuo cluster può essere più facile tramite la GUI di OpenShift. Nel ruolo di amministratore, puoi trovare un elenco più o meno lungo tramite Networking > Routes. Qui dovresti trovare anche un percorso che probabilmente ha la parola Prometheus nel suo nome. Anche questo dipende semplicemente dalla configurazione del tuo cluster OpenShift. Alla voce Location troverai proprio l'URL che ti servirà in seguito per il campo Prometheus API endpoint.

Potresti anche ottenere l'FQDN dalla riga di comando con il seguente comando.

user@host:~$ oc get routes --all-namespaces | grep prometheus
openshift-monitoring    prometheus-k8s   prometheus-k8s-openshift-monitoring.apps.myopenshift.example.com   prometheus-k8s  web  reencrypt/Redirect   None

In seguito dovrai solo aggiungere il prefisso del protocollo alla stringa prometheus-k8s-openshift-monitoring.apps.myopenshift.example.com nel campo Prometheus API endpoint della regola di Kubernetes.

Recuperare il token

Il comando seguente può essere utilizzato per leggere il token, che di solito è quello che dovrai specificare in seguito per l'agente speciale in Checkmk:

user@host:~$ oc get secret $(oc describe sa checkmk -n checkmk-monitoring | grep 'Tokens' | awk '{ print $2 }') -n checkmk-monitoring -o=jsonpath='{.data.token}' | base64 --decode
eyJhbGciOiJSUzI1NiIsImtpZCI6IkxFbDdZb25t...

Lascia aperta la shell con queste informazioni o copia il token in una posizione a cui potrai accedere durante la successiva configurazione in Checkmk.

Recuperare il certificato

Il comando seguente può essere utilizzato per recuperare il certificato che dovrai specificare in seguito in Checkmk alla voce Global settings.

user@host:~$ oc get secret $(oc describe sa checkmk -n checkmk-monitoring | grep 'Tokens' | awk '{ print $2 }') -n checkmk-monitoring -o=jsonpath='{.data.ca\.crt}' | base64 --decode

Lascia aperta la shell con queste informazioni oppure copia il certificato - comprese le righe BEGIN CERTIFICATE e END CERTIFICATE - in una posizione a cui potrai accedere durante la successiva configurazione di Checkmk.

Se l'output è vuoto, vale lo stesso consiglio della sezione precedente Recuperare il token.

4. Impostazione del monitoraggio in Checkmk

Successivamente, nella GUI di Checkmk, passiamo all'impostazione dell'agente speciale e di una regola per la creazione automatica di host per i tuoi oggetti Kubernetes. Tuttavia, per impostare l'agente speciale, è necessario soddisfare alcuni prerequisiti:

4.1. Memorizzazione della password (token) in Checkmk

È meglio memorizzare la password (token) dell'account del servizio nell'archivio password di Checkmk. Questa è l'opzione più sicura, perché puoi separare l'archiviazione e l'uso della password in modo organizzato. In alternativa, inserisci la password direttamente in testo normale quando crei la regola (vedi sotto).

Per aggiungere la password all'archivio password di Checkmk, vai su Setup > General > Passwords > Add password. Nel nostro esempio utilizziamo My OpenShift Token come ID e titolo:

4.2. Importare il certificato CA di un account di servizio in Checkmk

Affinché Checkmk possa fidarsi della catena di certificati dell'account di servizio, dovrai memorizzarla in Checkmk. Copia tutto qui - comprese le righe contenenti BEGIN CERTIFICATE e END CERTIFICATE- e aggiungi il certificato nel menu di configurazione alla voce Setup > General > Global settings > Site management > Trusted certificate authorities for SSL:

4.3. Creazione dell'host piggyback

Crea un nuovo host in Checkmk nel modo consueto e chiamalo, ad esempio, myopenshiftclusterhost. Come suggeriscono il titolo e il nome dell'host, questo host viene utilizzato per raccogliere i dati piggyback e anche per mappare tutti i servizi e le metriche a livello di cluster. Poiché questo host riceve i dati esclusivamente attraverso l'agente speciale, nelle proprietà dell'host assicurati di impostare l'opzione IP address family su No IP. Conferma l'intera configurazione premendo il pulsante Save & view folder.

Example setup for a cluster host with the important 'No IP' setting.

4.4. Configurazione dinamica dell'host

Per garantire la separazione tra gli oggetti in diversi cluster di Kubernetes, di solito è conveniente creare una cartella per ogni cluster tramite Setup > Hosts > Add folder, in cui la configurazione dinamica degli host può creare automaticamente tutti gli host del cluster. Tuttavia, la creazione e l'utilizzo di tale cartella è facoltativa.

Quindi, imposta un connettore per i dati piggyback in arrivo. Per farlo, vai su Setup > Hosts > Dynamic host management > Add connection.. Inserisci prima un titolo e poi sotto Connection Properties clicca su show more.

Il passo successivo, molto importante, è quello di inserire l'host piggyback creato in precedenza alla voce Restrict source hosts.

Quindi, alla voce Piggyback creation options clicca su Add new element e alla voce Create hosts in seleziona la cartella creata in precedenza.

Puoi lasciare invariati gli attributi predefiniti in Host attributes to set. Questi garantiscono che Checkmk accetti i dati piggyback solo dagli host creati automaticamente e non tenti di pingarli o di accedervi tramite SNMP, ad esempio.

In un ambiente OpenShift in cui gli oggetti monitorati e monitorabili vanno e vengono continuamente, di solito si consiglia di abilitare anche l'opzione Automatically delete hosts without piggyback data. Cosa fa esattamente questa opzione e in quali circostanze gli host vengono effettivamente eliminati è spiegato nel capitolo dedicato alla cancellazione automatica degli host nell'articolo sulla configurazione dinamica degli host.

Infine, attiva l'opzione Discover services during creation.

La sezione Connection Properties di questo nuovo connettore potrebbe avere il seguente aspetto:

Example settings for a dynamic host configuration.

4.5. Personalizzazione della scoperta periodica del servizio

Per impostazione predefinita, Checkmk esegue una scoperta del servizio ogni due ore e visualizza i risultati di questa ricerca nel servizio Check_MK Discovery. Puoi trovare questa impostazione nel set di regole Periodic service discovery. Nel contesto di OpenShift, ti consigliamo di creare una regola con l'etichetta cmk/kubernetes:yes per tutti gli host. Questo perché ogni host che rappresenta oggetti Kubernetes riceve automaticamente questa etichetta da Checkmk. In questo caso dovresti scegliere un intervallo più breve di due ore per la scoperta del servizio e attivare anche l'opzione Automatically update service configuration. Le impostazioni riportate nello screenshot qui sotto sono solo degli esempi. Dovrai decidere caso per caso cosa ha senso per i tuoi cluster.

An example setup for the periodic service discovery for Kubernetes objects.

Per limitare questa regola a tutti gli host del tuo cluster, alla voce Host labels inserisci semplicemente cmk/kubernetes:yes nel modulo Conditions. Tuttavia, se vuoi creare regole diverse per cluster diversi, utilizza l'etichetta specifica del cluster. Queste etichette sono sempre nella forma cmk/kubernetes/cluster:mycluster.

Example a restriction to hosts using a cluster-specific label.

4.6. Impostazione dell'agente speciale

Ora che tutti i prerequisiti sono stati creati nel cluster e in Checkmk, puoi rivolgere la tua attenzione alla configurazione dell'agente special agent, che si trova all'indirizzo Setup > Agents > VM, cloud, container > Kubernetes. Crea una nuova regola con Add rule.

Prima di tutto, devi assegnare un nome al cluster da monitorare. Questo nome può essere specificato liberamente e serve per assegnare un nome univoco a tutti gli oggetti che provengono da questo specifico cluster. Ad esempio, se inserisci mycluster, i nomi degli host di tutti i pod di questo cluster inizieranno con pod_mycluster. La parte successiva del nome dell'host sarà sempre il namespace in cui esiste questo oggetto Kubernetes. Ad esempio, il nome dell'host di un pod potrebbe essere pod_mycluster_kube-system_svclb-traefik-8bgw7.

Alla voce Token, seleziona ora la voce creata in precedenza dall'archivio password di Checkmk.

Sample cluster name and token selection.

Alla voce API server connection > Endpoint, Checkmk ti chiede ora di inserire l'URL attraverso il quale il tuo server Checkmk API può essere contattato. La porta è necessaria solo se il servizio non è fornito tramite un host virtuale. In questo caso, inserisci l'indirizzo che hai determinato nella sezione Recuperare l'endpoint dell'API di Kubernetes.

Se finora hai seguito le istruzioni passo per passo e,come descritto in precedenza, hai depositato il certificato CA del tuo cluster in Checkmk, alla voce SSL certificate verification seleziona Verify the certificate.

Example for specifying the API server connection.

Abilita l'opzione Enrich with usage data, seleziona Use data from OpenShift nel menu seguente e inserisci Prometheus API endpoint che hai determinato nella sezione Recuperare l'endpoint API di Prometheus.

Example of specifying the cluster collector connection.

L'elenco alla voce Collect information about… ti permette di selezionare quali oggetti del tuo cluster devono essere monitorati. Questo elenco copre gli oggetti più importanti. Se decidi di monitorare anche Pods of CronJobs, consulta l'aiuto inline per questa opzione.

Example list of a selection of Kubernetes objects that are to be monitored.

Le due selezioni successive ti permettono di restringere ulteriormente gli oggetti da monitorare. Se sei interessato solo agli oggetti di determinati namespace, imposta questa opzione in Monitor namespaces. Qui puoi inserire i singoli namespace da monitorare o escludere esplicitamente i singoli namespace dal monitoraggio.

L'opzione Cluster resource aggregation ti permette di progettare i nodi che non forniscono risorse per il workload del cluster. Questi nodi devono essere esclusi dal calcolo delle risorse disponibili, altrimenti si rischia di non rilevare i colli di bottiglia della capacità. Per questo motivo, per impostazione predefinita, escludiamo i nodi control-plane e infra dal calcolo.

Example configuration for namespaces and resource aggregation.

Come ultima opzione, puoi importare le cosiddette annotazioni da Kubernetes. In Checkmk, queste annotazioni diventano etichette dell'host e possono quindi essere utilizzate come condizioni nelle regole. Utilizza le espressioni regolari per specificare quali annotazioni devono essere importate. A questo punto consulta nuovamente l'aiuto inline dettagliato.

Nota: l'opzione Import all valid annotations viene fornita qui solo per completezza. Non consigliamo di importare tutte le annotazioni in una volta sola, perché ciò potrebbe creare una montagna di etichette inutili in Checkmk.

Importante: in Conditions > Explicit hosts devi inserire l'host creato in precedenza:

Rules for special agents must always be explicitly set to specific hosts, as seen here.

Quindi salva la regola ed esegui una scoperta del servizio per questo host: i primi servizi a livello di cluster appariranno subito:

Example view of the first service discovery after completing the configuration.

A questo punto attiva le modifiche apportate e lascia che sia la configurazione dinamica degli host a fare il lavoro d'ora in poi: in questo modo verranno generati tutti gli host per i tuoi oggetti Kubernetes in un breve periodo di tempo.

5. Etichette per gli oggetti di Kubernetes

Checkmk genera automaticamente etichette per oggetti come cluster, deployment o namespace durante la scoperta del servizio. Tutte le etichette per questi oggetti che Checkmk genera automaticamente iniziano con cmk/kubernetes/. Ad esempio, un pod riceverà sempre un'etichetta del nodo (cmk/kubernetes/node:mynode), un'etichetta che identifica l'oggetto come pod (cmk/kubernetes/object:pod) e un'etichetta per il namespace (cmk/kubernetes/namespace:mynamespace). Questo rende molto facile creare filtri e regole per tutti gli oggetti dello stesso tipo o dello stesso namespace.

6. Dashboard e visualizzazioni

6.1. Le dashboard di Kubernetes

Le edizioni commerciali di Checkmk vengono fornite con sei dashboard integrate per Kubernetes. Per poter utilizzare queste dashboard, è necessario che il nostro Cluster Collector sia installato e configurato. In particolare, queste dashboard sono chiamate:

Kubernetes (panoramica)
Kubernetes Cluster
Kubernetes DaemonSet
Kubernetes Deployments
Kubernetes namespace
Kubernetes StatefulSet

Il punto di ingresso è sempre la dashboard Kubernetes, a cui puoi accedere tramite Monitor > Applications > Kubernetes:

Nella dashboard Kubernetes, tutti i cluster monitorati sono elencati sul lato sinistro. Questo elenco di cluster è anche la voce dell'elenco per approfondire le dashboard. Facendo clic sul nome di un cluster si accede alla dashboard Kubernetes Cluster per il cluster selezionato. Nella dashboard Kubernetes Cluster, facendo clic sul rispettivo nome si accede alle altre dashboard dipendenti dal contesto:

Detail of the cluster dashboard with paths to the other dashboards.

6.2. L'inventario hardware/software

Il monitoraggio di OpenShift con Checkmk supporta anche l'inventario HW/SW. Ad esempio, nel dashboard del cluster di cui sopra, cliccando sul nome dell'ID del cluster (qui: mycluster) si accede all'inventario del cluster.

Allo stesso modo, cioè negli altri dashboard, attraverso i box con i nomi ID degli oggetti, è possibile visualizzare l'inventario per ogni rispettivo oggetto. L'esempio seguente mostra l'inventario HW/SW di un pod:

7. Verifica dell'installazione

Nella GUI di Checkmk puoi verificare che l'installazione e la configurazione siano andate a buon fine.

I servizi più importanti sono sicuramente Kubernetes API e Cluster collector. Questi devono essere presenti sull'host del cluster che hai creato e devono anche visualizzare informazioni specifiche e reali.

The most important services to check for a correct installation.

In Summary il servizio Kubernetes API dovrebbe normalmente riportare Live, Ready e, se è stato configurato il Cluster Collector, dovrebbe mostrare Successfully queried usage data from Prometheus.

Nella dashboard Kubernetes puoi determinare subito se il Cluster Collector è in esecuzione e sta raccogliendo dati in un cluster. Se è stata configurata correttamente, la dashboard Kubernetes dovrebbe avere un aspetto simile a questo:

Kubernetes dashboard with data for CPU and memory resources.

Se ora clicchi sul nome del cluster, ti ritroverai nella dashboard Kubernetes Cluster per il rispettivo cluster. Qui i tre box Primary datasource, Cluster collector e API health dovrebbero essere verdi e mostrare OK.

A correctly-functioning cluster monitoring.

8. Rimuovere i componenti di monitoraggio da OpenShift

8.1. Eliminazione dell'account di servizio

Se hai utilizzato il nostro file YAML predefinito per creare l'account del servizio, puoi anche eliminarlo come segue:

user@host:~$ oc delete -f https://raw.githubusercontent.com/Checkmk/checkmk_kube_agent/checkmk_docs/deploy/kubernetes/checkmk-serviceaccount.yaml
serviceaccount "checkmk" deleted
clusterrole.rbac.authorization.k8s.io "checkmk-metrics-reader" deleted
clusterrolebinding.rbac.authorization.k8s.io "checkmk-metrics-reader-binding" deleted

8.2. Rimozione del namespace, se necessario

user@host:~$ oc delete namespace checkmk-monitoring
namespace "checkmk-monitoring" deleted

In questa pagina

1. Prefazione
2. Introduzione
- 2.1. Impostazione dell'ambiente di monitoraggio
- 2.2. Il processo di monitoraggio di OpenShift in Checkmk
3. Creare i prerequisiti nel cluster
- 3.1. Creazione di un namespace e di un account di servizio
- 3.2. Ottenere endpoint, token e certificato API
4. Impostazione del monitoraggio in Checkmk
5. Etichette per gli oggetti di Kubernetes
6. Dashboard e visualizzazioni
- 6.1. Le dashboard di Kubernetes
- 6.2. L'inventario hardware/software
7. Verifica dell'installazione
8. Rimuovere i componenti di monitoraggio da OpenShift
- 8.1. Eliminare l'account del servizio
- 8.2. Rimozione del namespace, quando necessario