Checkmk
to checkmk.com

1. Monitorización de la carga de la CPU en todos los núcleos

Checkmk configura automáticamente un servicio tanto en Linux como en Windows que realiza la monitorización de la carga de la CPU durante el último minuto. Por un lado, esto tiene sentido, pero por otro lado no detecta algunos errores, por ejemplo, que un único proceso se vuelva loco y utilice continuamente una CPU al 100 %. Sin embargo, en un sistema con 16 CPU, una CPU solo contribuye con un 6,25 % al rendimiento total, por lo que, incluso en el caso extremo descrito, solo se registra una utilización total del 6,25 %, lo que no activa ninguna notificación.

Por este motivo, Checkmk ofrece la opción (tanto para Linux como para Windows) de realizar la monitorización de todas las CPU disponibles de forma individual y determinar si alguno de sus núcleos está constantemente ocupado durante un periodo de tiempo prolongado. Configurar esta comprobación ha resultado ser una buena idea.

Para configurar esta check en tus servidores Windows, necesitas para el servicio «CPU utilization» el conjunto de reglas «CPU utilization for simple devices», que puedes encontrar en «Service monitoring rules». Este conjunto de reglas se encarga de la monitorización de todas las CPU, pero también tiene esta opción: «Levels over an extended time period on a single core CPU utilization».

Crea una nueva regla y activa solo esta opción en ella:

Dialog for defining the monitoring of CPU utilization of individual cores for Windows servers.

Define la condición para que solo se aplique a los servidores Windows, por ejemplo, utilizando una carpeta o un tag del host adecuado. Esta regla no afectará a otras reglas del mismo conjunto de reglas si estas tienen otras opciones configuradas, como los umbrales de la carga de la CPU.

En el caso de los servidores Linux, esto es responsabilidad del conjunto de reglas «CPU utilization on Linux/Unix», en el que puedes configurar la misma opción.

Important

This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved.

2. Monitorización de servicios de Windows

Por defecto, Checkmk no realiza la monitorización de ningún servicio en tus servidores Windows. ¿Por qué no? Simplemente porque Checkmk no sabe qué servicios son importantes para ti.

Si no quieres tomarte la molestia de determinar manualmente para cada servidor qué servicios son importantes, también puedes configurar una comprobación que simplemente verifique si todos los servicios con el tipo de inicio «automático» se están ejecutando de verdad. Además, puedes recibir una notificación si hay servicios ejecutándose que se han iniciado manualmente —fuera de orden, por así decirlo. Estos ya no se ejecutarán tras reiniciar el sistema, lo que podría suponer un problema.

Para implementar esto, primero necesitas el conjunto de reglas «Windows Services», que puedes encontrar en Service monitoring rules, utilizando, por ejemplo, la función de búsqueda Setup > General > Rule search. La opción crucial en la nueva regla es «Services states». Actívala y añade tres nuevos elementos para los estados de los servicios:

Dialog for defining the Windows server services to be monitored depending on their status.

Esto te permite implementar la siguiente monitorización:

  • Un servicio con el tipo de inicio «auto» y que se esté ejecutando se considera «OK».

  • Un servicio con el tipo de inicio «auto» que no se está ejecutando se considera «CRIT».

  • Un servicio con el tipo de inicio «demand» y que está en ejecución se considera «WARN».

Sin embargo, esta regla solo se aplica a los servicios que realmente se están realizando tareas de monitorización. Por lo tanto, necesitamos un segundo paso y una segunda regla, esta vez del conjunto de reglas «Windows service discovery», con la que defines qué servicios de Windows debe supervisar Checkmk como servicios.

Al crear esta regla, primero puedes introducir la expresión regular .* en la opción Services (Regular Expressions), que luego se aplicará a todos los servicios.

Después de guardar la regla, switch a la configuración de servicios de un host adecuado. Allí encontrarás un gran número de servicios nuevos: uno por cada servicio de Windows.

Para limitar el número de servicios objeto de monitorización a aquellos que te interesan, vuelve a la regla y refina los términos de búsqueda según sea necesario. Esto distingue entre mayúsculas y minúsculas. Aquí tienes un ejemplo de una selección de servicios personalizada:

Dialog for defining the names of the Windows services to be monitored.

Si anteriormente habías incluido servicios que no tienen coincidencia con las nuevas expresiones de búsqueda ahora en la monitorización, aparecerán como desaparecidos en la configuración del servicio. Con el botón «Rescan» puedes hacer borrón y cuenta nueva y hacer que se vuelva a crear toda la lista de servicios.

3. Monitorización de las conexiones a internet

El acceso a Internet de tu organización es, sin duda, muy importante para todos. La monitorización de la conexión a «Internet» es un poco difícil de llevar a cabo, ya que implica miles de millones de ordenadores a los que (con suerte) se podría acceder... o no. No obstante, aún puedes configurar un sistema de monitorización eficaz, basándote en el siguiente plan de trabajo:

  1. Selecciona varios ordenadores en internet a los que normalmente se debería poder acceder mediante el comando ping y anota sus direcciones IP.

  2. Crea un nuevo host en Checkmk, por ejemplo con el nombre internet, y configúralo de la siguiente manera: En «IPv4 address», introduce una de las direcciones IP anotadas. En «Additional IPv4 addresses», introduce las direcciones IP restantes. En «Monitoring agents», activa «Checkmk agent / API integrations» y selecciona allí «No API integrations, no Checkmk agent». Guarda el host sin descubrimiento de servicios.

  3. Crea una nueva regla del conjunto de reglas «Check hosts with PING (ICMP Echo Request)» que solo se aplique al nuevo host internet (por ejemplo, mediante la condición «Explicit hosts» o un tag del host coincidente). Configura la regla de la siguiente manera: Activa «Service description» e introduce «Internet connection». Activa «Alternate address to ping» y selecciona allí «Ping all IPv4 addresses». Activa «Number of positive responses required for OK state» e introduce «1».

  4. Crea otra regla que también se aplique solo al host internet, esta vez desde el conjunto de reglas Host check command. Allí, selecciona como Host check command la opción Use the status of the service…​ e introduce Internet connection como nombre, el mismo nombre que elegiste como nombre del servicio en el paso anterior.

Si ahora activas los cambios, obtendrás el nuevo host internet con el único servicio Internet connection en la monitorización.

Si al menos uno de los destinos de ping es accesible, el host tendrá el estado UP y el servicio tendrá el estado OK. Al mismo tiempo, el servicio te proporciona datos de rendimiento sobre el tiempo de ida y vuelta de los paquetes (round trip average) y la pérdida de paquetes para cada una de las direcciones IP especificadas. Esto te dará una indicación de la calidad de tu conexión a lo largo del tiempo:

List entry of a service for monitoring the internet connection to several IP addresses.
Tip

El comportamiento predeterminado de Checkmk es que un host cambie su estado a «DOWN» si no se puede llegar a la primera dirección IP mediante ping. El cuarto y último paso del procedimiento mostrado arriba anula este comportamiento predeterminado a través del mapeo del estado de su único servicio con el estado del host. Dado que Checkmk básicamente no envía notificaciones sobre los servicios cuando un host está en estado «DOWN», es importante que controles las notificaciones a través del host, y no a través del servicio. Además, en este caso concreto, deberías utilizar un método de notificación que no requiera conexión a internet.

4. Monitorización de servicios HTTP/HTTPS

Imaginemos que quieres comprobar la accesibilidad de un sitio web o un servicio web. El agente Checkmk no ofrece una solución en este caso, ya que no muestra esta información. Además, es posible que ni siquiera tengas la posibilidad de instalar un agente en el servidor.

La solución es lo que se conoce como check activo. Se trata de un check que no realiza un agente, sino que se lleva a cabo mediante un contacto directo con un protocolo de red en el host de destino —en este caso, HTTP(S).

El procedimiento es el siguiente:

  1. Crea un nuevo host para el servidor web, por ejemplo, para checkmk.com. En «Monitoring agents», activa la opción «Checkmk agent / API integrations» y selecciona «No API integrations, no Checkmk agent». Guarda el host sin descubrimiento de servicios.

  2. Crea una nueva regla a partir del conjunto de reglas «Check HTTP web service», que solo se aplique al nuevo host (por ejemplo, mediante la condición «Explicit hosts»).

  3. En la caja «Value» encontrarás numerosas opciones para realizar la comprobación. El principio es el siguiente: Define un nuevo endpoint para cada URL que se vaya a comprobar. Se crea un servicio para cada endpoint. A continuación, define el nombre del servicio (por ejemplo, Basic webserver health) y, si es necesario, un prefijo (HTTP o HTTPS) para el endpoint.

  4. También puedes realizar ajustes adicionales en la caja «Value» (Configuración de comprobación) situada debajo de los endpoints. Por ejemplo, puedes usar Response time para configurar el servicio en WARN o CRIT si el tiempo de respuesta es demasiado lento, y usar Certificate validity para comprobar el periodo de validez del certificado. Con Search for strings puedes comprobar si aparece un texto determinado en la respuesta, es decir, en la página entregada. Esto te permite comprobar una parte relevante del contenido para que un simple mensaje de error del servidor no se interprete como una respuesta positiva.

    Puedes definir estos ajustes de forma idéntica para todos los endpoints o individualmente para cada endpoint.

    Tip

    Encontrarás información muy útil sobre todas las opciones disponibles en la ayuda en línea.

  5. Guarda la regla y activa los cambios.

Ahora tendrás un nuevo host con los servicios que has especificado que check el acceso a través de HTTP(S):

List entry of the services for monitoring the HTTP/HTTPS services on a host.
Tip

Por supuesto, también puedes realizar esta comprobación en un host que ya esté siendo monitorizado con Checkmk a través de un agente. En este caso, no es necesario crear el host y solo tendrás que crear la regla para el host.

5. Personalizar los umbrales del sistema de archivos «por arte de magia»

Encontrar buenos umbrales para la monitorización de los sistemas de archivos puede resultar tedioso. Al fin y al cabo, un umbral del 90 % es demasiado bajo para un disco duro muy grande y quizá ya sea demasiado ajustado para uno pequeño. Ya hemos presentado la función para establecer umbrales en función del tamaño del sistema de archivos en el capítulo sobre el ajuste preciso de la monitorización, y entonces insinuamos que Checkmk ofrece otra opción aún más ingeniosa: el factor mágico.

El factor mágico se configura así:

  1. En el conjunto de reglas «Filesystems (used space and growth)», crea una sola regla.

  2. En esta regla, activa «Levels for used/free space» y deja sin cambiar el valor predeterminado de los umbrales en el 80 % o el 90 %.

  3. Además, activa «Magic factor (automatic level adaptation for large filesystems)» y confirma el valor por defecto de 0,80.

  4. Configura también «Reference size for magic factor» en 20 GB. Dado que 20 GB es el valor por defecto, se aplicará incluso sin que actives explícitamente la opción.

El resultado tendrá este aspecto:

Dialog for setting the magic factor for file system thresholds.

Si ahora guardas esta regla y activas el cambio, tendrás valores de umbral que varían automáticamente en función del tamaño del sistema de archivos:

  1. A los sistemas de archivos que tengan exactamente 20 GB de tamaño se les asignan los umbrales del 80 % y el 90 %.

  2. A los sistemas de archivos de menos de 20 GB se les asignan umbrales más bajos.

  3. A los sistemas de archivos de más de 20 GB se les asignan umbrales más altos.

Exactamente cuánto son los valores de umbral es, bueno... ¡magia! El factor (aquí 0,80) determina cuánto se ajustan los valores. Un factor de 1,0 no cambia nada, y todos los sistemas de archivos reciben los mismos valores. Los valores más pequeños tienen un mayor efecto en el ajuste de los valores. Los valores por defecto de Checkmk utilizados en esta sección han demostrado su eficacia en la práctica en muchísimas instalaciones.

Puedes ver exactamente qué umbrales se aplican a cada servicio en su Summary:

List with two file system services and their thresholds.

La siguiente tabla muestra algunos ejemplos del efecto del factor mágico con un valor de referencia de 20 GB / 80 %:

Factor mágico 5 GB 10 GB 20 GB 50 GB 100 GB 300 GB 800 GB

1,0

80 %

80 %

80 %

80 %

80 %

80 %

80 %

0,9

77 %

79 %

80 %

82 %

83 %

85 %

86 %

0,8

74 %

77 %

80 %

83 %

86 %

88 %

90 %

0,7

70 %

75 %

80 %

85 %

88 %

91 %

93 %

0,6

65 %

74 %

80 %

86 %

89 %

93 %

95 %

0,5

60 %

72 %

80 %

87 %

91 %

95 %

97 %

Con este capítulo sobre el factor mágico, concluimos nuestra Guía para principiantes.

Tip

Si quieres tomarte un descanso ahora, puedes cerrar sesión. En la barra de navegación de Checkmk encontrarás la entrada «Logout» en el menú «User».

Esperamos que hayas podido sentar unas bases sólidas para tu sistema Checkmk, ya sea con o sin magia. Para casi todos los temas que hemos tratado en esta Guía para principiantes, encontrarás información más detallada en otros artículos del Manual de usuario.

¡Te deseamos mucho éxito con Checkmk en el futuro!


Last modified: Tue, 24 Feb 2026 14:43:27 GMT via commit 6a85e83bb
En esta página