Checkmk
to checkmk.com
Important

This is a machine translation based on the English version of the article. It might or might not have already been subject to text preparation. If you find errors, please file a GitHub issue that states the paragraph that has to be improved.

1. Introducción

El objetivo de la monitorización con Checkmk es proporcionarle en todo momento una imagen clara del estado real de su infraestructura de TI. El registro de toda esta información en bases de datos le permite mirar hacia atrás en el pasado en cualquier momento, crear gráficos de rendimiento e identificar correlaciones que puedan haber dado lugar a problemas.

Y aunque, por ejemplo, un vistazo a los gráficos de un sistema de archivos ya permite hacerse una idea aproximada de cuándo puede faltar espacio, esta impresión rápida suele ser engañosa. Deja de lado elementos centrales de la gestión de la capacidad. Los factores estacionales, por ejemplo, dejan mucho margen para los errores de apreciación. La demanda de su infraestructura informática puede cambiar, por ejemplo, durante los periodos vacacionales, los días festivos o incluso en relación con las estaciones, y estos factores no siempre son triviales u obvios.

Otro factor importante en el cálculo de previsiones son los efectos puntuales. Por ejemplo, si se utiliza una regresión lineal para la extrapolación durante una gran operación de limpieza de un sistema de archivos, el espacio de almacenamiento consumido por el propio proceso podría dar la impresión de que el sistema de archivos estará completamente vacío en un futuro próximo. El hecho de que se trata de una conclusión errónea salta inmediatamente a la vista y demuestra de forma contundente por qué para realizar predicciones mucho más fiables se necesitan métodos mucho más robustos.

Checkmk, a partir de la versión 1.6.0, proporciona estos métodos robustos que, basados en los datos históricos recopilados, permiten una interpretación inteligente y, si se configuran correctamente, buenas predicciones. En este artículo le mostraremos cómo se pueden configurar.

2. Configuración en Checkmk

2.1. Creación de un gráfico de pronóstico

La forma más sencilla de crear un gráfico de pronóstico es ir a la vista de tabla de cualquier servicio que produzca métricas. En dicha vista de detalle, encontrará la línea con la dirección Service Metrics justo debajo de los gráficos de servicio. Detrás de los valores actuales de cada una de estas métricas encontrarás un botón para la acción especial para métricas.

forecast graphs service metrics

Abra ahora el menú de acción y seleccione New forecast graph…​.

forecast graphs service metrics action menu

Al cabo de unos instantes ya podrá ver el primer gráfico de pronóstico para la métrica que haya elegido.

forecast graphs first graph

2.2. Los parámetros del modelo

Ahora es el momento de seleccionar los parámetros específicos para calcular la previsión de esta métrica, que se encuentran justo debajo del gráfico. Como estos parámetros dependen en gran medida de su entorno particular y de la finalidad de la previsión, es muy importante examinar detenidamente las opciones y sus posibles efectos.

forecast graphs model parameters

Mínimo - Máximo - Media

El último campo de la línea Metric ya puede influir considerablemente en el sentido que tendrá la predicción. En este punto, el valor por defecto es siempre la opción Maximum, porque en el contexto de la gestión de la capacidad, esta opción es la que con más frecuencia proporciona una indicación de la predicción misma: los cuellos de botella en los picos de carga. Por ejemplo, si utilizara sólo los valores medios del servicio CPU utilization, podría ver que la utilización media sigue siendo aceptable. Sin embargo, en un futuro previsible, sólo se daría cuenta en la monitorización de que su CPU está alcanzando constantemente sus límites durante los picos de carga cuando se produzca la situación real.

Considerar historial de

Con esta opción puede determinar qué periodo de los datos históricos debe utilizarse como base para calcular la previsión. En general, puede decirse que se necesitan muchos puntos de datos para permitir un buen ajuste. Sin embargo, si desea tomar siempre como base los valores medidos del mes anterior, por ejemplo, puede hacerlo seleccionando la opciónLast month. Esto no significa de los últimos 30 días, sino del mes natural anterior.

Otra razón para limitar el periodo podría ser, por ejemplo, una actualización de componentes individuales en un servidor. La inclusión de datos anteriores a esta actualización podría distorsionar la predicción.

Previsión para el futuro

La previsión comienza el último día del periodo seleccionado en Consider history of. Esto es importante porque, dependiendo de la selección, también se calcula una predicción para un periodo en el que ya se han acumulado datos de medición reales. Dentro de este solapamiento, por tanto, ya es posible ver lo cerca que estaba la predicción de los valores reales.

Además, sólo queda decir aquí que cuanto más se intente mirar hacia el futuro, más imprecisa será naturalmente la predicción. Sin embargo, esta banalidad queda muy bien ilustrada en el gráfico de pronóstico por el sombreado naranja cada vez más intenso.

Flexibilidad de las tendencias

Cuando se observan y analizan intervalos de tiempo -en este caso, los valores registrados para sus servicios-, las denominadas rupturas estructurales o puntos de cambio desempeñan un papel muy importante. En pocas palabras, estos puntos de cambio son aquellos momentos de los intervalos de tiempo en los que pueden observarse cambios más o menos importantes. Durante el análisis de los intervalos temporales, Checkmk identifica ahora toda una serie de estos puntos de cambio y los utiliza para reutilizarlos en la previsión y hacerla así más precisa. La intensidad con la que Checkmk ajusta la curva del gráfico de pronóstico a estos puntos de cambio puede determinarse mediante las cinco opciones de Trend flexibility. Si el ajuste es demasiado fuerte -lo que se denomina overfitting-, la función de predicción se asemejaría demasiado a una simple actualización (básicamente una copia) de la serie temporal anterior. Un ajuste insuficiente, por el contrario, haría que la predicción fuera extremadamente inexacta. Checkmk proporciona un valor estándar que es bueno para muchas situaciones y podemos utilizarlo con Medium. En caso de que el gráfico de pronóstico fuera demasiado inexacto - infraajuste - habría que aumentar la flexibilidad de la curva de tendencia seleccionando High o Very High. En el caso contrario - es decir, sobreajuste - seguiríamos teniendo las dos opciones Low y None (linear), aunque no recomendamos utilizar None (linear), ya que sólo está disponible en aras de la exhaustividad.

Estacionalidad del modelo

En este punto tendrá que determinar cómo debe gestionar el gráfico de pronóstico las demandas recurrentes y estacionales de su infraestructura. En los gráficos de pronóstico se tienen en cuenta automáticamente dos marcos temporales: las necesidades recurrentes semanales, como las de una semana laboral de cinco días y los fines de semana, y las necesidades anuales o estacionales, como las relacionadas con los días festivos y las vacaciones del personal. Checkmk reconoce esta estacionalidad automáticamente, por lo que todo lo que tiene que hacer es seleccionar cómo desea que se pronostique.

La opción Additive incluye estos requisitos modificados en la predicción una sola vez. Como su nombre indica, el aumento o disminución de la demanda simplemente se añade a la tendencia.

Con la selección de Multiplicative, en cambio, la demanda estacional futura aumenta o disminuye proporcionalmente a la tendencia.

Intervalo de confianza

Llegados a este punto, deberá determinar el nivel de confianza de su predicción, es decir, la probabilidad de que los valores esperados se encuentren dentro del intervalo de confianza resultante de dicho nivel. El objetivo de esta selección es, a partir del nivel más alto posible, obtener siempre un intervalo lo más estrecho posible. Cuantos más datos históricos estén disponibles, más éxito tendrán los gráficos de pronóstico a la hora de conseguirlo. Es importante que esta selección no influya en el "ajuste" real. Sólo el área que lo rodea (es decir, la visualización del intervalo) aumenta proporcionalmente a niveles más altos.

Visualizar datos históricos desde la última

En el gráfico de pronóstico, en la parte izquierda verá -separada por una línea vertical amarilla- la visualización de un número determinado de días de datos realmente excelentes. Puede especificar cuántos días deben mostrarse aquí. Este valor no tiene ningún efecto sobre el cálculo de la previsión en sí, sino que sólo influye en la visualización.

Mostrar información en gráfico

La última opción sólo influye en la visualización del gráfico. Si marca Model parameters, los parámetros seleccionados anteriormente se mostrarán debajo del gráfico terminado, lo que facilita al observador la interpretación del gráfico.

3. Opciones de diagnóstico

3.1. Posibles errores y mensajes de error

No se puede crear el gráfico

El mensaje de error Cannot create graph - Metric historical data has less than 2 days of valid values se explica por sí mismo. Para poder realizar predicciones significativas, Checkmk necesita más de 2 días completos de datos históricos de medición. Con menos puntos de medición como base, simplemente no es posible un ajuste medianamente serio.

En esta página