AIOps y aprendizaje automático: supervisado vs no supervisado

El aprendizaje automático o Machine Learning (ML) hace referencia al proceso de entrenamiento que tiene una máquina para que pueda ejecutar una tarea. En este artículo presentaremos la diferencia que existe entre el aprendizaje automático supervisado y el no supervisado dentro de las operaciones de TI, a  fin de ayudarte a una mejor evaluación sobre la estrategia y proveedores de AIOps.

Tal vez te interese descargar la infografía: Machine Learning - Qué es y cómo funciona

Durante el proceso de la programación de software se le dice a una máquina cada tipo de acción específica a tomar y en qué orden se debe realizar. Por otra parte, una aplicación de software es solamente un conjunto de instrucciones que están diseñadas para una máquina sobre qué hacer y cómo reaccionar a lo que sucede, esto se puede traducir en la: entrada del usuario, retroalimentación, datos, etc.

Los bugs son situaciones en las que los programadores no colocaron una instrucción, o no fue realizado de una forma correcta, por lo tanto, no se tuvo en cuenta la salida o respuesta del usuario, por ello que en este tipo de situaciones el tener una buena programación resulta algo difícil, dado que hay que anticipar todas las posibilidades y eventualidades que se pueden generar.

Dentro del aprendizaje automático, lo que preocupa es el “qué” debe lograr el programa (mas importante incluso que el “cómo”). Esto se debe a que no se brinda un conjunto especifico de instrucciones a la maquina para que las ejecute en un orden determinado, es decir, no se le dice qué datos o entradas puede esperar, y cómo atenderlas o responderlas, lo que se hace es permitir que la maquina lo descubra por su cuenta.

Claramente no se puede comenzar este procedimiento de la nada, dado que el aprendizaje automático requiere que el usuario tome decisiones de diseño sobre qué análisis y algoritmos debe usar la máquina para aprender. Por otra parte, mientras más compleja y abstracta sea la tarea por realizar, será más complicado que el proceso del aprendizaje automático, por lo tanto, este se debe implementar para la resolución de problemáticas que sean muy específicas, dado que en estos casos es cuando mejores resultados podrá generar.

Aprendizaje automático supervisado vs no supervisado

Otro aspecto a tomar en cuenta es que existen diversas formas de entrenar a la máquina, tomando en cuenta la función sobre la tarea deseada, es por ello que estos diferentes enfoques se pueden capturar en términos de aprendizaje automático supervisado y no supervisado.

Aprendizaje automático supervisado

Este tipo de aprendizaje automático es utilizado sí una máquina necesita aprender una tarea haciendo uso de los diversos datos de ejemplo o de muestra ("entrada") y un resultado esperado ("salida"), de esta forma el aprendizaje se supervisa y tiene la capacidad de proporcionar a la maquina un punto de partida que se encuentra en la entrada, así como un punto final, la salida. El trabajo que tiene la maquina es inferir y averiguar la manera en la que puede llegar de la entrada a la salida, por lo tanto, a la maquina se le debe mencionar el “qué”, pero debe averiguar el “cómo” hacerlo.

En el aprendizaje automático supervisado es importante tener en cuenta que:

  • El supervisor debe tomar decisiones sobre qué datos de muestra entrenarán mejor la máquina, de esta forma se podrán obtener los mejores resultados en cuanto al desempeño e interacción con los usuarios.
  • El supervisor debe determinar qué algoritmo de aprendizaje se debe utilizar, a fin de favorecer la mejor manera en la que se podrá llegar a la solución.
  • El supervisor debe verificar la exactitud de la salida de la máquina, esto se hace con la finalidad de corroborar que el proceso se esté llevando como se espera, así es como se podrá tener la seguridad de que los resultados son los esperados.

Tal vez te interese descargar la infografía: Qué es AIOps

Una vez que la máquina puede proporcionar con precisión la salida esperada de los datos de la muestra, puede considerarse que ha sido entrenada, posteriormente lo que se puede realizar es aplicar a los datos de entrada que no se hayan analizado previamente. Esta forma de realizar el aprendizaje automático es utilizada de mejor forma en los datos que no se encuentran etiquetados, en el mundo de TI = "estructurado"; para resolver problemas de clasificación como “spam / no spam” o “amenaza / no amenaza” y problemas de regresión.

Aprendizaje automático no supervisado

Se le conoce como aprendizaje automático no supervisado cuando se tienen los datos de entrada por no se obtienen los resultados esperados, esto quiere decir que sin este resultado no se puede entrenar a la máquina, debido a que los datos de entrada no se pueden utilizar como muestra, en su lugar, la maquina tendrá la tarea de aprender sobre los datos, en este proceso no hay respuestas correctas, ni supervisor.

Por otra parte, el aprendizaje automático no supervisado, se utiliza principalmente para observar la estructura de los datos o la distribución de los diversos elementos en el conjunto de datos, igualmente se utiliza en la agrupación de clústeres para que se pueda identificar agrupamientos inherentes como frases comunes en los registros/eventos, o asociaciones como la frecuencia en que ocurre una determinada falla.

Consideraciones del aprendizaje automático

Ante la duda sobre qué tipo de aprendizaje automático debe utilizar, la respuesta es que depende sobre los datos que están disponibles, así como del problema que se desea resolver, la realidad es que ambos enfoques le ayudarán para casos particulares, habrá situaciones en que uno le brindará la solución mientras que el otro se la dará en otras situaciones, algunas consideraciones que debes tomar en cuenta en el aprendizaje automático en AIOps son:

  • En caso de elegir cualquiera de las variables, TI tiene problemas que se pueden ajustar a ambos perfiles, por lo tanto, no existe un enfoque correcto, dado que los diversos problemas en TI requieren diferentes enfoques y se pueden hacer uso de múltiples de ellos para resolver una problemática en específico.
  • La toma de decisión sobre el diseño de qué algoritmos se van a utilizar en el aprendizaje automático, debe ser llevada a cabo por alguien, en el caso de la supervisión del aprendizaje automático también se deben contemplar qué datos se utilizarán para entrenar al sistema, así como el por qué lo harán.
  • Hay que tener en cuenta que una gran cantidad de datos de TI dentro de la empresa se estructuran de forma similar, independientemente del tipo de industria o de la aplicación, en este sentido encontramos que la utilización de la CPU como entrada de datos, se encuentra altamente estructurada y sigue patrones generales independientemente de la carga de trabajo que se encuentre ejecutando el servidor que se está supervisando. Esto quiere decir que en muchas situaciones en que se puede utilizar, los proveedores pueden llevar a cabo desarrollos de análisis de aprendizaje automático, que serán implementados en diversos entornos de TI.

Conclusiones sobre el aprendizaje automático en AIOps

Cada una de las plataformas de AIOps hacen uso del aprendizaje automático para resolver problemáticas en especifico dentro del dominio de TI y haciendo uso de los conjuntos de datos específicos, ya sea que estén agrupando eventos, haciendo coincidir patrones en registros, modelando y pronosticando métricas u alguna otra situación.

Existe un gran trabajo detrás al ver qué tipo de algoritmos son los más ideales para hacer uso de los datos y de esta forma conocer el tipo de enfoque automático que pueden utilizarse con ellos para obtener el punto deseado, eso sin mencionar las horas que se requieren para entrenar al sistema. Ante esto la propuesta que ofrece AIOps para los operadores de TI que se encuentran adquiriendo esta experiencia e investigación, es además brindar las funciones de monitoreo de la solución.

Es innegable que el beneficio final para el cliente es eliminar toda la necesidad de que el usuario tenga un conjunto compuesto por: habilidades analíticas adecuadas, construir y configurar tecnología de análisis y aprendizaje automático, ejecutar análisis, modelado y capacitación del sistema y luego implementarlo en sus datos de dominio. Idealmente, el usuario podrá centrarse en las tareas operativas aprovechando su conocimiento de TI y del dominio del ecosistema específico, confiando en el sistema para proporcionar los resultados deseados para la decisión o la automatización.

Las organizaciones que implementan plataformas AIOps deben hacer la diligencia debida para comprender lo mejor posible los conjuntos de datos que necesitan analizar, y los resultados que desean lograr. Luego, pueden usar esos casos de uso específicos para examinar a los posibles proveedores a través de una prueba de valor. En este sentido Fixstream brinda una excelente opción para que se pueda llevar a cabo tanto la correlación, visualización y predicción de problemas.

FixStream - Demo