Usar datos correctos en la transformación digital

Hace poco Gartner dio a conocer un anuncio con 10 tendencias tecnológicas estratégicas para este 2019, a pesar de que la lista aborda de forma muy completa los elementos que son cruciales para realizar una buena transformación digital, mostrando puntos que van desde la computación de vanguardia, hasta la Inteligencia Artificial, la realidad es que de manera operativa, la mayoría de las empresas no se encuentran preparadas para dar este tipo de salto digital, ¿Por qué sucede esto?, básicamente se trata del ritmo actual que tienen los negocios, en donde existe una gran cantidad de datos desordenados que son cruciales para darle sentido a todo, en nuestro artículo conocerás la importancia de usar los datos correctos para entrar a la transformación digital sin problema alguno.

En el pasado los entornos que conformaban TI eran más simples y accesibles para los humanos, pero con la llegada de la nube, los contenedores, la entrega multimodal y otras tecnologías nuevas que brindan entornos extraordinariamente complejos y masivos, hizo que TI se viera obligada a moverse a su misma velocidad, haciendo que los procesos manuales fueran demasiado lentos e ineficientes.

Esto hizo que las organizaciones tuvieran que encontrar opciones para mantenerse al día, sobrellevando el ritmo y la escala que tienen los entornos digitales actuales, ¿Cómo logran hacerlo? La mayoría de las organizaciones se encuentran optando por AIOps, una herramienta que tiene sus bases en la Machine Learning (ML) o aprendizaje automático, así como en la Inteligencia Artificial (AI), puesto que son elementos fundamentales para entrar a la transformación digital, aunque esto es más fácil decir que hacer.

Tal vez te interese descargar la infografía: Descubriendo lo invisible con AIOps

La razón subyacente es que los algoritmos que basados en la Machine Learning, por sí solos no son lo suficientemente sofisticados para poder lidiar con el entorno global actual, contenedorizado y basado en la nube, es por ello que Machine Learning requiere evolucionar hacia la Inteligencia Artificial, pero para hacerlo, se requiere que los datos sean procesados de forma más limpia para automatizar los procesos.

La problemática radica en que, obtener datos de alta calidad, representa una serie de desafíos únicos y es en este tipo de adversidades que muchas de las empresas no tienen la estrategia correcta para salir triunfantes, por lo tanto, se encuentran con problemas en cascada cuando intentan implementar iniciativas de transformación digital.

Cómo tener una estrategia de datos de alta calidad

Imagina que estás cocinando y después de un rato te das cuenta que se te olvido colocar las hierbas y especies, claramente podrías agregarlas más tarde, pero el sabor y la textura no será la misma, esto sucede de la misma forma con las empresas que con frecuencia se adentran en la transformación digital haciendo uso de la Inteligencia Artificial y Machine Learning, pues descubren en el desarrollo medio, que hacen falta indicadores clave de rendimiento (KPI), que no previeron que fueran indispensables. Este tipo de implementaciones a mitad del proceso tienen efectos perjudiciales en la iniciativa de la transformación digital, paralizando incluso su progreso, en pocas palabras la Inteligencia Artificial y Machine Learning no funcionarán si los datos no son los correctos.

Ahora bien, para comenzar a construir una estrategia de datos de alta calidad, lo que debes tener presente es que necesitarás dos estrategias de datos separadas, la primera será en la que se incluirán los datos históricos, mientras que la segunda será para los datos en tiempo real o también conocido como el aprendizaje continuo.

¿Para qué sirven los datos históricos? Se trata de la información crucial para las estrategias de Inteligencia Artificial y Machine Learning, sirven como el bloque de construcción fundamental para toda implementación efectiva de detección de anomalías, predecir o analizar patrones, y obtenerlos es algo desafiante, para ello considera las siguientes interrogantes.

  • ¿Qué objetivos finales tienes, y cuáles son los casos de uso para la automatización?
  • ¿Cuáles son los datos que necesitan esos casos de uso?
  • ¿Cuántos de estos datos necesitas?
  • ¿Con qué grado de confianza tienes los datos que necesitas?

Después de haber respondido estas preguntas, lo que debes tener en cuenta es que el entrenamiento de la Inteligencia Artificial y la Machine Learning en cuanto a los datos históricos no será suficiente. Puesto que necesitarán ingerir datos en tiempo real, de esta forma podrán responder y automatizar los procesos, este tipo de datos que se requieren tienen como principal objetivo ser el combustible que permite a los algoritmos de Machine Learning aprender y adaptarse a nuevas situaciones y entornos, de ahí su importancia.

Debes tener en cuenta que los datos en tiempo real también representan un conjunto de desafíos, puesto que se deben contemplar los siguientes factores que resultan ser decisivos, como son: el volumen que tienen, la velocidad, la variedad, la veracidad, y todo esto puede llegar a ser un aspecto abrumador y algo costoso para administrar.

Posteriormente deberás asegurarte de que los algoritmos de Machine Learning no adquieran malos hábitos, claramente esto puede llegar a pasar como consecuencia al uso de datos deficientes, por ello es de suma importancia colocar datos veraces e importantes desde el inicio, dado que al igual que pasa con muchos malos hábitos de las personas, es difícil lograr que la Inteligencia Artificial desapruebe un mal hábito una vez que se ha formado.

Tal vez te interese descargar la infografía: Machine Learning - Qué es y cómo funciona

De forma específica estos podrían ser valores atípicos que de forma errónea son considerados normales cuando no son así, incluso se pueden presentar lagunas en algunos datos, esto es desafortunado y se debe evitar ya que puede sesgar el comportamiento recién aprendido. Algo que es fundamental dentro de las plataformas de Inteligencia Artificial como de Machine Learning es que aprender de datos erróneos, puede generarles alertas falsas o extrañas, y crear impactos negativos en las operaciones de TI, no obstante, aunque el panorama sea algo nublado, existen situaciones para evitar este camino, pero el común denominador de todas ellas se reduce a la calidad de datos.

Los dos puntos más importantes para la calidad de los datos

Los llamados datos de entrenamiento históricos y de tiempo real, son fundamentales para la Inteligencia Artificial, Machine Learning, y automatización, no obstante, la calidad que tienen los datos continúa siendo el punto referente, desgraciadamente las empresas llegan a subestimarlo, sobre todo por la complejidad que presenta, afortunadamente, los problemas de calidad de datos no tienen que ser una situación adversa terminal, si se los abordan desde una forma estratégica.

Por otra parte, un paso importante es tener la visibilidad completa, tanto de forma horizontalmente mediante los silos operativos, como de forma vertical en las capas de la infraestructura. Para que conozcas que KPI resultarán importantes la solución ideal será aquella que permita ingerir la mayor cantidad de datos, de todos lugares como sea posible desde el principio.

Otro punto resulta crucial es que los datos se almacenen y normalicen de forma en que se conecten con otros datos, aquellos que descansan en silos no podrán potenciar la automatización pues no está en su función, esto se debe a que la información debe tener contexto, ante ello, una solución viable es la que da la posibilidad de ingerir los datos y contextualizarlos de forma simultánea, el dedicar tiempo a la unificación de datos, normalizarlos y correlacionarlos después de haberlos ingerido, requiere mucho tiempo.

Visibilidad y contexto: principios básicos de AIOps

Si la visibilidad y el contexto suenan bastante familiares, es porque se tratan de principios básicos de AIOps, una encuesta realizada por Enterprise Management Associates, corrobora que la adopción de la herramienta y otras analíticas avanzadas, se encuentra acelerando y jugando un papel crucial dentro de la transformación digital.

Por otra parte, existen oportunidades de cambio en el horizonte, pero toda empresa que este buscando habilitar la automatización y aprovechar la Inteligencia Artificial, primero ha de desarrollar una estrategia de datos sólida que tenga como objetivo priorizar la calidad, y los datos de entrenamiento contextualizados.

Recuerda que los datos buenos y procesables son la diferencia entre hacer que los motores de Inteligencia Artificial y Machine Learning funcionen de forma más inteligente, o hacer que el personal de TI trabaje más, ante esto una excelente opción es la que brinda FixStream que es la plataforma de Inteligencia Artificial para Operaciones de TI, ideal para toda empresa.

FixStream - Demo