E-Handbook:

¿Por qué implementar AIOps?

Laurent - stock.adobe.com

Este artículo es parte de nuestra guía: Guía Esencial: La IA se afianza en las empresas

La inteligencia artificial para las operaciones de TI da frutos con el tiempo

Los profesionales de TI dicen que AIOps tiene un gran potencial para optimizar las tareas de operaciones diarias. Sin embargo, en primer lugar, los equipos deben establecer una base de datos, coherencia y confianza.

En la superficie, la inteligencia artificial para las operaciones de TI (AIOps) puede parecer la última palabra de moda de TI, pero para las empresas que han adoptado AIOps, los beneficios y desafíos de ese movimiento son bastante reales.

En general, AIOps, el uso de análisis de datos y aprendizaje automático para optimizar las tareas comunes de operaciones de TI, desde la respuesta a incidentes hasta el análisis de la causa raíz, se encuentra en sus inicios, pero hacia allá se dirigen las empresas.

"AIOps es la única forma en que podremos lograr otro tipo de ganancia en eficiencia en la administración y despliegue de cargas de trabajo y operaciones", dijo Carl Brooks, analista de 451 Research.

De hecho, para algunas empresas, AIOps se siente como el siguiente paso lógico después de adoptar DevOps y otras prácticas de TI que enfatizan en gran medida la automatización.

"Para nosotros, AIOps es una especie de continuación de nuestra transformación hacia DevOps ágil y entrega continua; todas esas cosas lo habilitaron para permitirnos tener una infraestructura automatizada", dijo David Wilson, director senior de infraestructura y arquitectura en Paychex, un proveedor de software de recursos humanos con sede en Rochester, NY

Aprovisionamiento suficiente

Las organizaciones que implementan IA para las operaciones de TI pueden realizar una asignación de recursos optimizada y una gestión de la capacidad.

Ese es el caso de Paychex, que utiliza AIOps para enrutar a los clientes de manera proactiva y automática a un conjunto de recursos de infraestructura optimizados, según el tamaño de sus cargas de trabajo. La compañía quería adaptar sus servicios a la demanda de los usuarios en su diversa base de clientes, que abarca desde pequeñas organizaciones que usan Paychex HR y software de nómina para solo un puñado de empleados hasta grandes empresas multisitio que emplean a más de mil trabajadores.

Antes de que la empresa implementara el enrutamiento de tráfico inteligente en tiempo real a través de AIOps, aprovisionó en exceso su infraestructura de TI, que abarca un entorno local y la nube pública de Microsoft Azure. Incluso entonces, el equipo de TI corría el riesgo de que los usuarios compitieran por los recursos.

Paychex utiliza la plataforma de gestión del rendimiento de aplicaciones AppDynamics de Cisco para conocer el tipo y el tamaño de las transacciones que realizan sus clientes. Los modelos de aprendizaje automático personalizados consumen los datos y funcionan junto con la automatización personalizada y un equilibrador de carga F5 para enrutar dinámicamente a los clientes al conjunto adecuado de recursos y cómputo.

"Nuestra infraestructura parece homogénea y la administramos de manera homogénea, pero es consciente de quién es el cliente y responde de esa manera cuando ellos están trabajando en el sistema", dijo Wilson.

Trabajo de detective

Otro uso común de AIOps es la correlación de eventos automatizada y el análisis de la causa raíz, que el equipo de ingeniería de Barracuda Networks, una empresa de seguridad de red con sede en Campbell, California, aprovechó cuando modernizó las implementaciones.

Barracuda migró a AWS y adoptó microservicios y contenedores. Con esta agilidad recién descubierta y la capacidad de modificar la infraestructura sobre la marcha, el equipo de TI supervisa un entorno mucho más dinámico con un conjunto complejo de dependencias.

"Es un poco más ruidoso desde una perspectiva de monitoreo", dijo Lior Gavish, vicepresidente senior de ingeniería de los servicios de protección de correo electrónico de Barracuda. "Es posible que reciba siete alertas diferentes sobre lo mismo, porque es una reacción en cadena".

Para aliviar la fatiga de las alertas y localizar más rápidamente las causas raíz, Barracuda adoptó la herramienta AIOps de SignifAI para correlacionar eventos y automatizar el análisis de la causa raíz para generar menos alertas priorizadas. SignifAI fue adquirida por New Relic en 2019.

La herramienta también ha simplificado la forma en que el equipo de Barracuda configura un entorno de monitoreo de TI, dijo Gavish. Puede integrarse con más de 60 otros sistemas de monitoreo, de código abierto y comerciales, sin integración manual y configuración de alertas por parte del equipo de TI.

"SignifAI esencialmente se conecta a todos estos sistemas y extrae los datos de manera proactiva", dijo Gavish. "No tenemos que configurar cuadros de mando para cada métrica en particular y cada fuente de información en particular. Realiza un seguimiento automático de todo lo que agregamos a nuestra infraestructura".

La capacidad de dar sentido más rápidamente a los datos de monitoreo y correlacionar los eventos fue un factor clave para que Experian, una empresa de informes crediticios, adoptara herramientas habilitadas para inteligencia artificial para las operaciones de TI. La compañía utiliza Dynatrace para monitorear su infraestructura de nube híbrida, detectar dependencias y señalar la base de los problemas. Los datos de monitoreo de Dynatrace ingresan a ServiceNow, donde se elevan a un nivel de incidente para que un operador actúe.

"Saca a la gente del mundo de intentar realmente buscar dónde está el problema y averiguar quién es el culpable para conocer al culpable, entender los datos y poder actuar de inmediato", dijo Jonathan Hayes, vicepresidente de excelencia en el servicio de TI global en Experian, con sede en Costa Mesa, California.

Por qué la IA no es fácil

Para lograr las ganancias de eficiencia de AIOps, las organizaciones generalmente tienen que superar desafíos técnicos y organizacionales.

Todos los procesos de TI automatizados, incluidos los que sustentan AIOps, dependen de la coherencia. Las empresas deben estandarizar los flujos de trabajo de respuesta a incidentes para que una herramienta AIOps pueda identificar patrones y aprender la forma adecuada de abordar problemas comunes.

Junto con la automatización, los datos son el núcleo de cualquier estrategia AIOps. La recopilación y gestión de datos efectivas son imprescindibles antes de que la implementación despegue. Todos los datos introducidos en un sistema AIOps, ya sea de archivos de registro o tickets de la mesa de ayuda, deben estar limpios, categorizados y completos.

Algunos miembros del equipo de TI se muestran escépticos de que las herramientas AIOps eliminen los procesos complejos de las manos humanas. Esto es cierto incluso para los administradores que están bien acostumbrados a los scripts y herramientas de automatización, como Chef y Puppet, ya que estos enfoques todavía están bajo el control del implementador, dijo Brooks de 451.

"El conservadurismo inherente de la mayoría de los operadores de TI hace que vean cosas como AIOps con una sospecha increíble", dijo.

Definitivamente, generar confianza en la inteligencia artificial para las operaciones de TI lleva tiempo, coincidió Gavish de Barracuda. En las primeras etapas de un proyecto AIOps, una herramienta puede proporcionar falsos negativos o positivos, ya que se ajusta al entorno, pero no es así.

"Creo que ese es el principal desafío: asegurarse de que la gente confíe en un sistema AIOps y que el tipo de alertas que genera sea procesable", dijo.

Por último, una estrategia AIOps exige que los administradores de operaciones amplíen su alcance tanto de TI como de iniciativas comerciales, a medida que descargan tareas repetitivas de ruptura/reparación y asumen proyectos estratégicos.

"Su visión del mundo y comprensión de un entorno complejo tiene que ser mucho más grande que 'seguir el artículo de conocimiento, seguir estos 10 pasos y cerrar el incidente'", dijo Wilson de Paychex. Sin embargo, agregó, "es bueno tener esos problemas".

Investigue más sobre Software de mejora de procesos

ComputerWeekly.com.br
Close