Getty Images/iStockphoto
El Black Friday supone la prueba de estrés de TI definitiva para los CIO
Los CIO deben garantizar sistemas escalables, análisis en tiempo real, automatización impulsada por IA y una sólida colaboración para mantener el rendimiento frente a las demandas de TI del Black Friday.
El Black Friday, el viernes posterior al Día de Acción de Gracias en Estados Unidos, ha sido durante mucho tiempo uno de los días de compras más concurridos del año. Durante gran parte de su historia, el Black Friday se centró en las compras presenciales, y el Cyber Monday surgió en la década del 2000 como su equivalente digital.
En los últimos años –y ciertamente desde la pandemia– el Black Friday se ha convertido también en un gran evento en línea, en el que los estadounidenses compran y visitan sitios web y servicios de consumo en línea.
El auge del Black Friday ya no se limita solo a los consumidores. Para los CIO, ha pasado de ser un desafío técnico a una prueba de estrés de TI que revela si una organización puede funcionar bajo presión.
El aluvión de tráfico afecta a una amplia gama de servicios en línea, y pone a prueba la seguridad e infraestructura de internet de empresas de todos los tamaños. El Black Friday también marca el inicio de la temporada navideña, que precede a Navidad y Año Nuevo, por lo que el tráfico que se dispara durante el Black Friday suele extenderse durante ese mismo período, poniendo a prueba los recursos empresariales y de TI.
Prueba de preparación de infraestructura
En el nivel más básico, el Black Friday genera más tráfico que otros períodos, lo que pone más presión sobre la infraestructura.
Sin embargo, preparar la infraestructura para el Black Friday requiere más que simplemente añadir servidores y capacidad de ancho de banda. Las organizaciones exitosas deben analizar las métricas de rendimiento pasadas para identificar cuellos de botella específicos antes de que vuelvan a ocurrir.
Encontrar los cuellos de botella
Los verdaderos cuellos de botella de infraestructura no están donde la mayoría de los equipos de TI los esperan, según Iliya Rybchin, director de BDO USA.
"Sí, hay aspectos obvios como la capacidad del servidor, el rendimiento de la base de datos y la capacidad de CDN, pero son requisitos mínimos", dijo Rybchin. "Cualquier equipo de TI competente se encarga de ellos; los verdaderos cuellos de botella surgen en los puntos de integración".
Rybchin señaló que, cuando el tráfico aumenta entre 10 y 20 veces lo normal, las transferencias entre la plataforma de comercio electrónico de una organización, la pasarela de pagos, los sistemas de detección de fraude y la gestión de pedidos crean desaceleraciones en cascada.
Rafael Mercado, vicepresidente y líder del mercado estadounidense de consumo y viajes de Kyndryl, identificó cuatro áreas principales de cuellos de botella en materia de infraestructura que surgen durante los eventos pico:
- Escalar aplicaciones y plataformas para satisfacer la demanda. Los sistemas heredados obsoletos y las plataformas de comercio electrónico rígidas tienden a ceder ante la presión del Black Friday. Los CIO pueden combatir esto con estrategias de nube híbrida durante los picos de tráfico para aprovechar el potencial de computación adicional bajo demanda, descomponer sistemas monolíticos con microservicios y API para un escalado más rápido y flexible, y simular picos de tráfico mediante pruebas de carga sintéticas para detectar y corregir puntos débiles antes de que se produzcan.
- Tensiones en la red y experiencias de usuario deficientes. Cuando el tráfico aumenta entre regiones, la lentitud de las redes y la capacidad limitada del borde provocan retrasos en la carga de páginas, el proceso de pago y las recomendaciones personalizadas. Las organizaciones líderes están invirtiendo en computación perimetral para procesar los datos más cerca de los usuarios y optimizar las redes de distribución de contenido para un rendimiento más rápido.
- Cuellos de botella de datos en los sistemas. La sincronización de múltiples conjuntos de datos entre plataformas de punto de venta, ERP y logística puede retrasarse, lo que provoca errores y retrasos. Mercado señaló que muchos minoristas están adoptando arquitecturas basadas en eventos que responden instantáneamente a los cambios en los sistemas, en lugar de depender del procesamiento por lotes.
- Tiempos de respuesta lentos a incidentes. Las herramientas de monitorización fragmentadas y los equipos aislados ralentizan la resolución de problemas cuando cada segundo cuenta. Las empresas están implementando plataformas de observabilidad totalmente integradas que ofrecen visibilidad integral.
La importancia del equilibrio de carga
Yad Senapathy, fundador y director ejecutivo del Project Management Training Institute, dijo que los mayores problemas de infraestructura son los sistemas de pago lentos, las bases de datos sobrecargadas y las redes de contenido que no pueden seguir el ritmo del tráfico.
Las estrategias de equilibrio de carga separan a los minoristas exitosos de aquellos que tienen dificultades, afirmó.
"Las empresas que mejor lo gestionan utilizan configuraciones flexibles en la nube que trasladan el tráfico a centros de datos de respaldo cuando es necesario", explicó Senapathy. "Procesan los datos de las transacciones de inmediato en lugar de esperar actualizaciones por lotes, lo que mantiene estable el uso de la memoria".
Observabilidad y AIOps
La observabilidad y AIOps se han vuelto esenciales para la monitorización de la infraestructura en tiempo real. Senapathy recomendó que los CIO mantengan las herramientas de seguimiento en funcionamiento en todos los servicios para detectar dónde se ralentizan los procesos.
Las herramientas AIOps pueden aportar un valor significativo a las organizaciones, comentó. En algunos casos, las organizaciones que las utilizan han reducido las falsas alertas a más de la mitad, lo que permite a los ingenieros dedicar más tiempo a abordar problemas reales.
Ciberseguridad y prevención del fraude
El aumento de tráfico que trae consigo el Black Friday también conlleva potencialmente más riesgos a medida que aumentan los volúmenes de transacciones.
Los atacantes sofisticados podrían usar el aumento masivo del tráfico legítimo como excusa para actividades maliciosas. El fraude automatizado y sofisticado domina el panorama de la ciberseguridad, desde el acaparamiento de inventario mediante bots, hasta el robo de puntos de fidelidad y el fraude en las devoluciones, afirmó Rybchin.
Las principales amenazas se dividen en tres categorías:
- Ataques de denegación de servicio distribuido (DDoS). Algunos atacantes extorsionan a los minoristas amenazando con cerrar sus sitios web durante las horas punta. Otros utilizan los DDoS como excusa para robar datos o comprometer los sistemas de pago. El reto reside en distinguir el tráfico malicioso de la actividad legítima de los clientes.
- Campañas de phishing. Los ataques por correo electrónico se disparan en las semanas previas al Black Friday, dirigidos tanto a clientes (robo de credenciales) como a empleados (acceso al sistema). Los estafadores comprometen cuentas con meses de antelación y esperan hasta el Black Friday para realizar compras de alto valor que simulan compras legítimas.
- Fraude automatizado. Las redes de bots realizan robos de cuentas, fraudes de pagos y manipulación de inventario a gran escala. “Los atacantes ahora actúan con mayor anticipación, automatizan con mayor rapidez y difuminan la línea entre los bots y el tráfico humano legítimo, a menudo a través de IAGen”, indicó Mercado.
Automatización e IA
La aparición de la IA y de herramientas de automatización avanzadas ha cambiado la forma en que los CIO pueden abordar los desafíos del Black Friday.
"La IA está pasando de la experimentación a la ejecución", afirmó Mercado. "Los minoristas la utilizan para detectar fraudes en milisegundos, predecir cambios en la demanda, personalizar ofertas dinámicamente e incluso anticiparse a la sobrecarga de infraestructura".
Los principales casos de uso de la IA y la automatización incluyen:
- Atención al cliente. La clasificación de la atención al cliente se beneficia de la automatización basada en IA, que asigna los problemas según su urgencia y complejidad. Durante el Black Friday, los sistemas automatizados gestionan las consultas rutinarias y marcan los problemas complejos para la intervención humana, lo que reduce los tiempos de respuesta.
- Respuesta a incidentes. Senapathy señaló que la IA ha marcado una diferencia significativa en la predicción y prevención de problemas antes de que se agraven. Ayuda a pronosticar la carga que soportarán los servidores cada hora para que los equipos puedan escalar con antelación.
- Detección de anomalías. Las organizaciones pueden usar análisis de comportamiento basados en IA para identificar desviaciones en las rutas de usuario conocidas, lo que permite detectar rápidamente tanto problemas técnicos como actividades fraudulentas. La IA de agentes monitorea de forma autónoma los patrones en las tiendas y activa soluciones automatizadas, señaló Mercado.
Análisis en tiempo real
Los análisis en tiempo real son un elemento fundamental de las operaciones de TI, y proporcionan a los CIO y líderes de TI una visión clara de lo que está ocurriendo en un entorno.
Los análisis se presentan comúnmente en paneles, lo que facilita actualizaciones rápidas del estado a medida que ocurren los eventos. Estos paneles brindan visibilidad simultánea del rendimiento técnico y las métricas de negocio, lo que permite a los equipos comprender no solo qué sucede, sino también su importancia.
Las organizaciones líderes implementan paneles unificados que rastrean indicadores clave de rendimiento (KPI) técnicos críticos, incluidos:
- Tiempos de respuesta del servidor.
- Rendimiento de consultas de base de datos.
- Latencia en el procesamiento de pagos.
- Volúmenes de llamadas API.
Estos mismos paneles muestran métricas comerciales que incluyen:
- Tasas de conversión.
- Valores promedio de pedidos.
- Tasas de abandono del carrito de compras.
- Rendimiento promocional.
La infraestructura analítica que sustenta estas capacidades requiere una arquitectura meticulosa. Las plataformas de streaming de eventos capturan las interacciones de los clientes, las métricas de rendimiento del sistema y las transacciones comerciales en tiempo real. Los motores de procesamiento de flujo analizan estos datos en tiempo real, identificando patrones y activando respuestas o alertas automatizadas. Los lagos y almacenes de datos proporcionan el contexto histórico necesario para interpretar los patrones actuales y predecir tendencias futuras.
El cumplimiento normativo y la gobernanza son elementos esenciales de la infraestructura de análisis en tiempo real. Los minoristas deben garantizar que la personalización en tiempo real y el seguimiento del comportamiento cumplan con el Reglamento General de Protección de Datos (RGPD), la Ley de Privacidad del Consumidor de California (CCPA) y otros marcos de privacidad. Las organizaciones líderes integran estos controles en su arquitectura de análisis, garantizando que la toma de decisiones rápida no genere riesgos de incumplimiento.
Colaboración en toda la empresa
Además de los diversos desafíos técnicos que el Black Friday trae a los CIO, también trae desafíos humanos que requieren colaboración en toda la empresa.
Según Nora Jones, fundadora de Jeli.io, que fue adquirida por PagerDuty, la mayoría de los “fracasos” del Black Friday son humanos, no técnicos.
"Hace años, sufrí una interrupción importante durante una campaña de mucho tráfico simplemente porque los equipos de marketing e ingeniería no estaban coordinados ", dijo Jones. "Marketing lanzó una promoción masiva sin avisarnos, y el repentino aumento colapsó nuestros sistemas en cuestión de minutos".
Desde entonces, Jones ha abogado por un enfoque de planificación pre-mortem. En lugar de solo revisar los fallos a posteriori, los equipos deberían reunirse con antelación para predecir posibles puntos de fallo y diseñar respuestas conjuntas. "La coordinación proactiva entre marketing e ingeniería, asegurando que ambas partes sepan qué se viene y cómo responder, es lo que realmente separa a los minoristas que prosperan en el Black Friday de los que luchan por sobrevivir", dijo.
El rol del CIO durante el Black Friday se extiende más allá de las operaciones de TI para unir funciones de tecnología, comercio electrónico, marketing y cadena de suministro.
Los mejores CIO no son solo tecnólogos, sino también orquestadores, dijo Mercado, ya que alinean TI, marketing y operaciones en torno a prioridades compartidas y crean bucles de retroalimentación en tiempo real que permiten a los equipos adaptarse instantáneamente.
"También comunican claramente qué es crítico para la misión, qué puede esperar y quién es responsable de cada decisión para reducir la confusión y acelerar los tiempos de respuesta durante los eventos pico", reflexionó.
Los atributos clave de los CIO exitosos para el Black Friday incluyen:
- Confianza. Generar confianza y alineación entre departamentos que no controlan directamente.
- Influencia. La capacidad de influir en equipos de distintos departamentos mediante objetivos compartidos, transparencia y una comunicación fluida entre ellos.
- Empoderamiento. En lugar de centralizar cada decisión, empoderan a los equipos de primera línea con marcos claros y acceso a datos en tiempo real para permitir tiempos de respuesta más rápidos sin necesidad de aprobaciones de arriba hacia abajo.
"Los CIO que tienen dificultades a menudo trabajan en silos o tratan eventos pico como el Black Friday como combates aislados en lugar de como parte de un ciclo continuo de preparación que equilibra la modernización, la colaboración y la agilidad humana necesaria para avanzar al ritmo del cliente", resaltó Mercado.
Sean Michael Kerner es consultor de TI, entusiasta de la tecnología y experto en desarrollo. Ha instalado Token Ring, configurado NetWare y es conocido por compilar su propio kernel de Linux. Asesora a organizaciones de la industria y los medios de comunicación sobre temas tecnológicos.