putilov_denis - stock.adobe.com

La IA redefine la infraestructura crítica en los centros de datos

Optimizar un centro de datos para las demandas de la IA requiere una arquitectura modular de energía y enfriamiento que añada agilidad a la infraestructura, y permita seguir el paso a las cargas de trabajo, afirma Vertiv.

La inteligencia artificial está impulsando cambios en cómo operan e innovan las empresas y las industrias. Para 2027, las cinco mil principales empresas de América Latina destinarán más del 25 % de su presupuesto central de TI a iniciativas de IA, lo que generará un aumento de dos dígitos en la tasa de innovación de productos y procesos, según el informe FutureScape de IDC.

Este crecimiento representa una oportunidad para los centros de datos. Por ejemplo, datos de Morgan Stanley indican que la demanda energética de la IA generativa crecerá a una tasa anual del 70 % hasta 2027. "En el ecosistema de la IA generativa, la eficiencia no es negociable: la disponibilidad y la calidad de la energía son los únicos garantes de la confiabilidad operativa", apuntó Fabio Olivetti, gerente de ofertas de agua helada y alta densidad para centros de datos de Vertiv LATAM.

El experto indicó que se han desarrollado principios de diseño específicos para IA que permiten responder a nuevos requisitos de carga de trabajo y densidad, tales como:

  • Diseño de energía y enfriamiento de manera holística: Se requiere un enfoque integral de la infraestructura para satisfacer las demandas simultáneas de energía y enfriamiento de la IA. Al emplear tecnologías integradas altamente eficientes –como el enfriamiento líquido directo al chip– junto con infraestructura eléctrica avanzada, las soluciones integrales mejoran la eficiencia general, permiten la escalabilidad y garantizan que las cargas de trabajo de IA no se vean limitadas ni ralentizadas por restricciones de la infraestructura.
  • Uso eficiente de la energía disponible: Se prevé que la IA genere un crecimiento sin precedentes en el consumo energético de los centros de datos. Los racks de IA deben utilizar cada watt de la forma más eficiente posible, lo que exige eliminar la energía ociosa alineando los clústeres de IA con los bloques de capacidad del centro de datos y aprovechar los últimos avances en eficiencia de los equipos. El monitoreo en tiempo real y la optimización de la distribución de energía mediante la gestión fuera de banda ayudan a eliminar ineficiencias y a optimizar el uso de recursos.
  • Equilibrio del TCO, la redundancia y el radio de impacto (blast radius): Maximizar el valor de la infraestructura de IA requiere un análisis cuidadoso de los costos totales, la redundancia y el alcance potencial de los daños que podrían producirse ante una falla. Lograr el equilibrio adecuado optimiza la inversión de capital, la gestión de riesgos, la escalabilidad y la confiabilidad. En caso de fallas del sistema, la gestión remota fuera de banda puede reducir los tiempos de recuperación de horas a minutos.
  • Preparar los centros de datos para picos en las cargas de trabajo de IA: Las cargas de trabajo de IA pueden presentar grandes variaciones en sus requerimientos de recursos, lo que genera una demanda informática dinámica. La infraestructura debe diseñarse para soportar estas cargas dinámicas mediante capacidad de reserva y controles avanzados a nivel de sistema.
  • Aprovechar las tecnologías de enfriamiento líquido y por aire: La combinación de tecnologías de enfriamiento líquido y por aire permite que las fortalezas de cada una se complementen. El resultado es una solución flexible que responde a distintas necesidades de enfriamiento según las cargas de trabajo, además de ser eficiente y escalable.
  • Diseño pensado hacia el futuro: Quienes hoy diseñan infraestructuras para IA deben tener una visión a largo plazo porque la IA aún se encuentra en sus etapas iniciales. La industria se prepara para un futuro en el que la capacidad computacional de un centro de datos de 1 MW pueda concentrarse en un solo rack.

Es necesario transitar hacia la alta densidad

Algunas empresas han enfrentado dificultades por falta de espacio para racks de alta densidad, o han encontrado limitaciones en la infraestructura eléctrica que requieren rediseños estructurales. “Optimizar un centro de datos para las demandas de la IA requiere alejarse de los modelos de infraestructura estática. Su implementación exitosa no es una meta estática, sino una evolución: solo la integración de gestión térmica avanzada y potencia modular garantiza que la infraestructura respire al mismo ritmo que la carga de trabajo”, resaltó Olivetti.

El ejecutivo señaló que "la verdadera preparación para el desarrollo de la IA no reside en la capacidad instalada, sino en la agilidad de la infraestructura: solo mediante una arquitectura modular de energía y enfriamiento es posible transformar la incertidumbre del crecimiento en una ventaja operativa escalable y sostenible”.

Implementar IA en centros de datos convencionales requiere soluciones que integren energía y enfriamiento de manera eficiente, pues el uso de infraestructuras diseñadas específicamente para alta densidad permite estandarizar el ciclo de vida de los sistemas mediante gestión remota y servicios de soporte.

“Un enfoque integral no solo asegura la viabilidad técnica en entornos heredados, sino que también agiliza la puesta en marcha, logrando una eficiencia temporal de hasta el 50 % en comparación con la infraestructura construida a medida”, concluyó Olivetti.

Investigue más sobre Inteligencia artificial y automatización