Llegamos a ustedes gracias a:



Reportajes y análisis

Cómo la IA puede crear centros de datos autocontrolados

[12/08/2020] La mayor parte del zumbido alrededor de la inteligencia artificial (IA) se centra en los vehículos autónomos, los chatbots, la tecnología de gemelos digitales, la robótica y el uso de sistemas "inteligentes" basados en IA para extraer información comercial de grandes conjuntos de datos. Pero la IA y el aprendizaje automático (ML) jugarán un día un papel importante entre los estantes de los servidores en las entrañas del centro de datos de la empresa.

El potencial de la IA para impulsar la eficiencia del centro de datos -y por extensión mejorar el negocio- se divide en cuatro categorías principales:

  • Gestión de la energía: La gestión de la energía basada en IA puede ayudar a optimizar los sistemas de calefacción y refrigeración, lo que puede reducir los costos de electricidad, reducir el número de empleados y mejorar la eficiencia. Los proveedores representativos en esta área incluyen a Schneider Electric, Siemens, Vertiv y Eaton Corp.
  • Gestión de equipos: Los sistemas de IA pueden monitorear la salud de los servidores, el almacenamiento y los equipos de red, verificar que los sistemas permanezcan correctamente configurados y predecir cuándo el equipo está a punto de fallar. Según Gartner, los proveedores de la categoría de gestión de la infraestructura de TI de la AIOps (ITIM) incluyen a OpsRamp, Datadog, Virtana, ScienceLogic y Zenoss.
  • Gestión de la carga de trabajo: Los sistemas de IA pueden automatizar el movimiento de las cargas de trabajo hacia la infraestructura más eficiente en tiempo real, tanto dentro del centro de datos como, en un entorno de nube híbrido, entre los entornos on-prem, cloud y edge. Hay un número creciente de jugadores más pequeños que ofrecen optimización de la carga de trabajo basada en la IA, incluyendo Redwood, Tidal Automation e Ignio. Pesos pesados como Cisco, IBM y VMware también tienen ofertas.
  • Seguridad: Las herramientas de IA pueden "aprender" cómo es el tráfico normal de la red, detectar anomalías, priorizar qué alertas requieren la atención de los profesionales de la seguridad, ayudar con el análisis posterior a los incidentes de lo que salió mal, y proporcionar recomendaciones para tapar los agujeros en las defensas de seguridad de la empresa. Los proveedores que ofrecen esta capacidad incluyen VectraAI, Darktrace, ExtraHop y Cisco.

Si lo ponemos todo junto, la visión es que la IA puede ayudar a las empresas a crear centros de datos altamente automatizados, seguros y autocurativos que requieren poca intervención humana y que funcionan con altos niveles de eficiencia y resistencia.

"La automatización de la IA puede escalar para interpretar los datos a niveles que superan la capacidad humana, recogiendo los conocimientos imprescindibles necesarios para optimizar el uso de la energía, distribuir las cargas de trabajo y maximizar la eficiencia para lograr una mayor utilización de los activos del centro de datos", explica Said Tabet, distinguido ingeniero de la oficina global del CTO de Dell Technologies.

Por supuesto, al igual que la promesa de los autos sin conductores, el centro de datos de autoconducción aún no ha llegado. Hay importantes barreras técnicas, operacionales y de personal que se interponen en el camino de los avances de la IA en el centro de datos. La adopción es incipiente hoy en día, pero los beneficios potenciales mantendrán a las empresas buscando oportunidades para mover la aguja.

La gestión de la energía aprovecha la gestión de la carga de trabajo del servidor

Se estima que los centros de datos consumen el 3% del suministro eléctrico mundial y causan alrededor del 2% de las emisiones de gases de efecto invernadero, por lo que no es sorprendente que tantas empresas se esfuercen en la gestión de la energía de los centros de datos, tanto para ahorrar dinero como para ser responsables con el medio ambiente.

Daniel Bizo, analista senior de 451 Research, dice que los sistemas basados en IA pueden ayudar a los operadores de los centros de datos a comprender los problemas de refrigeración actuales o potenciales, como la insuficiente entrega de aire frío debido, por ejemplo, a un gabinete de alta densidad que bloquea el flujo de aire, una unidad de HVAC de bajo rendimiento, o una inadecuada contención del aire entre los pasillos calientes y fríos.

La IA promete ofrecer beneficios "más allá de lo que es posible con un simple buen diseño de las instalaciones", anota Bizo. Los sistemas de IA "pueden aprender una instalación correlacionando los datos de los sistemas de HVAC y las lecturas sensoriales ambientales" en el piso del centro de datos.

La gestión de la energía es el fruto más fácil, añade Greg Schulz, fundador de la empresa de asesoría y consultoría informática StorageIO. "Hoy en día, se trata de la productividad, de conseguir que se haga más trabajo por BTU, más trabajo por vatio de energía, lo que significa trabajar más inteligentemente y conseguir que el equipo trabaje más inteligentemente".

También hay un ángulo de planificación de la capacidad. Además de buscar puntos calientes y fríos, los sistemas de IA pueden asegurarse de que los centros de datos alimenten el número correcto de servidores físicos, y también tengan la capacidad disponible para activar (y desactivar) nuevos servidores físicos si hay una explosión temporal en la demanda.

Schulz añade que las herramientas de administración de energía están desarrollando conexiones en los sistemas que administran el equipo y las cargas de trabajo. Si los sensores detectan que un servidor se está ejecutando demasiado caliente, por ejemplo, el sistema podría trasladar rápida y automáticamente las cargas de trabajo a un servidor infrautilizado, para evitar una posible interrupción que podría afectar a las aplicaciones de misión crítica. El sistema podría entonces investigar la causa del sobrecalentamiento del servidor -podría ser un ventilador que ha fallado (un problema de HVAC), un componente físico que está a punto de colapsar (un problema de equipo), o tal vez el servidor acaba de ser sobrecargado (un problema de carga de trabajo).

Monitoreo de salud impulsado por la IA, supervisión de la administración de la configuración

Los centros de datos están llenos de equipos físicos que necesitan un mantenimiento regular. Los sistemas de IA pueden ir más allá del mantenimiento programado, y ayudar en la recolección y análisis de datos de telemetría que pueden señalar áreas específicas que requieren atención inmediata. "Las herramientas de IA pueden olfatear todos esos datos y anomalías", señala Schulz.

"El monitoreo de la salud comienza con la comprobación de que el equipo está configurado correctamente y funciona según las expectativas", añade Bizo. Con cientos o incluso miles de gabinetes de TI con decenas de miles de componentes, estas tareas mundanas pueden ser intensivas en mano de obra, y por lo tanto no siempre se realizan de manera oportuna y minuciosa".

Señala que el modelo predictivo de fallas de equipos basado en grandes cantidades de registros de datos sensoriales puede "detectar un componente o falla de equipo inminente, y evaluar si necesita un mantenimiento inmediato para evitar cualquier pérdida de capacidad que pueda causar una interrupción del servicio".

Michael Bushong, vicepresidente de marketing empresarial y de nube de Juniper Networks, argumenta que los operadores de centros de datos empresariales deberían ignorar algunas de las promesas excesivas y las exageraciones asociadas con la IA, y centrarse en lo que él llama "innovaciones aburridas".

Sí, los sistemas de IA pueden algún día "decirme qué es lo que está mal y arreglarlo", pero en este punto, muchos operadores de centros de datos se conformarían con "si algo sale mal, dime dónde buscar", indica Bushong.

La cartografía de dependencia es también un área importante, pero no especialmente emocionante, donde la IA puede ser útil. Si los administradores de los centros de datos están haciendo cambios de política en los firewalls u otros dispositivos, ¿cuáles podrían ser las consecuencias no deseadas? "Si propongo un cambio, es útil saber qué podría haber dentro del radio de la explosión", anota Bushong.

Otro aspecto importante para mantener el equipo funcionando sin problemas y de forma segura es controlar algo llamado deriva de configuración, un término de centro de datos que se refiere a la forma en que los cambios de configuración ad hoc a lo largo del tiempo pueden sumarse para crear problemas. La IA puede ser usada como "un chequeo de seguridad adicional" para identificar problemas inminentes en el centro de datos basados en la configuración, dice Bushong.

La IA y la seguridad

Según Bizo, la IA y el aprendizaje por máquina "pueden simplificar el manejo de los eventos (respuesta a incidentes) realizando una rápida clasificación y agrupación de los eventos para identificar los importantes y separarlos del ruido. Un análisis más rápido de la causa raíz ayuda a los operadores humanos a tomar decisiones informadas y a actuar en consecuencia".

La IA puede ser particularmente útil en la detección de intrusos en tiempo real, añade Schulz. Los sistemas basados en IA pueden detectar, bloquear y aislar las amenazas, y luego pueden volver atrás y realizar una investigación forense para determinar exactamente lo que ocurrió y qué vulnerabilidades pudo explotar el hacker.

Los profesionales de seguridad que trabajan en un centro de operaciones de seguridad (SOC) están a menudo sobrecargados de alertas, pero los sistemas basados en IA pueden escanear a través de grandes cantidades de datos de telemetría e información de registro, despejando las tareas mundanas de la cubierta, de modo que los profesionales de la seguridad quedan libres para manejar tipos de investigaciones más profundas.

Optimización de la carga de trabajo basada en la IA

En la capa de aplicación, la IA tiene el potencial de automatizar el movimiento de las cargas de trabajo hacia el punto de aterrizaje apropiado, ya sea en las instalaciones o en la nube. "En el futuro, la IA/ML debería tomar decisiones en tiempo real sobre dónde colocar las cargas de trabajo en función de la multitud de especificaciones de rendimiento, costo, gobernanza, seguridad, riesgo y sostenibilidad", señala Bizo.

Por ejemplo, las cargas de trabajo podrían trasladarse automáticamente a los servidores más eficientes en cuanto a consumo de energía, asegurándose de que los servidores funcionen con la máxima eficiencia, lo que supondría una utilización del 70-80%. Los sistemas de IA podrían integrar datos de rendimiento en la ecuación, de modo que las aplicaciones sensibles al tiempo se ejecuten en los servidores de alta eficiencia, al tiempo que se aseguran de que no se queme un exceso de energía en aplicaciones que no requieren una ejecución rápida, indica Bizo.

La optimización de la carga de trabajo basada en la IA ha llamado la atención de los investigadores del MIT, quienes anunciaron el año pasado que habían desarrollado un sistema de IA que aprende automáticamente a programar operaciones de procesamiento de datos en miles de servidores.

Pero, como señala Bushong, la realidad es que la optimización de la carga de trabajo hoy en día es competencia de los hiperescaladores como Amazon, Google y Azure, no del centro de datos de una empresa promedio. Y hay un número de razones para ello.

Los desafíos de la aplicación de la IA

La optimización y automatización del centro de datos es una parte integral de las iniciativas de transformación digital en curso. Tabet de Dell añade que "con COVID-19, muchas empresas están buscando una mayor automatización, impulsando las ideas de 'centros de datos digitales' que son impulsados por la inteligencia artificial y capaces de autocurarse".

Google anunció en el 2018 que había convertido el control de sus sistemas de refrigeración en varios de sus centros de datos a hiperescala en un programa de IA, y la compañía informó que las recomendaciones proporcionadas por el algoritmo de IA proporcionaron una reducción del 40% en el uso de energía.

Pero, para las empresas que no se llaman Google, la IA en el centro de datos es "en gran medida una aspiración", anota Bizo. "Algunas características de la IA/ML están disponibles en el manejo de eventos, salud de la infraestructura y optimización de la refrigeración. Pero pasarán más años antes de que los modelos de IA/ML logren avances más visibles que lo que es posible con la Administración de Infraestructura del Centro de Datos estándar (DCIM, por sus siglas en inglés) hoy en día. Al igual que con el desarrollo de vehículos autónomos, las primeras etapas pueden ser interesantes, pero lejos de los avances económicos y comerciales que promete en última instancia".

Algunas de las barreras, de acuerdo con Tabet, son que "las personas adecuadas necesitan ser contratadas o entrenadas para manejar el sistema. Otra cuestión que hay que tener en cuenta es la necesidad de normas de datos y arquitecturas pertinentes".

Gartner lo expresa de esta manera: "La madurez de la plataforma de AIOps, las habilidades de TI y la madurez de las operaciones son los principales inhibidores. Otros desafíos emergentes para los despliegues avanzados incluyen la calidad de los datos y la falta de habilidades en ciencias de la información" dentro de la infraestructura de TI y los equipos de operaciones.

Bushong añade que la mayor barrera es siempre la gente. Señala que salir y contratar científicos de datos es un desafío para muchas empresas, y la capacitación de los empleados existentes también es un obstáculo.

Además, hay una larga historia de empleados que se resisten a las tecnologías que les quitan el control, comenta Bushong. Señala que las redes definidas por software (SDN, por sus siglas en inglés) han existido por una década, pero más de tres cuartas partes de las operaciones de TI siguen siendo impulsadas por CLI.

"Tenemos que creer que los operadores de todo tipo de infraestructura están dispuestos a ceder el control a la IA", señala Bushong. "Si un grupo de personas aún no confía en los controladores para tomar decisiones, ¿cómo se entrena, educa y conforta a un grupo de personas para hacer una transición de esta magnitud cuando la actitud que prevalece en la industria es que, si hago esto, perderé mi trabajo?".

Por eso Bushong sugiere que las empresas den esos pequeños y aburridos pasos hacia la IA, y no se dejen atrapar por el bombo que tan a menudo rodea a una nueva tecnología.

También en este reportaje

Primer Contacto

Más »

Casos de éxito

Más »