
[11/12/2019] A medida que la inteligencia artificial despega en ambientes empresariales, también lo hará el uso de energía del centro de datos. La IA tiene muchas ventajas, pero la eficiencia energética no es una de ellas.
Para los centros de datos que ejecutan aplicaciones empresariales típicas, el consumo de energía promedio para un rack es de alrededor de 7 kW. Sin embargo, es común que las aplicaciones de IA utilicen más de 30 kW por rack, según la organización de centros de datos AFCOM. Esto se debe a que la IA requiere una utilización mucho mayor del procesador, y los procesadores -especialmente las GPU- necesitan mucha energía. Las GPU de Nvidia, por ejemplo, pueden ejecutar varias órdenes de magnitud más rápido que una CPU, pero también consumen el doble de energía por chip. Para complicar el problema, muchos centros de datos ya tienen limitaciones de energía.
La refrigeración también es un problema: los servidores orientados a la IA requieren una mayor densidad de procesador, lo que significa que hay más chips en la caja, y todos se calientan mucho. Una mayor densidad, junto con una mayor utilización, aumenta la demanda de refrigeración en comparación con un servidor de back office típico. Conjuntamente, más requerimientos de enfriamiento aumentan las demandas de energía.
Entonces, ¿qué puede hacer si desea adoptar la IA por razones competitivas, pero la capacidad de energía de su instalación actual no cumple con los requerimientos de infraestructura de alta densidad de la IA? Aquí hay algunas opciones.
Considere el enfriamiento líquido
El enfriamiento del ventilador generalmente pierde viabilidad una vez que un rack supera los 15 kW. Sin embargo, el agua tiene una capacidad calorífica tres mil veces mayor que la del aire, según CoolIT Systems, fabricante de productos empresariales de refrigeración líquida. Como resultado, en lugar de ventiladores, los fabricantes de gabinetes de servidores han estado agregando tuberías de líquido a sus gabinetes y conectando tuberías de agua a sus disipadores de calor.
"La refrigeración líquida es definitivamente una muy buena opción para cargas de mayor densidad”, afirma John Sasser, vicepresidente sénior de operaciones de centros de datos en Sabey, desarrollador y operador de centros de datos. "Eso elimina el problema del flujo de aire desordenado. El agua elimina mucho más calor que el aire, y puede dirigirla a través de tuberías. Una gran cantidad de HPC [computación de alto rendimiento] se realiza con refrigeración líquida”.
La mayoría de los centros de datos están configurados para la refrigeración por aire, por lo que la refrigeración líquida requerirá una inversión de capital, "pero esa podría ser una solución mucho más sensata para estos esfuerzos, especialmente si una empresa decide avanzar en la dirección [de la IA]”, afirma Sasser.
Ejecute cargas de trabajo de IA a resoluciones más bajas
Los centros de datos existentes podrían manejar cargas de trabajo computacionales de inteligencia artificial, pero de manera reducida, afirma Steve Conway, vicepresidente senior de investigación de Hyperion Research. Muchas cargas de trabajo -si no la mayoría- se pueden operar con una precisión mediana, o de un cuarto, en lugar de una precisión doble de 64 bits.
"Para algunos problemas, la mitad de la precisión está bien”, afirma Conway. "Ejecútelo a menor resolución, con menos datos. O con menos ciencia”.
Los cálculos de punto flotante de doble precisión se necesitan principalmente en la investigación científica, que a menudo se realiza a nivel molecular. La precisión doble no se usa típicamente en la capacitación o inferencia de la IA en modelos de aprendizaje profundo porque no es necesaria. Incluso Nvidia la recomienda para el uso de cálculos de precisión simple y media en redes neuronales profundas.
Construya un segmento de contención de IA
La IA será parte de su negocio, pero no todo, y eso debería reflejarse en su centro de datos. "Las nuevas instalaciones que se están construyendo están contemplando asignar una parte de sus instalaciones a un mayor uso de energía”, afirma Doug Hollidge, socio de Five 9s Digital, que construye y opera centros de datos. "No va a poner todas sus instalaciones a una densidad más alta, porque hay otras aplicaciones que tienen un menor consumo”.
Lo primero que debe hacer es evaluar el suministro de energía al edificio, afirma Hollidge. "Si va a aumentar el uso de energía en el edificio, debe asegurarse de que el proveedor de energía pueda aumentar el suministro de energía”.
Traiga a un ingeniero para evaluar qué parte del centro de datos está mejor equipado para capacidades de mayor densidad. Los requisitos de carga de trabajo determinarán la mejor solución, ya sea contención de pasillo caliente o refrigeración líquida, o alguna otra tecnología. "Es difícil dar una solución única para todos, ya que todos los centros de datos son diferentes”, afirma Hollidge.
Extienda sus sistemas de IA
Un enfoque alternativo, en lugar de agrupar todos sus sistemas de IA en un lugar más caliente que el Valle de la Muerte en agosto [del hemisferio norte], es distribuirlos entre los racks.
"La mayoría de las aplicaciones no son de alta densidad. Funcionan con ocho a 10 kilovatios y hasta 15 kilovatios. Puede manejar eso con aire”, afirma David McCall, director de innovación de QTS, creador de centros de datos.
En un ambiente heterogéneo optimizado, un proveedor de colocación puede tener un bastidor o dos en un gabinete para alojar un ambiente HPC o AI, y el resto de los racks en el gabinete están dedicados a alojar aplicaciones que consumen menos energía, como bases de datos y aplicaciones de back office. Eso no producirá un rack de 5 kW, pero se acerca a un rack de 12 kW o 15 kW, que es un ambiente que puede soportar la refrigeración por aire, afirma McCall.
Controle el flujo de aire caliente en el centro de datos
El diseño estándar del centro de datos es el pasillo caliente/pasillo frío, donde los gabinetes están dispuestos en filas alternas de modo que las entradas de aire frío se enfrentan entre sí en un pasillo frontal, y las salidas de aire caliente se enfrentan entre sí en el pasillo alternativo, orientado hacia atrás. Eso funciona bien, pero el acceso puede ser complicado si un trabajador de TI necesita estar detrás de un gabinete para trabajar en un servidor.
El otro problema es que el aire es "desordenado”, como afirmó Sasser. La energía a menudo es más fácil de modelar porque fluye a través de conductores, y puede controlar (y, por lo tanto, planificar y modelar) dónde va la energía. El aire va a donde quiere y es difícil de controlar.
Los clientes de Sabey que desean ambientes de mayor densidad utilizan una cápsula de contención de pasillo caliente para controlar el flujo de aire. La compañía coloca puertas al final del pasillo caliente y placas de plástico en la parte superior, de modo que el calor se dirige a un tubo de entrada al techo y las barreras evitan que el aire caliente y el aire frío se mezclen.
"En un mundo de servidores refrigerados por aire, el consejo que doy es optar por un ambiente de contención de pasillo caliente”, afirma Sasser. "El otro consejo que daría es asegurarse de que el centro de datos no solo este modelado para el flujo de aire, sino que sea puesto a prueba. El modelado depende de muchas variables, y cambian fácilmente”.
Considere un gabinete de chimenea
Otra forma de ayudar a administrar las temperaturas en los centros de datos es usar un gabinete de chimenea. En lugar de ventilar el aire caliente por la parte posterior, un gabinete de chimenea utiliza una buena convección física para enviar aire caliente a una chimenea, que luego se conecta a una ventilación de aire acondicionado. Chatsworth Systems es mejor conocido por este estilo de gabinetes.
"La vía aérea está más restringida de esta manera”, afirma Sasser. "Dado que esa vía de aire está más restringida, puede obtener una mayor densidad en un gabinete que con una cápsula de pasillo caliente”.
Procesar los datos donde residen
Mover datos tiene un costo energético muy alto: puede llevar hasta cien veces más energía mover datos que procesar datos, afirma Conway. Cualquier forma de movimiento de datos requiere electricidad, y ese consumo de energía aumenta con el volumen de datos -un problema importante para las aplicaciones de inteligencia artificial intensivas en datos. "Usted querrá mover datos tan infrecuentemente y entre tan poca distancia como le sea posible”, afirma Conway.
"La solución es no tener que mover los datos más de lo absolutamente necesario. Por lo tanto, las personas se esfuerzan por acercar los datos al lugar donde se procesan. Una cosa en la que coinciden los proveedores de servicios en la nube y las personas que usan servicios en la nube, es que no tiene sentido mover una gran cantidad de datos a una nube de terceros”, afirma.
Considere alquilar espacio en el centro de datos
La mayoría de las compañías que buscan implementar IA son corporaciones que alquilan espacio de centro de datos de un operador de centro de datos, afirma Hollidge. Hay algunos operadores de centros de datos que no son capaces de manejar el cálculo de la IA de alta densidad, pero algunos han hecho la transición para ofrecer una parte de los ambientes de alta densidad para IA.
"Es posible que tenga que recurrir a algunos proveedores antes de encontrarlo, pero se presta más atención a eso en el lado de las operaciones del centro de datos”, afirma Hollidge. Y un proveedor de centro de datos externo le brinda más opciones de crecimiento. "La mayoría de las veces es mejor que celebre un contrato de arrendamiento flexible que le permita expandir y hacer crecer su negocio de IA en lugar de construirlo desde cero”.
Espere a los servidores de siguiente generación
Hasta la fecha, las supercomputadoras no han sido muy amigables con los datos, afirma Conway. A medida que las supercomputadoras se hicieron más grandes, los diseños se volvieron menos centrados en los datos. El resultado es que se deben mover y transferir más datos entre procesadores, memoria y sistemas de almacenamiento. Y como se discutió anteriormente, cuesta más poder mover datos que procesarlos.
Los primeros sistemas exascale vendrán con más aceleradores e interconexiones más potentes para mover datos. Y muchas innovaciones que comienzan en la supercomputación, incluidas las GPU y la memoria de clase de almacenamiento (SCM, por sus siglas en inglés), eventualmente llegan a servidores más convencionales.
Los servidores futuros también vendrán con un diseño de chip más heterogéneo; en lugar de todas las CPUs x86, incluirán GPUs, FPGAs y aceleradores de IA. Y para el almacenamiento de alta velocidad, NVMe-over-Fabric y SCM serán más asequibles. Se espera que los servidores cambien en los próximos años, y muchos de los avances beneficiarán a los ambientes de aplicaciones de inteligencia artificial empresariales.
Andy Patrizio, Network World