Llegamos a ustedes gracias a:



Noticias

AWS anuncia la disponibilidad general de las instancias del EC2 P4d

Con la capacidad de los UltraClusters EC2

[05/11/2020] Amazon Web Services, Inc. (AWS), una compañía de Amazon.com, anunció la disponibilidad general de las instancias P4d de Amazon Elastic Compute Cloud (Amazon EC2), la próxima generación de instancias potenciadas por la GPU que señalan ofrecen un rendimiento tres veces más rápido, hasta un 60% menos de costo y 2,5 veces más de memoria de GPU para la formación de aprendizaje de máquina y cargas de trabajo de computación de alto rendimiento (HPC) en comparación con las instancias P3 de la generación anterior.

"Las instancias P4d cuentan con ocho GPU NVIDIA A100 Tensor Core y 400 Gbps de ancho de banda de red (16 veces más que las instancias P3). Al utilizar las instancias P4d con el adaptador de tejido elástico (EFA) de AWS y la RDMA (acceso directo a la memoria remota) de NVIDIA GPUDirect, los clientes pueden crear instancias P4d con la capacidad de los UltraClusters EC2. Con los EC2 UltraClusters, los clientes pueden escalar las instancias P4d a más de 4.000 GPU A100 (dos veces más que cualquier otro proveedor de nubes) haciendo uso de la infraestructura de red a escala de petabits sin bloqueo diseñada por AWS e integrada con Amazon FSx para el almacenamiento de alto rendimiento de Lustre, lo que ofrece acceso bajo demanda a un rendimiento de supercomputación para acelerar la formación en el aprendizaje de la máquina y el HPC, señaló Dave Brown, vicepresidente de EC2 de AWS.

Comentó que el mayor rendimiento de las instancias de P4d acelera el tiempo de entrenamiento de los modelos de aprendizaje automático hasta tres veces (reduciendo el tiempo de entrenamiento de días a horas) y la memoria adicional de la GPU ayuda a los clientes a entrenar modelos más grandes y complejos.

"A medida que los datos son más abundantes, los clientes están entrenando modelos con millones y a veces miles de millones de parámetros, como los utilizados para el procesamiento del lenguaje natural para el resumen de documentos y la respuesta a preguntas, la detección y clasificación de objetos para vehículos autónomos, la clasificación de imágenes para la moderación de contenidos a gran escala, los motores de recomendación para sitios web de comercio electrónico y los algoritmos de clasificación para motores de búsqueda inteligentes, todos los cuales requieren un aumento de la velocidad de la red y de la memoria de la GPU, sostuvo Brown.

Añadió que las instancias de P4d cuentan con 8 GPU de núcleo tensor A100 de NVIDIA, capaces de alcanzar hasta 2,5 petaflops de rendimiento de precisión mixta y 320GB de memoria de GPU de gran ancho de banda en una instancia de EC2. "Las instancias P4d son las primeras del sector en ofrecer 400 Gbps de ancho de banda de red con un adaptador de tejido elástico (EFA) e interfaces de red NVIDIA GPUDirect RDMA para permitir la comunicación directa entre las GPU a través de los servidores para una menor latencia y una mayor eficiencia de escalado, ayudando a desbloquear los cuellos de botella de escalado a través de cargas de trabajo distribuidas en varios nodos. Cada instancia de P4d también ofrece 96 vCPU Intel Xeon escalables (Cascade Lake), 1,1TB de memoria del sistema y 8TB de almacenamiento NVMe local para reducir los tiempos de formación en un solo nodo.

"Al duplicar con creces el rendimiento de la generación anterior de instancias P3, las instancias P4d pueden reducir el costo de formación de los modelos de aprendizaje de máquinas hasta en un 60%, proporcionando a los clientes una mayor eficiencia frente a los sistemas caros e inflexibles on-premises. Los clientes de HPC también se beneficiarán del mayor rendimiento de procesamiento de P4d y de la memoria de la GPU para cargas de trabajo exigentes como el análisis sísmico, el descubrimiento de fármacos, la secuenciación de ADN, la ciencia de los materiales y el modelado de riesgos financieros y de seguros, anotó Brown.

El ejecutivo añadió que las instancias P4d también están construidas sobre el AWS Nitro System, hardware y software diseñado por AWS que ha permitido a AWS ofrecer a sus clientes una selección cada vez más amplia de instancias y configuraciones del EC2. "Las instancias P4d descargan las funciones de red a tarjetas Nitro dedicadas que aceleran la transferencia de datos entre múltiples instancias P4d. Las Nitro Cards también permiten EFA y GPUDirect, lo que permite una comunicación directa entre servidores entre las GPU, facilitando una menor latencia y un mejor rendimiento de escalado en los UltraClusters EC2 de las instancias P4d. Estas capacidades potenciadas por la tecnología Nitro hacen posible que los clientes lancen P4d en los EC2 UltraClusters con acceso bajo demanda y escalable a más de 4.000 GPU para un rendimiento de clase supercomputadora, finalizó el ejecutivo.