Llegamos a ustedes gracias a:



Noticias

Oracle Cloud Infrastructure pone disponible las GPU NVIDIA A100 en la nube

[25/09/2020] Oracle anunció que está haciendo que la GPU NVIDIA A100 Tensor Core esté disponible de forma generalizada en instancias sin sistema operativo (bare metal). Las últimas instancias de GPU de Oracle permiten a los clientes de industrias como la automotriz y la aeroespacial ejecutar aplicaciones complejas, intensivas en datos y de alto rendimiento, como el modelado y las simulaciones, de manera más eficiente y al costo más bajo jamás alcanzado. Empiece aquí.

"Oracle Cloud Infrastructure, que ejecuta las GPU NVIDIA A100 Tensor Core en instancias sin sistema operativo, puede ejecutar modelos de inteligencia artificial complejos y sistemas de aprendizaje profundo entre 2,5 a 6 veces más rápidos que las instancias con generaciones de GPU anteriores. Cuando se ejecuta en Oracle Cloud, la nueva GPU A100 puede ayudar a las empresas a obtener más valor de sus datos e innovar más rápido, lo que permite avances importantes como probar y desarrollar nuevos medicamentos, construir aviones más seguros y obtener recursos naturales rápidamente. Además, los clientes pueden ejecutar por primera vez sus complejas aplicaciones HPC utilizando GPUDirect sobre la red NVIDIA Mellanox RDMA, que permite que grupos de miles de GPU, conectadas con una latencia de microsegundos, proporcionen una enorme potencia computacional bajo demanda, señaló Karan Batta, vicepresidente de Oracle Cloud Infrastructure.

"La computación acelerada es esencial para impulsar los avances en la investigación para empresas de todas las industrias, indicó, por su parte, Ian Buck, gerente general y vicepresidente de Computación Acelerada en NVIDIA. "Al incorporar las GPU NVIDIA A100 Tensor Core a su servicio en la nube y ofrecer la capacidad de escalar a más de 500 GPU interconectadas con redes Mellanox, Oracle proporciona el desempeño computacional necesario para acelerar el trabajo más crítico que se realiza hoy en día en inteligencia artificial y la computación de alto rendimiento.

GPUs NVIDIA A100 Tensor Core ejecutándose en Oracle Cloud Infrastructure

Según Batta, la nueva instancia sin sistema operativo, GPU4.8, cuenta con ocho GPUs NVIDIA A100 Tensor Core con 40 GB de memoria cada una, todas interconectadas a través de NVIDIA NVLink. La CPU instalada tiene 64 núcleos físicos de procesadores AMD Rome que se ejecutan a 2,9 GHz con el apoyo de 2.048 GB de RAM y 24 TB de almacenamiento NVMe. "La nueva instancia de GPU sin sistema operativo de Oracle se une a la arquitectura Cluster Network de alta velocidad y baja latencia, lo que permite a los clientes crecer a más de 500 clústeres de GPU con NVIDIA Mellanox RDMA over Converged Ethernet (RoCE) para cargas de trabajo distribuidas de gran escala que requieren RDMA y proporcionan hasta 1,6 TB de ancho de banda por nodo sin sistema operativo.

Además de la instancia sin sistema operativo, añadió el ejecutivo, las organizaciones podrán implementar una, dos o cuatro GPUs por máquina virtual en los próximos meses. "Estas formas de instancia también darán a los clientes acceso a todos los conjuntos de herramientas existentes, como las máquinas virtuales preconfiguradas Data Science optimizadas para GPU, para ejecutar cualquier contenedor HPC o de aprendizaje profundo de NVIDIA NGC, un hub de contenedores, modelos y SDKs específicos para cada industria y nativos de la nube, indicó Batta.

Expansión del ecosistema de GPU

Como parte de las noticias, Oracle anunció imágenes, stacks de soluciones, y servicios que amplían la capacidad de los usuarios para extraer valor de sus datos, que incluyen:

  • AI Engineered MLOps Solution Stack: Automatiza el flujo de trabajo de un extremo a otro mediante Apache Airflow creando instancias en un clúster de formas NVIDIA A100 sin sistema operativo para entrenamiento e inferencia distribuidos.
  • Media Ops Packaged Solution Stacks: Automatiza los flujos de trabajo aprovechando el marco de Apache Airflow para operar una fuente de operaciones de medios autogestionada en Oracle Cloud. Esto mejora la capacidad de los clientes para comprimir, empaquetar y distribuir contenido.
  • Cloud Native MLOps Orchestration Package: Permite a los científicos de datos centrarse en la innovación mediante el uso de Kubeflow de código abierto junto con imágenes diseñadas por Oracle Cloud Infrastructure y la imagen de nube NGC para automatizar el movimiento de los datos y la creación de instancias de cómputo.
  • Julia AI HPC Image: Stack de automatización para imágenes de HPC diseñadas con Julia instalada con Jupyter Notebook y el entorno de desarrollo IJulia que se ha probado y optimizado para las GPU NVIDIA A100. Junto con la tecnología de GPU de instancias múltiples NVIDIA A100 y las formas Oracle HPC, el entorno está demostrando ser más rápido que los sistemas más antiguos con Python.
  • Ciencia de datos e imágenes de inteligencia artificial preconfiguradas: Incluye las bibliotecas Deep Neural Network de NVIDIA, marcos de aprendizaje profundo/aprendizaje automático comunes, Jupyter Notebooks y ambientes de desarrollo integrados comunes de Python/R. Disponible en Oracle Cloud Marketplace.