Llegamos a ustedes gracias a:



Noticias

Azure Databricks presenta el motor de consulta de vectorial

[29/09/2020] Microsoft ha revelado un avance de un motor de consulta vectorial basado en C++ para el servicio de análisis de nubes y de IA de Azure Databricks basado en Apache Spark. Azure Databricks, que se entrega en asociación con Databricks, presentó el motor Delta alimentado por fotones el 22 de septiembre.

Escrito en C++ y compatible con las APIs de Spark, Photon es un motor de consultas vectorizadas que aprovecha la moderna arquitectura de la CPU y la capa de almacenamiento transaccional de código abierto de Delta Lake para mejorar el rendimiento de Apache Spark 3.0 hasta en 20 veces. Microsoft dijo que a medida que las organizaciones adoptan la toma de decisiones basada en datos, es ahora imperativo que tengan una plataforma que pueda analizar rápidamente cantidades y tipos de datos masivos.

Photon ofrece un mayor paralelismo del procesamiento de la CPU a nivel de datos e instrucciones. Otros componentes del Motor Delta incluyen un optimizador de consultas mejorado y una capa de caché. La combinación de estas tecnologías impulsa grandes casos de uso de datos, incluyendo la ingeniería de datos, el aprendizaje de máquina, la ciencia de los datos y el análisis de datos.

El objetivo de Azure Databricks es permitir a los usuarios configurar rápidamente entornos optimizados de Apache Spark. Ofrece integración nativa con el Directorio Activo Azure y otros servicios de la nube Azure como Azure Synapse Analytics y Azure Machine Learning, con clientes capaces de construir almacenes de datos de extremo a extremo, aprendizaje automático y soluciones analíticas en tiempo real. Los usuarios pueden solicitar el acceso a la vista previa de Photon rellenando un cuestionario.