Llegamos a ustedes gracias a:



Noticias

Microsoft amplía Azure Data Lake con nuevas herramientas de big data

[02/10/2015] Microsoft tiene su mirada puesta en ángulo recto hacia el big data cuando introdujo Azure Data Lake a principios de este año, y el lunes amplió ese esfuerzo con nuevas herramientas diseñadas para hacer más simple y más accesible el procesamiento y la analítica de big data.

En primer lugar, lo que Microsoft llamó originalmente Azure Data Lake ha cambiado de nombre a Azure Data Lake Store, que ofrece un único repositorio de datos de cualquier tamaño y tipo -incluidos los no estructurados, semiestructurados y estructurados- sin requerir cambios en las aplicaciones cuando cambie la escala de los datos.

Los datos pueden ser compartidos de forma segura allí y estar accesibles para su procesamiento y analítica. Se pueden conseguir en tiempo real de los sensores y dispositivos de las aplicaciones de la Internet de las Cosas (IoT, por sus siglas en inglés), por ejemplo, o de los sitios web de compras en línea, todo ello sin restricciones en la cuenta o el tamaño del archivo.

El almacén, disponible como vista previa desde finales de este año, es compatible con Hadoop Distributed File System (HDFS), por lo que las distribuciones de Hadoop como Hortonworks, MapR y Cloudera pueden acceder fácilmente a los datos para su procesamiento y analítica, afirmó Microsoft.

En segundo lugar, Azure Data Lake Analytics añade a la parte de almacenamiento de Azure Data Lake, un nuevo servicio de analítica dinámicamente escalable construido sobre Apache YARN que también estará disponible como vista previa a finales de este año.

El nuevo servicio de analítica incluye el lenguaje de consulta U-SQL, cuya capacidad de consulta escalable y distribuida permite a los usuarios analizar eficazmente los datos en el Azure Data Lake Store y en servidores SQL Server en Azure, Azure SQL Database y Azure SQL Data Warehouse, afirmó Microsoft.

Por último, Azure HDInsight de Microsoft se encuentra ahora incluido en Azure Data Lake, ofreciendo así un servicio de clúster Hadoop totalmente administrado con motores de analítica de código abierto como Hive, Spark, HBase y Storm. A partir del lunes, los clusters administrados en Linux pasan al estado de disponibilidad general con un acuerdo de nivel de servicio (SLA, por sus siglas en inglés) que especifica 99,9 % de uptime.

También soportan el Azure Data Lake, las Azure Data Lake Tools for Visual Studio, que proporcionan un entorno de desarrollo integrado que abarca el Azure Data Lake, y las principales aplicaciones de Hadoop de proveedores de software independientes que cubren la seguridad, el gobierno corporativo, la preparación de datos y la analítica, afirmó Microsoft.

Los detalles de los precios no estuvieron disponibles de inmediato.