Llegamos a ustedes gracias a:



Noticias

MapR 5.0 Hadoop soporta aplicaciones en tiempo real

[11/06/2015] Enfocándose en las aplicaciones en tiempo real, MapR Technologies presentó la versión 5.0 de su distribución Hadoop.

"Dieciocho por ciento de nuestros clientes tienen 50 o más aplicaciones corriendo en un solo clúster Hadoop, sostiene Jack Norris, chief marketing officer de MapR Technologies. "Eso significa que tienes que soportar la gestión de las cargas de trabajo y el multitenancy.

El nuevo release de MapR autosincroniza almacenamiento, base de datos e índices de búsqueda para soportar aplicaciones complejas en tiempo real, indica Norris. También incluye una auditoría completa de seguridad, soporte para Apache Drill y las más recientes características de Hadoop 2.7 y YARN.

Entre las nuevas características en MapR 5.0 se encuentran:

  • Ampliación del framework Reliable Data Transport, que se usa en la capacidad MapR-DB Table Replication para entregar y sincronizar datos en tiempo real para motores de cómputo externo. El primer motor de cómputo externo que MapR soporta es Elasticsearch. Este soporte permite que las búsquedas de texto completo se indexen automáticamente sin escribir código personalizado.
  • Soporte para Hadoop 2.7 y YARN 2.7 para habilitar nuevas características como las actualizaciones de YARN.
  • Más gobierno corporativo y seguridad, incluyendo auditoría completa para todos los accesos de datos vía archivos de logs en formato JSON. Esto permite reporte, validación y análisis con Apache Drill. El release también soporta Drill 1.x, incluyendo Drill Views. Esta característica entrega acceso seguro a datos a nivel de campo en los archivos.

Se espera que la nueva versión de MapR se encuentre disponible en 30 días.

Para que sea más sencillo desplegar clusters de Hadoop, MapR también ha presentado nuevas plantillas de auto aprovisionamiento que aplican conceptos definidos por software para dar a las organizaciones de la capacidad de desplegar un clúster con la comodidad similar a la de un appliance, sin la necesidad de hardware específico.

Los usuarios pueden desplegar MapR Auto-Provisioning Templates vía el MapR Installer, que proporciona autodiseño que optimiza la disposición de los servicios seleccionados y hardware; rack awareness que automáticamente distribuye servicios críticos entre dominios de falla; y checks de salud que evalúan los servidores para asegurarse que se desempeñarán óptimamente luego de la instalación.

Norris afirma que el módulo soportará el despliegue de las siguientes configuraciones:

  • Data Lake: Common Hadoop Services. Esta configuración incluye los servicios más comunes desplegados en un clúster Apache Hadoop, incluyendo YARN, MapReduce, Spark y Hive.
  • Data Exploration: Interactive SQL with Apache Drill. Esta configuración proporciona los servicios que necesitan los usuarios para realizar exploraciones interactivas de sus datos sin necesidad de esquemas.
  • Operational Analytics: NoSQL Database with MapR-DB. Esta configuración despliega la base de datos NoSQL distribuida de MapR, que permite aplicaciones HBase operativas para leer y escribir a tasas altas, y aplicaciones analíticas para realizar procesamiento de datos in situ.