Llegamos a ustedes gracias a:



Noticias

Cloudera presenta almacén in memory

Y capa de seguridad para Hadoop

[01/10/2015] Durante el desarrollo del Strata + Hadoop World en la ciudad de Nueva York, Cloudera dio a conocer un nuevo proyecto de código abierto para permitir aplicaciones analíticas en tiempo real en Hadoop, y una capa de seguridad de código abierto para la aplicación obligatoria de un control de acceso unificado en Hadoop.

El primer proyecto, Kudu, es un almacén en memoria para Hadoop que soporta lecturas y escrituras secuenciales y aleatorias de alto desempeño, lo que permite realizar una analítica rápida sobre los datos cambiantes.

La idea detrás de Kudu es dejar de forzar a los desarrolladores a elegir entre la analítica rápida con HDFS o actualizar los datos con HBase. Los intentos por combinar ambas cosas han generado arquitecturas complejas. Cloudera afirma que Kudu, un almacén actualizable y por columnas Hadoop, elimina la necesidad de tales arquitecturas complejas cuando se trata de casos como el análisis de series temporales, analítica de datos de máquina y reportes en línea.

Cloudera había diseñado Kudu conjuntamente con Intel para aprovechar mejor el hardware en memoria y la tecnología 3D XPoint de Intel. El proyecto también ha tenido el apoyo de organizaciones como Xiaomi, AtScale, Splice Machine y Zoomdata.

Una versión beta de Kudu ya se encuentra disponible bajo la licencia de código abierto de Apache, y Cloudera afirma que el proyecto pasará a la Apache Software Foundation en un futuro cercano.

Mientras tanto, RecordService, también disponible desde el lunes, es una nueva seguridad básica para Hadoop que proporciona la aplicación obligatoria del control de acceso unificado para Hadoop.

En la actualidad, cada motor de acceso de Hadoop aplica políticas de forma diferente: Algunos tienen restricciones más detalladas que otros. Apache Sentry es un proyecto de Apache que proporciona una administración de políticas unificada y basada en roles en Hadoop.

RecordService se basa en Apache Sentry. Se trata de una nueva capa que se encuentra entre los motores de almacenamiento y cómputo de Hadoop para hacer cumplir consistentemente los controles de acceso basados en roles definidos por Sentry. RecordService también ofrece enmascaramiento de datos dinámicos en Hadoop, protegiendo así a los datos sensibles cuando se accede a ellos.

RecordService ya se encuentra disponible en beta bajo la licencia Apache y Cloudera planea donar el proyecto a la Apache Software Foundation en el futuro.