Llegamos a ustedes gracias a:



Noticias

Jethro automatiza las tareas de ingeniería de datos para BI en Hadoop

[07/04/2017] Eli Singer, CEO de Jethro, proveedor de una solución de aceleración para inteligencia de negocios (BI, por sus siglas en inglés) interactiva en big data, afirma que, a pesar de su promesa, la BI en big data básicamente funciona mal porque SQL sobre Hadoop sigue siendo demasiado lenta.

"El enfoque actual para la BI sobre big data no funciona, afirmó Singer en una declaración el martes pasado. "Bajo la novedad de SQL en Hadoop se encuentran tasas de fracaso monumentales con los enfoques existentes.

Conozca a Jethro

La respuesta de Singer es Jethro 3.0, la versión más reciente de la solución empresarial de Jethro, un motor de consultas SQL para Hadoop que combina la arquitectura de indexación con "autocubos, cubos agregados generados a partir de patrones de uso. Las tareas de ingeniería de datos -como pre agregar tablas, crear cubos manualmente y mantenerse al día con las nuevas y cambiantes aplicaciones- tienden a ser costosas e intensivas en mano de obra.

Singer afirma que Jethro 3.0 automatiza estas tareas mediante la creación de cubos basada en las consultas reales de los usuarios, la indexación plena de todas las columnas de la tabla y la gestión de una caché inteligente de resultados de consultas.

Los autocubos de Jethro son microcubos generados automáticamente para patrones de consultas repetibles. Se actualizan incrementalmente con los nuevos datos. Mientras tanto, Jethro indexa automáticamente cada columna y agrega índices con los nuevos datos en lugar de actualizarlos, asegurando así un desempeño consistente de las consultas. Por último, la solución utiliza una memoria caché inteligente para volver a utilizar los resultados de las consultas comunes. La compañía afirma que el uso de la memoria caché inteligente es especialmente efectivo cuando los usuarios comparten paneles.

Los motores de SQL en Hadoop escanean plenamente miles de millones de filas de datos para cada consulta. Jethro evita esos escaneos completos -de todos los datos- que insumen mucho tiempo al aprovechar sus índices, cubos y memoria caché para procesar las consultas (para las herramientas de BI como Tableau, Qlik y Microstrategy) con menos esfuerzo y más velocidad, independientemente de la consulta, el tamaño del conjunto de datos o el número de usuarios concurrentes.

La nueva versión también cuenta con mejoras en las características de seguridad empresarial, incluyendo la autenticación Lightweight Directory Access Protocol (LDAP) y los permisos basados en roles. El motor también proporciona la capacidad de cargar directamente los datos desde tablas de Hadoop y una mejora en la interfaz gráfica de usuario de gestión.

"Desde que nos cambiamos a la plataforma de Jethro para nuestras necesidades de analítica de big data, hemos podido generar resultados de consultas consistentemente rápidos para nuestra gran base de usuarios concurrentes, afirmó Samik Mukherjee, jefe de Ingeniería de Tata Communications CDN, en un comunicado, el martes. "Nuestro lago de datos crece en miles de millones cada día. Jethro retira el trabajo duro de la reingeniería de datos para que podamos enfocarnos en otras aplicaciones críticas de negocio sabiendo que nuestros usuarios están generando inteligencia crítica y KPIs a través de Jethro que mejoran su toma de decisiones empresariales y, en definitiva, crece nuestra base de clientes.