Llegamos a ustedes gracias a:



Noticias

Startup reúne OLTP, OLAP y Spark

[03/05/2016] Los tres principios detrás de la creación de la grilla de datos en memoria GemFire de Pivotal, anunciaron hoy que su nueva startup ha asegurado 3,65 millones de dólares de financiamiento serie A, liderado por Pivotal, GE Ventures y GTD Capital.

La startup, SnappyData, ha desarrollado una base de datos analítica, transaccional, híbrida y en memoria que reúne OLTP, OLAP y Spark de Apache para aliviar el dolor de los clientes que hasta ahora han tenido juntos los ambientes personalizados de streaming, transaccionales y de analítica.

La plataforma de código abierto de SnappyData proporciona un motor unificado para la analítica operativa en tiempo real, que cubre las tecnologías de analítica de streams y modelamiento de datos dobles de OLTP y OLAP en un único clúster integrado. Sudhir Menon, fundador y Presidente de SnappyData -junto con Richard Lamb y Jags Ramnarayanan- afirma que la plataforma aprovecha el approximate query processing (AQP), que utiliza técnicas de aprendizaje de máquina para comprender los tipos de consultas que un usuario podría hacer al sistema para crear muestras de datos que puedan mejorar drásticamente el rendimiento de las consultas.

"No solo podemos ejecutar estas consultas muy, muy rápido, también podemos proporcionar estimaciones exactas del error, afirmó Menon. "Las muestras se actualizan a medida que los datos cambian. Estamos resolviendo el problema del rendimiento para que uno pueda ejecutar más consultas y obtener más insights, más rápido.

Menon señaló que la solución fusiona la fortaleza computacional en big data del diseño en memoria de Apache Spark y la arquitectura única de "nada compartido que elimina los puntos únicos de falla, mientras que al mismo tiempo entrega un muy alto rendimiento basándose en Pivotal GemFire. Además de abordar el tema del rendimiento, la solución aborda la complejidad y disminuye el costo total de propiedad proporcionando una base de datos concurrente, en memoria construida directamente en Spark.

La plataforma de SnappyData es un cluster de base de datos único, unificado, de escala que ingesta conjuntos de datos estáticos (por ejemplo, de HDFS), adquiere datos de referencia actualizables de bases de datos empresariales y maneja streams en memoria, mientras que al mismo tiempo permite tanto una analítica continua de SQL en los streams como consultas interactivas sobre el conjunto de datos completo (adquirida de streams, HDFS o bases de datos empresariales). SnappyData logra este objetivo mediante una profunda integración de Apache Spark, como marco computacional, y GemFire, como almacén transaccional en memoria.

Para asegurar tiempos de respuesta interactiva, el motor de consultas de SnappyData está equipado con las más avanzadas técnicas AQP y una variedad de sinopsis de datos para asegurar la analítica interactiva sobre grandes conjuntos de datos de streaming o por lotes.

Menon afirma que la idea básica detrás de AQP es que uno pueda utilizar técnicas de muestreo estadísticas y estructuras de datos probabilísticas para responder a las consultas de tipo agregado sin necesidad de almacenar o manejar todo el conjunto de datos. El enfoque intercambia la precisión de las consultas por tiempos de respuesta más rápidos, permitiendo que las consultas se ejecuten en grandes conjuntos de datos con información de error significativa y precisa.

"SnappyData se creó en respuesta al continuo crecimiento y demanda de cargas de trabajo mixtas - y con ello, la tarea costosa y que consume tiempo de unir múltiples soluciones, afirmó Leo Spiegel, vicepresidente senior de desarrollo corporativo y estrategia de Pivotal, en un comunicado hoy. "Estamos muy contentos de apoyar el éxito de SnappyData.

Thor Olavsrud, CIO (EE.UU.)