Llegamos a ustedes gracias a:



Noticias

Google saca de beta dos servicios de análisis de datos en nube

[14/08/2015] Dos conjuntos de herramientas para big data de Google finalmente han salido de beta y pasan a una versión comercial completa, añadiendo a su cartera de nube un marco de análisis de datos y un servicio para la gestión de los flujos de datos en tiempo real.

Google Cloud Dataflow, que podría servir como un posible reemplazo de Hadoop, proporciona un marco para la fusión de diferentes fuentes de datos dentro de un canal de procesamiento. Google Cloud Pub/Sub es el servicio de la empresa para la gestión de flujos de datos en tiempo real.

Los dos servicios completan la lista de herramientas de análisis de datos en la nube de Google y se unen a Google BigQuery, un servicio comercial para el análisis de grandes conjuntos de datos no estructurados.

Estos servicios requieren menos mantenimiento y supervisión operativa que los sistemas internos de procesamiento de datos, sostuvo Google en una entrada de blog el miércoles.

Estos servicios, al ser productos comerciales completos, se encuentran ahora plenamente integrados con la Google Cloud Platform, la colección de herramientas de Google para orquestar las operaciones basadas en la nube.

Los clientes han estado utilizando la Google Cloud Platform para tareas como la detección del fraude financiero, el análisis genómico, la gestión de inventarios, el análisis de click-stream y prueba de interacción del usuario.

Google Dataflow proporciona un modelo de programación unificado para el manejo de diferentes fuentes de datos, incluyendo tanto las fuentes de datos por lotes como las de streaming, eliminando la necesidad del complejo software ETL (extracción, transformación y carga).

Dataflow también puede servir como una alternativa más rápida para el cálculo de grandes cantidades de datos no estructurados, en comparación con el procesamiento por lotes de Hadoop, afirmó Google.

Salesforce.com utiliza Dataflow para aumentar la escala de su servicio de inteligencia de negocios Sales Wave, mientras que la firma de marketing digital Qubit lo utiliza para rastrear las interacciones del cliente en la web en tiempo real.

Google Cloud Pub/Sub puede servir como un sistema de mensajería, ofreciendo una vía para que los sistemas de análisis de datos funcionen desde un flujo de datos nuevos a medida que éstos se generan. Puede manejar hasta un millón de mensajes por segundo, a los cuales puede empujar hacia otros servicios de análisis de Google como Dataflow.

La versión beta del servicio ya ha entregado más de un billón de mensajes a los usuarios.

Pub/Sub se encuentra desde 0,40 dólares para los primeros 250 millones de mensajes, y sus costos se reducen con el incremento de su uso. El precio de Cloud Dataflow se basa en el número de trabajos, dependiendo del tiempo que requiere para completar una operación y la cantidad de datos que se deben mover.

Google también anunció que soporta distribuciones de Cloudera Hadoop en su nube. Los usuarios pueden ejecutar copias de Cloudera Express y las distribuciones de Cloudera Enterprise Hadoop en Google Cloud Platform.