Llegamos a ustedes gracias a:



Noticias

Amazon quiere analizar datos en tiempo real con Kinesis

[26/12/2013] Amazon Web Services espera que las empresas confíen en la compañía cuando tengan grandes cantidades de datos para analizar con su más reciente servicio, Kinesis.
Kinesis primero estuvo disponible como preview limitada el mes pasado, pero ahora se encuentra disponible como beta pública. Es un servicio gestionado que ha sido diseñado para manejar flujos de datos en tiempo real. Puede recolectar y procesar grandes cantidades de datos, de cualquier número de fuentes, incluyendo logs de servidores y flujos de medios sociales, de acuerdo a Amazon.
El discurso es el mismo que el de otros servicios alojados de Amazon. En este caso, las empresas no tienen que preocuparse por el aprovisionamiento, despliegue y mantenimiento del hardware y software para capturar y almacenar datos en tiempo real. Kinesis también replica la información en tres instalaciones en una región, para mejorar la disponibilidad y la durabilidad de los datos.
Amazon ve varios casos de uso para Kinesis; el servicio puede recolectar datos generados por una aplicación y ponerlos a disposición para identificar queries lentos, vistas de página o utilización de recursos. Kinesis también puede recolectar y analizar información financiera en tiempo real o ayudar a los desarrolladores de juegos para que vean cómo los jugadores interactúan con su juego y entre ellos.
El concepto básico de Kinesis es un flujo de datos que es alimentado al servicio y luego sacado de él. Cada flujo está conformado por lo que Amazon llama shards. Ellos pueden capturar hasta 1MB de datos y mil transacciones por segundo. Las aplicaciones que se encuentran enlazadas con el servicio puede leer los datos desde los shards a una velocidad de hasta 2MB por segundo.
Decidir el número de shards que se necesitan es el primer paso del proceso de configuración, y la consola de Kinesis incluye un wizard para ayudar con ello. Si un flujo tienen la capacidad necesaria para manejar toda la información enviada, los datos o son demorados o descartados. El personal de TI puede cambiar el tamaño de un flujo al unir o separar shards mientras que se está usando el flujo. Para un flujo dado, cada cambio requiere de unos cuantos segundos, y solo se puede hacer un cambio a la vez, de acuerdo a un conjunto de preguntas frecuentes publicadas por Amazon.
Otro importante componente del servicio es la Kinesis Client Library, la cual actúa como un intermediario entre la aplicación de negocio que tiene la lógica necesaria para procesar los datos, y el propio servicio de Kinesis. Cada aplicación de Kinesis tiene un nombre único y opera en un flujo específico. La librería de clientes se encuentra disponible en Java, pero Amazon está planeando agregar soporte para otros lenguajes.
El costo de Kinesis depende del número de transacciones, las cuales pueden ser de hasta 50KB, alimentado al servicio y el número de shards utilizados. Un millón de transacciones cuesta 0,028 dólares y cada shard cuesta 0.015 dólares por hora. Por ahora, Kinesis se encuentra disponible en la región U.S. East (Northern Virginia).
Mikael Ricknäs, IDG News Service