Llegamos a ustedes gracias a:



Noticias

AWS anuncia servicio para la construcción de lagos de datos

[12/08/2019] Amazon Web Services (AWS) anunció la disponibilidad general de AWS Lake Formation, un servicio totalmente gestionado que aseguran facilita a los clientes la construcción, seguridad y gestión de lagos de datos.

"AWS Lake Formation simplifica y automatiza muchos de los pasos manuales complejos que normalmente se requieren para crear un lago de datos, incluyendo la recopilación, limpieza y catalogación de datos, y la puesta a disposición de los mismos para su análisis. Los clientes pueden llevar fácilmente sus datos a un lago de datos desde una variedad de fuentes utilizando plantillas predefinidas, clasificar y preparar automáticamente los datos, y definir de forma centralizada políticas de acceso a datos granulares para gobernar el acceso de los diferentes grupos dentro de una organización, señaló Raju Gulabani, vicepresidente de Bases de Datos, Analítica y Aprendizaje Automático de AWS.

El ejecutivo añadió que, los clientes pueden entonces analizar estos datos utilizando su elección de servicios de análisis de AWS y de aprendizaje de máquinas, incluyendo Amazon Redshift, Amazon Athena y AWS Glue, con Amazon EMR, Amazon QuickSight y Amazon SageMaker en los próximos meses. "No hay cargos adicionales requeridos para usar AWS Lake Formation, y los clientes pagan solo por los servicios subyacentes de AWS utilizados.

Los clientes desean poder realizar análisis y aprendizaje de la máquina en todos sus datos, independientemente del formato o del lugar en el que se encuentren. Gulabani explicó que un lago de datos elimina los silos de datos y permite que los datos residan en un lugar central para que los clientes puedan aplicar más fácilmente diferentes tipos de análisis y aprendizaje de máquinas en todos sus datos.

"Los clientes necesitan aprovisionar y configurar el almacenamiento, mover datos de fuentes dispares al lago de datos, y extraer el esquema y agregar etiquetas de metadatos para que sea accesible desde un catálogo de datos en el que se puedan realizar búsquedas. Para ello, los clientes deben limpiar y preparar los datos -incluyendo la partición, indexación y transformación de los datos- para optimizar el rendimiento y el costo que conlleva la ejecución de análisis sobre los datos. A continuación, deben configurar las funciones de acceso a los datos y aplicar políticas de seguridad en todo su almacenamiento y en cada uno de sus diferentes motores de análisis, y actualizar las políticas de seguridad cuando se modifican los permisos o se añaden nuevos usuarios finales. Y, finalmente, se requiere que los clientes pongan los datos a disposición de sus analistas de forma segura para que puedan analizar y procesar los datos utilizando cualquiera de los motores de análisis disponibles. Estos pasos requieren que los clientes realicen mucho trabajo manual y, como resultado, la mayoría de los clientes pueden tardar hasta varios meses en configurar un lago de datos, añadió el ejecutivo.

Continuó señalando que AWS Lake Formation simplifica el proceso y elimina el levantamiento pesado de la instalación de un lago de datos. "AWS Lake Formation automatiza los pasos manuales que consumen mucho tiempo, como el aprovisionamiento y la configuración del almacenamiento, el rastreo de los datos para extraer las etiquetas de esquemas y metadatos, la optimización automática de la partición de los datos y la transformación de los datos en formatos como Apache Parquet y ORC que son ideales para el análisis. AWS Lake Formation limpia y deduplica datos utilizando el aprendizaje automático para mejorar la consistencia y calidad de los datos.

Asimismo, para simplificar el acceso a los datos y la seguridad, Gulabani anotó que AWS Lake Formation proporciona un lugar único y centralizado para configurar y gestionar las políticas de acceso a los datos, el gobierno y la auditoría en Amazon S3 y en múltiples motores de análisis. "Para reducir el tiempo que los analistas y científicos de datos pasan buscando el conjunto de datos adecuado para sus necesidades, AWS Lake Formation proporciona un catálogo central y con capacidad de búsqueda que describe los conjuntos de datos disponibles y su uso comercial apropiado. Los clientes ahora pueden acceder fácilmente a los datos desde un solo lugar e integrarse con su elección de servicios de análisis de AWS y de aprendizaje de máquinas, incluyendo Amazon Redshift, Amazon Athena y AWS Glue, con Amazon EMR, Amazon QuickSight y Amazon SageMaker en los próximos meses. Con AWS Lake Formation los clientes pueden configurar y comenzar a utilizar un lago de datos en días en lugar de meses, finalizó Gulabani.

AWS Lake Formation está disponible hoy en día en US East (Ohio), US East (N. Virginia), US West (Oregon), Asia Pacific (Tokio), y Europa (Irlanda) con regiones adicionales próximamente.