Llegamos a ustedes gracias a:



Noticias

AWS anuncia el AWS Glue DataBrew

[16/11/2020] Amazon Web Services anunció la disponibilidad general del AWS Glue DataBrew, una nueva herramienta de preparación de datos visuales que aseguran permite a los clientes limpiar y normalizar los datos sin necesidad de escribir código.

"Desde el 2016, los ingenieros de datos han utilizado AWS Glue para crear, ejecutar y supervisar trabajos de extracción, transformación y carga (ETL). AWS Glue proporciona tanto interfaces basadas en código como visuales, y ha simplificado la extracción, orquestación y carga de datos en la nube para los clientes. Los analistas y científicos de datos han querido una forma más fácil de limpiar y transformar estos datos, y eso es lo que ofrece DataBrew, con un servicio que permite la exploración y experimentación de datos directamente desde los lagos de datos, almacenes de datos y bases de datos de AWS sin necesidad de escribir código, señaló Raju Gulabani, VP de Database y Analytics de AWS.  

AWS Glue DataBrew, añadió el ejecutivo, ofrece a los clientes más de 250 transformaciones preconstruidas para automatizar las tareas de preparación de datos (por ejemplo, filtrar anomalías, estandarizar formatos y corregir valores inválidos) que de otra manera requerirían días o semanas escribiendo transformaciones codificadas a mano. "Una vez preparados los datos, los clientes pueden empezar a utilizarlos inmediatamente con los servicios de análisis y aprendizaje automático de AWS y de terceros para consultar los datos y entrenar los modelos de aprendizaje automático. No hay compromisos ni costos iniciales para utilizar AWS Glue DataBrew, y los clientes solo pagan por crear y ejecutar transformaciones en los conjuntos de datos, indicó.

Gulabani explicó que AWS Glue DataBrew es una herramienta de preparación de datos visuales para AWS Glue, que permite a los analistas y científicos de datos limpiar y transformar los datos con una interfaz visual interactiva de apuntar y hacer clic, sin escribir ningún código. "Con AWS Glue DataBrew, los usuarios finales pueden acceder fácilmente y explorar visualmente cualquier cantidad de datos de su organización directamente desde su lago de datos del Servicio de Almacenamiento Simple de Amazon (S3), el almacén de datos de Amazon Redshift y las bases de datos del Servicio de Bases de Datos Relacionales de Amazon Aurora y Amazon (RDS).

Agregó que AWS Glue DataBrew recomienda pasos de limpieza y normalización de datos como filtrar anomalías, normalizar los datos a valores estándar de fecha y hora, generar agregados para análisis, y corregir datos inválidos, mal clasificados o duplicados. "Para tareas complejas como la conversión de palabras a una base común o palabra raíz (por ejemplo, convertir "anual" y "de un año" a "año"), AWS Glue DataBrew también proporciona transformaciones que utilizan técnicas avanzadas de aprendizaje de máquinas como el Procesamiento del Lenguaje Natural (PNL). Los usuarios pueden entonces guardar estos pasos de limpieza y normalización en un flujo de trabajo (llamado receta) y aplicarlos automáticamente a futuros datos entrantes, indicó el ejecutivo.

Si es necesario hacer cambios en el flujo de trabajo, sostuvo Gulabani, los analistas y científicos de datos simplemente actualizan los pasos de limpieza y normalización en la receta, y se aplican automáticamente a los nuevos datos a medida que llegan. "AWS Glue DataBrew publica los datos preparados en Amazon S3, lo que facilita a los clientes su uso inmediato en el análisis y el aprendizaje de la máquina. AWS Glue DataBrew no tiene servidor y está totalmente administrado, por lo que los clientes nunca necesitan configurar, aprovisionar o administrar ningún recurso de computación, finalizó Gulabani.

AWS Glue DataBrew está generalmente disponible hoy en día en EE.UU. Este (N. Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), UE (Irlanda), UE (Frankfurt), Asia Pacífico (Sydney), y Asia Pacífico (Tokio), y pronto estará disponible en otras regiones.