Llegamos a ustedes gracias a:



Noticias

Teradata lanza plataforma de lago de datos al código abierto

[13/03/2017] Teradata lanzó su plataforma de software de gestión de lagos de datos a la comunidad de código abierto. El proyecto pretende ayudar a las organizaciones a afrontar los desafíos comunes de implementación de lagos de datos, incluyendo la falta de habilidades en ingenieros y administradores, aprendizaje y aplicación de mejores prácticas de gobernabilidad y llevar la adopción de los lagos de datos más allá de los ingenieros.

Teradata ofrece el nuevo proyecto Kylo de código abierto con licencia Apache 2.0 y planea ofrecer servicios y soporte para la plataforma.

Lagos de datos creados en Apache

Kylo evolucionó a partir del código desarrollado por la compañía Think Big Analytics de Teradata a lo largo de ocho años de compromisos con clientes Fortune 1000 en más de 150 proyectos de lagos de datos. Se creó usando capacidades de código abierto como Apache Hadoop, Apache Spark y Apache NiFi.

"El software de código abierto tiene un atractivo para los usuarios que buscan independencia, aprendizaje cooperativo, experimentación y flexibilidad para despliegues personalizados, afirmó Rick Farnell, presidente de Think Big, en un comunicado hoy.

Teradata afirma que los lagos de datos tardan demasiado en crearse, y en el ciclo de creación promedio de seis a 12 meses, los usuarios encuentran que a menudo los casos de uso quedan desfasados. Además, aunque los costos del software asociados con los lagos de datos pueden ser menores, Teradata afirma que los costos de ingeniería pueden crecer rápidamente. Cuando los lagos de datos se crean correctamente, los usuarios a menudo los encuentran difícil de explorar.

Gran valor de los datos y productividad

Teradata afirma que Kylo ayudará a las organizaciones a enfrentar estos desafíos, porque integra y simplifica el desarrollo de pipelines y las tareas comunes de la gestión de los datos. Esto significa que las organizaciones pueden aprovechar Kylo para lograr un time to value más rápido y una mayor adopción de los usuarios y productividad del desarrollador. Teradata afirma que Kylo no requiere de código, y ofrece una interfaz de usuario intuitiva que permite la ingesta de datos en autoservicio. Mientras tanto, las plantillas reutilizables ayudan a aumentar la productividad.

Una importante compañía de telecomunicaciones recientemente implementó Kylo luego de que un gran equipo de 30 ingenieros pasó meses escribiendo código manualmente para los pipelines de ingesta de datos. Con Kylo, una sola persona pudo ingestar, limpiar, perfilar y validar los mismos datos en menos de una semana, afirma Teradata.

El software, documentación y tutoriales de Kylo se encuentran ya disponibles mediante el sitio web del proyecto Kylo y vía el sitio web de GitHub.