Llegamos a ustedes gracias a:



Noticias

Starburst Galaxy recibe actualizaciones de descubrimiento de datos

[30/11/2022] El proveedor de software de análisis Startburst señaló el martes que estaba añadiendo características de descubrimiento de datos a Startburst Galaxy, un servicio gestionado de motor de consulta Trino SQL.

Trino, anteriormente Presto SQL, es un motor de consulta SQL distribuido de código abierto para big data que permite a los usuarios consultar datos de múltiples fuentes de datos, incluyendo bases de datos NoSQL, dentro de una sola consulta.

[Reciba lo último de CIO Perú suscribiéndose a nuestro newsletter semanal]

Las actualizaciones, que se anunciaron en AWS re:Invent 2022, ayudarán a las empresas a agilizar el proceso tradicional de Extracción, Transformación y Carga (ETL, por sus siglas en inglés) para la curación de productos de datos, acelerando así la consulta, el acceso y el análisis de los datos, señaló Justin Borgman, presidente y director general de Starburst.

Estas nuevas funciones de descubrimiento, que se ofrecen como un servicio gestionado a través de Starburst Galaxy, abordan los retos asociados a los lagos de datos que se convierten en pantanos de datos, repletos de datos desorganizados que presentan importantes retos en cuanto a la accesibilidad y la capacidad de aprovechar los datos para obtener información procesable.

De acuerdo al ejecutivo, las nuevas funciones están diseñadas para reducir el tiempo de descubrimiento de horas a segundos, y para sentar las bases de la curación de productos de datos de autoservicio, independientemente de los conocimientos técnicos.

La proliferación de dispositivos IoT ha contribuido en gran medida al problema de desorganización de datos al que se enfrentan las empresas de todo el mundo. Se espera que haya 55.700 millones de dispositivos IoT conectados para el 2025, lo que generará casi 80 zettabytes de datos (el equivalente a mil millones de terabytes, o un billón de gigabytes), según IDC.

"Al permitir que las organizaciones descubran de forma más eficiente los conjuntos de datos adecuados, Starburst Galaxy está ayudando a reducir los costos a la vez que obtiene más valor de sus datos", anotó Borgman.

Nuevas funciones para facilitar la creación de productos de datos de autoservicio

Las nuevas funciones, que la empresa espera que ayuden a las empresas a crear productos de datos de autoservicio, incluyen el descubrimiento de datos, el descubrimiento de esquemas y el control de acceso granular.

Como su nombre indica, la función de descubrimiento de datos ayuda a encontrar el conjunto de datos buscado y su ubicación. La función permite rellenar automáticamente los metadatos con el historial de consultas y el contexto, proporcionando información clave sobre cómo se utilizan los datos, según la empresa.

El descubrimiento de esquemas, por su parte, tiene como objetivo eliminar el aspecto de "transformación" del proceso ETL. Esta función permitirá a las empresas descubrir los conjuntos de datos existentes en todas las fuentes junto con los nuevos conjuntos de datos, independientemente de su ubicación, indicó Starburst.

Esto significa que los ingenieros de datos que cargan datos no necesitan considerar los esquemas de antemano, añadió la empresa.

La nueva función de control de acceso granular (GAC, por sus siglas en inglés) está diseñada para permitir a los administradores de datos de la empresa ver y entender quién tiene acceso a qué datos y cómo se están utilizando, indicó Starburst, añadiendo que esto permite a los administradores cambiar los permisos a través de la política como código para garantizar la seguridad y la reducción de riesgos dentro de una tubería de despliegue continuo.

Starburst Galaxy está disponible actualmente en AWS, Microsoft Azure y GCP con distintos planes de precios.

Las actualizaciones de Starburst Galaxy se producen un año después de que la empresa añadiera productos de datos a su plataforma de datos y análisis empresariales, denominada Starburst Enterprise. En septiembre, la empresa añadió nuevas capacidades a la plataforma para facilitar la analítica entre nubes.

Además, en re:Invent 2022, la compañía anunció el apoyo a la implementación de la arquitectura de malla de datos para AWS Lake Formation, un servicio para crear lagos de datos, a través de Starburst Enterprise.

El concepto de malla de datos abarca la gestión descentralizada y el gobierno de datos heterogéneos y distribuidos. El objetivo de la arquitectura de malla de datos es permitir la gestión y el análisis de los datos independientemente de dónde residan: en las instalaciones, en la nube pública o en entornos multicloud, o en bases de datos SQL o NoSQL.

Como parte del apoyo, Starburst ayudará a sus clientes conjuntos con AWS a implementar los aspectos técnicos de la malla de datos, dijo la compañía, añadiendo que esto ayudará a las empresas a generar el máximo valor de los despliegues híbridos.