Llegamos a ustedes gracias a:



Casos de éxito

JetBlue optimiza las operaciones de datos con el cambio a la nube

[18/11/2022] El sector de los viajes aéreos ha tenido que hacer frente a importantes cambios e incertidumbres a raíz de la pandemia de COVID-19. En el 2020, JetBlue Airways decidió que su ventaja competitiva dependía de las tecnologías de la información; en concreto, de la transformación de su pila de datos para consolidar las operaciones de datos, hacer operativa la información de los clientes, reducir los efectos posteriores de la meteorología y los retrasos, y garantizar la seguridad de los aviones.

"Ya en el 2020, el equipo de datos de JetBlue comenzó una transformación de varios años de la pila de datos de la empresa", señala Ashley Van Name, directora general de ingeniería de datos de JetBlue. "El objetivo era permitir el acceso a más datos casi en tiempo real, garantizar que los datos de todos los sistemas críticos estuvieran integrados en un solo lugar, y eliminar cualquier limitación de computación y almacenamiento que impidiera a los tripulantes crear productos analíticos avanzados en el pasado".

[Reciba lo último de CIO Perú suscribiéndose a nuestro newsletter semanal]

Antes de este esfuerzo, las operaciones de datos de JetBlue se centraban en un almacén de datos local que almacenaba información para un puñado de sistemas clave. Los datos se actualizaban diariamente o cada hora, dependiendo del conjunto de datos, pero eso seguía causando problemas de latencia de datos.

"Esto suponía una gran limitación", afirma Van Name. "Significaba que los miembros de la tripulación no podían crear productos de informes de autoservicio utilizando datos en tiempo real. Todos los informes operativos debían construirse sobre la capa de almacenamiento de datos operativos, que estaba muy protegida y limitada en la cantidad de computación que podía asignarse para la elaboración de informes".

La disponibilidad de los datos y el rendimiento de las consultas también eran problemas. El almacén de datos local era un sistema físico con una cantidad de almacenamiento y computación preaprovisionada, lo que significaba que las consultas competían constantemente con el almacenamiento de datos por los recursos.

"Dado que no podíamos impedir que los analistas consultaran los datos que necesitaban, no podíamos integrar en el almacén todos los conjuntos de datos adicionales que hubiéramos querido.

El sistema también estaba limitado a la ejecución de 32 consultas simultáneas, lo que creaba una cola de consultas diarias que contribuía a alargar los tiempos de ejecución de las mismas.

¿La respuesta? La compañía aérea con sede en Long Island City, Nueva York, decidió recurrir a la nube.

Motor de datos casi en tiempo real

JetBlue se asoció con el especialista en nube de datos Snowflake para transformar su pila de datos; en primer lugar, trasladando los datos de la empresa desde su sistema local heredado a la nube de datos Snowflake, lo que, según Van Name, alivió en gran medida muchos de los problemas más inmediatos de la empresa.

El equipo de datos de Jet Blue se centró entonces en la integración de conjuntos de datos críticos a los que los analistas no habían podido acceder anteriormente en el sistema local. El equipo puso a disposición de los analistas más de 50 fuentes de datos casi en tiempo real, que abarcaban el sistema de movimiento de vuelos de la aerolínea, el sistema de seguimiento de la tripulación, los sistemas de reservas, los gestores de notificaciones y los sistemas de facturación, entre otros. Los datos de estas fuentes están disponibles en Snowflake un minuto después de ser recibidos de los sistemas de origen.

"Aumentamos efectivamente nuestra oferta de datos en Snowflake a más del 500% de lo que estaba disponible en el almacén local", sostiene Van Name.

El viaje de transformación de datos de JetBlue no ha hecho más que empezar. Van Name anota que trasladar los datos a la nube es solo una pieza del rompecabezas: el siguiente reto es asegurar que los analistas tengan una forma fácil de interactuar con los datos disponibles en la plataforma.

"Hasta ahora, hemos hecho mucho trabajo para limpiar, organizar y estandarizar nuestra oferta de datos, pero todavía hay que avanzar", añade. "Creemos firmemente que una vez que los datos están integrados y limpios, el enfoque del equipo de datos debe cambiar a la curación de datos".

La curación de datos es fundamental para garantizar que los analistas de todos los niveles puedan interactuar con los datos de la empresa, indica Van Name, y añade que la construcción de tablas de "hechos" únicas y fáciles de usar que puedan responder a preguntas comunes sobre un conjunto de datos eliminará la barrera de entrada que JetBlue ha visto tradicionalmente cuando los nuevos analistas comienzan a interactuar con los datos.

Además de la elaboración de informes casi en tiempo real, los datos también sirven de entrada para los modelos de aprendizaje automático.

"Además de la curación de datos, hemos empezado a acelerar nuestras iniciativas internas de ciencia de datos", señala Sai Pradhan Ravuru, director general de ciencia de datos y análisis de JetBlue. "Durante el último año y medio, se ha puesto en marcha un nuevo equipo de ciencia de datos que ha estado trabajando con los datos en Snowflake para construir algoritmos de aprendizaje automático que proporcionan predicciones sobre el estado de nuestras operaciones, y también nos permiten aprender más sobre nuestros clientes y sus preferencias".

Ravuru indica que el equipo de ciencia de datos está trabajando actualmente en un producto de IA a gran escala para orquestar eficiencias en JetBlue.

"El producto está impulsado por modelos de datos curados de segundo grado construidos en estrecha colaboración entre los equipos de ingeniería de datos y ciencia de datos para refrescar los almacenes de características utilizados en los productos de ML", indica Ravuru. "Varios ecosistemas derivados de productos ML forman la base de una estrategia a largo plazo para alimentar a cada equipo de JetBlue con conocimientos predictivos".

Navegando por el cambio

JetBlue cambió a Snowflake hace casi dos años. Van Name dice que, en el último año, la adopción interna de la plataforma ha aumentado en casi un 75%, medida por los usuarios activos mensuales. También ha habido un aumento superior al 20% en el número de informes de autoservicio desarrollados por los usuarios.

Ravuru afirma que su equipo ha desplegado dos modelos de aprendizaje automático en producción, relacionados con la fijación de precios dinámicos y la personalización de clientes. La creación rápida de prototipos y la iteración están dando al equipo la capacidad de hacer operativos los modelos de datos y los productos de ML más rápidamente con cada despliegue.

"Además, los modelos de datos curados construidos de forma agnóstica a las latencias de consulta (es decir, consultas por segundo) ofrecen una solución flexible de almacén de características en línea para las API de ML desarrolladas por los científicos de datos y los ingenieros de IA y ML", afirma Ravuru. "Dependiendo de las necesidades, los datos se sirven, por tanto, en milisegundos o en lotes para utilizar estratégicamente los pipelines de streaming en tiempo real".

Aunque cada empresa tiene sus propios desafíos, Van Name cree que adoptar una mentalidad centrada en los datos es un bloque de construcción primario para apoyar el cambio a mayor escala. Es especialmente importante asegurarse de que el liderazgo entiende los desafíos actuales y las opciones tecnológicas en el mercado que pueden ayudar a aliviar esos desafíos, señala.

"A veces, es un reto tener una visión de todos los problemas de datos que existen dentro de una gran organización", anota Van Name. "En JetBlue, encuestamos anualmente a nuestros usuarios de datos para obtener su opinión en un foro oficial. Utilizamos esas respuestas para dar forma a nuestra estrategia y para comprender mejor en qué aspectos lo estamos haciendo bien y en cuáles tenemos oportunidades de mejora. Recibir opiniones es fácil; ponerlas en práctica es donde se puede hacer el verdadero cambio".

Van Name también señala que es esencial la colaboración directa con los líderes centrados en los datos de toda la organización.

"Su pila de datos es tan buena como el valor que aporta a los usuarios", señala. "Como líder de datos técnicos, puede dedicar tiempo a curar el mejor, más completo y preciso conjunto de información para su organización, pero si nadie lo está usando para tomar decisiones o mantenerse informado, prácticamente no tiene valor. Establecer relaciones con los líderes de los equipos que pueden hacer uso de los datos ayudará a aprovechar todo su valor".

Puede ver también: