Llegamos a ustedes gracias a:



Noticias

QuantumBlack introduce un nuevo marco de trabajo de código abierto

[07/06/2019] QuantumBlack, el equipo de análisis de datos que McKinsey adquirió en el 2015 y que tiene sus raíces en el trabajo de datos para los equipos de carreras de Fórmula 1, ha publicado un nuevo marco de trabajo de código abierto que tiene como objetivo facilitar la construcción de canales de aprendizaje de máquinas para los científicos de datos.

La firma espera que el flujo de trabajo de desarrollo de código abierto, llamado Kedro, se convierta en un estándar de la industria para el código listo para la producción en el aprendizaje automático y la ciencia de datos.

Michele Battellli, director global de ingeniería y productos de QuantumBlack, explicó: "Kedro es una biblioteca de código que se puede utilizar para crear canales de aprendizaje de datos y máquinas -básicamente los bloques de construcción de lo que hacemos en un proyecto de análisis o de aprendizaje de máquinas.

"Cambia la forma en que los científicos e ingenieros de datos colaboran y trabajan en conjunto con grandes flujos de trabajo y conjuntos de datos, de modo que el resultado de su trabajo es algo que estará listo para la producción. En esencia, permite a los equipos colaborar más fácilmente porque se basan en un conjunto de reglas y una estructura en su código que es uniforme a lo largo del proyecto".

El marco fue desarrollado por los ingenieros Aris Valtazanos y Nikolaos Tsaousis hace varios años, junto con el antiguo jefe de producto de la empresa. Surgió porque los ingenieros estaban tratando de manejar múltiples flujos de trabajo al mismo tiempo, y nació un paquete prototipo de Python.

Sin embargo, la herramienta comenzó a ser recogida por otros equipos, y comenzó a ser utilizada en gran parte del trabajo de la empresa con los clientes. No solo el personal lo encontró útil internamente, sino que al buscar fuentes abiertas, la esperanza es que el marco de trabajo proporcione claridad a los clientes que desean comprender mejor, o basarse en, su trabajo en conjunto.

QuantumBlack surgió hace unos 10 años, en el espacio de la Fórmula 1, donde los fundadores de la empresa utilizaban una gran variedad de datos para mejorar el rendimiento con sus clientes a escala. Construyeron soluciones para los clientes, pero luego las transfirieron para que pudieran utilizar las herramientas de análisis de forma independiente.

Yetunde Dada, consultor senior de Kedro en QuantumBlack, explicó que la empresa decidió abrir el código como una forma de retribuir a sus clientes, después de que varios de ellos solicitaran acceso al software después de realizar proyectos con ellos.

Kedro se ha utilizado hasta ahora internamente en más de 50 proyectos en McKinsey y QuantumBlack. Tanto Dada como Battelli señalan el hecho de que ha sido construido de una manera que pretende ser agnóstica a la tecnología en toda la industria, así como fácilmente ampliable, por lo que si hay problemas en torno a la interoperabilidad, en teoría no debería ser una tarea demasiado agotadora para construir esos puentes.

La biblioteca incluye plantillas de proyectos fáciles de usar, así como capacidades de abstracción de datos y gestión de código que abordan la reproducibilidad en todos los entornos, la gestión de la configuración y la modularidad, de modo que los grandes fragmentos de código se pueden dividir en unidades autónomas más pequeñas. Y el equipo promete que es fácil de usar por personas no expertas, así como promover una cultura de desarrollo basado en pruebas dentro de las organizaciones.

"La asociación ofrece una propuesta única porque permite a los clientes aprovechar la mejor experiencia en la industria de KcKinsey, y con las técnicas de gestión del cambio, y la potencia analítica que QuantumBlack ofrece. Kedro está apuntalando el aspecto tecnológico de esta asociación", señaló Battelli.

Los siguientes pasos son, naturalmente, la toma de conciencia durante iniciativas como la participación en conferencias y reuniones, donde la empresa puede hablar más sobre el proyecto.

"Pero gran parte de ella se centra en la forma en que realmente impulsamos el uso de la biblioteca", añade Dada. "Algunas de las tácticas de uso incluyen la realización de talleres y webinars para conseguir que la gente use la biblioteca, también externamente.

"Los aspectos de construcción de la comunidad de Kedro son en realidad impulsados principalmente por esos embudos. Primero la conciencia, y luego tú buscas y nosotros podremos ver la contribución más adelante".

La biblioteca y la documentación de Kedro están disponibles en GitHub aquí.