Llegamos a ustedes gracias a:



Noticias

MLflow es ahora un proyecto de la Fundación Linux

[26/06/2020] Databricks, la compañía detrás del desarrollo comercial de Apache Spark, está colocando su proyecto de ciclo de vida de aprendizaje automático MLflow bajo la administración de la Fundación Linux.

MLflow proporciona una forma programática para tratar con todas las piezas de un proyecto de aprendizaje de máquina a través de todas sus fases -construcción, capacitación, ajuste, despliegue, gestión y revisión. Rastrea y gestiona los conjuntos de datos, instancias del modelo, parámetros del modelo y algoritmos utilizados en los proyectos de aprendizaje automático, de modo que pueden ser versionados, almacenados en un repositorio central y reempaquetados fácilmente para su reutilización por otros científicos de datos.

El código fuente de MLflow ya está disponible bajo la licencia de Apache 2.0, por lo que no se trata de un proyecto de código abierto previamente propietario. En su lugar, se trata de dar al proyecto "un hogar neutral de proveedores con un modelo de gobierno abierto", según el comunicado de prensa de Databricks.

En los últimos dos años, se han desarrollado proyectos para la gestión de conductos completos de aprendizaje de máquinas, que proporcionan herramientas únicas y generales para gobernar lo que normalmente es un proceso extenso y complejo que implica múltiples partes móviles. Entre ellos se encuentra un proyecto de Google, Tensorflow Extended, pero más conocido es su proyecto descendiente Kubeflow, que utiliza Kubernetes para gestionar conductos de aprendizaje automático.

MLflow difiere de Kubeflow en varios aspectos clave. Por un lado, no requiere Kubernetes como componente; se ejecuta en máquinas locales mediante simples scripts de Python, o en el entorno alojado de Databricks. Y mientras que Kubeflow se centra en TensorFlow y PyTorch como sus sistemas de aprendizaje, MLflow es agnóstico - puede trabajar con modelos de esos frameworks y muchos otros.