Llegamos a ustedes gracias a:



Noticias

Yandex coloca como código abierto la biblioteca de CatBoost

[21/07/2017] El creador ruso de motores de búsqueda Yandex se ha unido a Google, Amazon y Microsoft al lanzar su propia biblioteca de aprendizaje de máquina de código abierto, CatBoost.

CatBoost, que tiene licencia de Apache, es para "la mejora gradual en código abierto de los árboles de decisión, de acuerdo con el archivo README de su repositorio en GitHub. Proporciona una manera de realizar clasificaciones y rankings de los datos usando un grupo de mecanismos de toma de decisiones, o "learners, en lugar de uno solo. Los resultados generados por los learners son ponderados y clasificados en base a las fortalezas y debilidades de cada aprendedor. Al combinar varios learners, CatBoost puede generar mejores resultados que los sistemas de toma de decisiones que se basan en learners individuales.

CatBoost viene con soporte para Python y R, así como con una interfaz de línea de comandos para manejar la biblioteca de aprendizaje de máquina. Los paquetes de Python para CatBoost también incluyen herramientas de visualización de datos para trazar estadísticas del proceso de entrenamiento. Los resultados se pueden ver en una notebook de Jupyter o en la propia aplicación de visor de datos de CatBoost.

Muchas bibliotecas de aprendizaje de máquina ya implementan alguna manera de algoritmo de mejora gradual. El paquete Scikit-learn de Python tiene una versión; XGBoost se encuentra disponible para varios lenguajes y plataformas de datos; y Microsoft tiene la biblioteca LightGBM como parte de su proyecto Distributed Machine Learning Toolkit.

CatBoost tiene como objetivo mantenerse alejado de estos proyectos, de acuerdo con Yandex, preajustándose para trabajar a escala para los propios servicios de Yandex. Yandex señaló que usa CatBoost para entregar predicciones para sus servicios del clima, y que CatBoost ha sido implementado en la European Organization for Nuclear Research (CERN) para refinar los resultados de los experimentos con partículas que se realizan ahí.

Los modelos entrenados y creados en CatBoost pueden implementarse en el formato Core ML de Apple, para usarlos en aplicaciones para MacOS, iOS, tvOS y watchOS, respaldadas con aprendizaje de máquina.