Llegamos a ustedes gracias a:



Noticias

Microsoft presenta un avance de la API de clasificación de textos para ML.NET

[16/06/2022] Microsoft ha presentado una vista previa de la API de clasificación de texto de ML.NET, una API destinada a facilitar el entrenamiento de modelos de clasificación de texto personalizados mediante el marco de aprendizaje automático de código abierto ML.NET.

Presentada el 14 de junio, la API de clasificación de textos de ML.NET utiliza técnicas de aprendizaje profundo "de última generación", señaló Microsoft. ML.NET permite a los desarrolladores integrar modelos de aprendizaje automático personalizados en aplicaciones .NET. La clasificación de textos es el proceso de aplicar etiquetas o categorías al texto. Los casos de uso más comunes incluyen la clasificación del correo electrónico como spam o no spam, el análisis del sentimiento como positivo o negativo de los comentarios de los clientes, y la aplicación de etiquetas a los tickets de soporte.

La API de clasificación de textos de ML.NET está impulsada por la biblioteca TorchSharp .NET, que proporciona acceso a la biblioteca libtorch que impulsa el marco de aprendizaje automático PyTorch. TorchSharp tiene capacidades de bajo nivel para entrenar redes neuronales desde cero en .NET. Para ML.NET, parte de la complejidad de TorchSharp se ha abstraído para facilitar este entrenamiento.

En colaboración con Microsoft Research, Microsoft tomó la implementación de TorchSharp de NAS-BERT (Bidirectional Encoder Representations from Transformers), una variante de BERT obtenida con la búsqueda de arquitectura neuronal, y la añadió a ML.NET. Partiendo de una versión preentrenada de este modelo, la API de clasificación de textos utiliza los datos del usuario para afinar el modelo existente en lugar de construir un nuevo modelo desde cero.

La API de clasificación de textos forma parte de las versiones preliminares 2.0.0 y 0.20.0 de ML.NET. Además del paquete Microsoft.ML, requiere Microsoft.ML.TorchSharp y TorchSharp-cpu (si se utiliza una CPU) o TorchSharp-cuda-windows o TorchSharp-cuda-linux (si se utiliza una GPU).

Los desarrolladores pueden utilizar el gestor de paquetes NuGet en Visual Studio o la CLI de .NET para instalar los paquetes. Se pueden encontrar ejemplos de código de la API en el Text Classification API Notebook.

Microsoft ha señalado que todavía existen limitaciones en la API, como la imposibilidad de utilizar el método Evaluate para calcular las métricas de evaluación. Se han previsto mejoras en la API junto con la introducción de otras API basadas en escenarios.