Llegamos a ustedes gracias a:



Noticias

Google pone como código abierto las herramientas de entrenamiento de TensorFlow

[27/06/2017] Durante el año pasado, Google TensorFlow se ha afirmado como una herramienta de código abierto popular para el aprendizaje profundo. Pero entrenar a un modelo de TensorFlow puede ser engorroso y lento -especialmente cuando la misión es tomar un conjunto de datos utilizado por otra persona y tratar de refinar el proceso de entrenamiento que usa. El número de piezas móviles y las variaciones en cualquier proceso de entrenamiento de modelos es suficiente para hacer que incluso los expertos en aprendizaje profundo respiren hondo.

Esta semana, Google puso como código abierto un proyecto para reducir la cantidad de trabajo en la configuración de un modelo de aprendizaje profundo para entrenamiento. Tensor2Tensor, o T2T para abreviar, es una biblioteca de organización del flujo de trabajo basada en Python para los trabajos de entrenamiento en TensorFlow. Permite a los desarrolladores especificar los elementos claves usados en un modelo de TensorFlow y definir las relaciones entre ellos.

Estos son los elementos clave:

  • Conjuntos de datos: T2T tiene soporte incorporado para varios conjuntos de datos comunes utilizados para entrenamiento. Uno puede añadir nuevos conjuntos de datos a sus flujos de trabajo individuales, o agregarlos al proyecto T2T base mediante una solicitud de extracción.
  • Problemas y modalidades: Éstas describen para qué tipo de tarea es el entrenamiento, como el reconocimiento de voz versus la traducción automática, y qué tipos de datos esperar para ella y generar de ella. Por ejemplo, un sistema de reconocimiento de imágenes utilizaría imágenes y devolvería etiquetas de texto.
  • Modelos: Muchos modelos utilizados comúnmente ya están registrados con T2T, pero puede agregar más.
  • Hiperparámetros: Uno puede crear conjuntos de diferentes ajustes que controlen el proceso de entrenamiento, para que pueda cambiar entre ellos o juntarlos cuando sea necesario.
  • Entrenadores: Uno puede especificar por separado los parámetros pasados al binario real del entrenamiento.

T2T viene con valores predeterminados para cada elemento, lo cual es lo más inmediatamente útil de esto. Varios modelos y conjuntos de datos comunes vienen incorporados en T2T, para que uno pueda comenzar rápidamente volviendo a usar o ampliando un modo existente y desplegando uno de los predeterminados y probándolo cuando sea necesario.

Lo que no hace T2T es proporcionar un contexto más amplio, más allá de TensorFlow, de cómo organizar un proyecto de aprendizaje profundo. Teóricamente, podría llegar a ser parte de un sistema de extremo a extremo de datos para predicción de crear soluciones de aprendizaje de máquina, pero ahora simplemente hace más fácil el trabajo de usar TensorFlow -y eso es absolutamente algo que vale la pena tener.