Llegamos a ustedes gracias a:



Reportajes y análisis

Azure y el aprendizaje automático

¿Puede llegar a las masas?

Azure ML Studio

[14/08/2015] El aprendizaje automático hace al software más inteligente y más consciente. Se está convirtiendo en parte integral de nuestra experiencia informática colectiva, como la propia Internet. Pero, ¿cómo pueden los desarrolladores comenzar a trabajar con él? ¿Cuál es el primer paso? Microsoft pretende hacer de ese salto uno más fácil con su servicio de Azure Machine Learning.

Un breve resumen de cómo funciona el aprendizaje automático

Los informáticos crean software diseñados para funcionar con grandes cantidades de datos. El aprendizaje automático evolucionó a partir de la creación de algoritmos que pueden capacitarse a sí mismos -en otras palabras aprender de- y hacer predicciones sobre estos grandes volúmenes de datos.

Donde el aprendizaje automático realmente brilla es en el análisis de variables: El cerebro humano puede, de manera consciente, considerar pocas variables al mismo tiempo a la hora de tomar una decisión o formular una conclusión sobre algún tema. El software, sin embargo, es capaz de considerar muchas más variables que un humano a la hora de tomar la misma decisión, lo cual -siguiendo la teoría- resultará siempre en una decisión mejor y de más alta calidad, sin el miedo de lo llamado "parálisis de análisis," que es cuando se abstiene de tomar una decisión de manera consciente o apresurarse a sacar una conclusión porque su cerebro no puede manejar todas las diferentes variables.

En tiempos en los que la cantidad de datos se duplica aproximadamente cada 18 meses, el aprendizaje automático puede consumir todos esos datos y usarlos activamente para solucionar los problemas de negocio.

El aprendizaje automático involucra computadoras y software que mejoran con el tiempo, sea cual sea su objetivo, usando insights obtenidos o ganados a través de la experiencia... sin programación explícita. Microsoft define la "experiencia" -en el contexto del aprendizaje automático- como datos pasados procesados a través de la aplicación más la intervención humana para guías, corregir y empujar suavemente el programa hacia el logro de su objetivo. Mientras más datos pasen a través del software y mientras más datos de entrada den los científicos al software, mejores van a ser los resultados.

¿Cuáles son algunos ejemplos de aprendizaje automático? Puede mirar tan atrás como a fines de 1990 cuando el filtrado de spam Bayesiano fue introducido para hacerle frente al creciente problema de los correos electrónicos comerciales no solicitados. Otros ejemplos más recientes y bastante comunes del aprendizaje automático incluyen:

  • Google afirma que su uso del aprendizaje automático ayuda a mantener al 99,9% de spam alejado de las bandejas de entrada de los usuarios de Gmail.
  • Los servicios de mapeo y navegación que responden a la pregunta "¿Cuál es el mejor camino a casa?" teniendo en cuenta el tráfico de datos, la construcción de carreteras, las condiciones climáticas y el momento del día en que se realiza la solicitud (o para qué momento u hora del día es la solicitud).
  • Skype Translator, un servicio que traduce de un idioma a otro en tiempo real durante una conversación.
  • La característica Gente que Quizás Conoces de Facebook, que mira sus relaciones y los datos y actividades en los perfiles de otras personas para encontrar algún tipo de relación con amigos con los que quizá no está asociado todavía en la red social.
  • Evaluar el contexto del texto en una página web, para decidir qué anuncios mostrar y cuál debería ser el costo de cada clic o impresión de ese anuncio en el contexto de la página, especialmente cuando el objetivo general de la campaña del anuncio es diferente (de vender productos a entregar inscripciones, o de opt ins a un boletín de noticias, y así sucesivamente).
  • Auto conducción de coches. Chris Urmon -quien dirige el programa de alquiler de carros sin conductor de Google- recientemente dio un TED talk (ver video abajo) sobre cómo los carros sin conductor ven la pista y eso muestra, entre muchas otras cosas, la cantidad de datos que estos vehículos necesitan para procesar con el fin de tomar decisiones autónomas sobre qué hacer después.

https://www.youtube.com/watch?v=tiwVMrTLUWg

En un testimonio de cómo ha evolucionado el aprendizaje automático, nos damos cuenta que todas estas técnicas han madurado a lo largo de la década pasada. Lo que es diferente actualmente es el volumen de datos que están siendo generados, no solo por humanos y sus actividades, sino también por todas las máquinas y sensores enchufados y conectados a la red, generando registros y observaciones. Todos estos datos, de todas esas diferentes fuentes, pueden ser combinados y usados para generar insights y tomar mejores y más rápidas decisiones que antes.

Y aunque Microsoft ha sido un gran usuario y aplicador del aprendizaje automático por un tiempo ya, es el servicio de Azure Machine Learning el que pone la escala y el poder de uno de los operadores de plataformas de nube más grandes del mundo en un paquete más fácil de usar, en el que solo se requiere para comenzar unos minutos y una tarjeta de crédito.

Aprendizaje automático off-the-shelf

La oferta de Azure Machine Learning de Microsoft es una ventanilla única diseñada para ayudar a empezar con el aprendizaje automático basado en la nube de forma rápida y muy fácil. Comienza en el portal Azure -el mismo en el que su equipo de Operaciones gira las máquinas virtuales de Azure, configura las opciones de almacenamiento y provee redes virtuales para conectar todo- donde se puede crear un espacio de trabajo Machine Learning Studio (ML Studio) y cuenta de almacenamiento dedicada.

Esta es la "partición" en el arrendatario de servicios Azure en el que todo el software de aprendizaje automático reside. En el portal, también puede monitorear el consumo del servicio de Azure Machine Learning para realizarle un seguimiento a los gastos, recibir alertas cuando un modelo está listo para ser publicado, e implementar modelos como servicios web con el ML API Service para que sus modelos se puedan integrar con sus aplicaciones ya existentes con mucha facilidad.

Sus científicos informáticos pasarán la mayoría del tiempo viviendo la experiencia del ML Studio. Es una experiencia drag-and-drop muy amigable, no una línea de comandos en blanco y una invitación para leer un manual de 900 páginas. Puede ejecutar en el flujo de trabajo de la ciencia de datos en el ML Studio, incluyendo el acceso y la preparación de los datos; la creación, prueba y capacitación de modelos; importar los modelos de propiedad existentes en su empresa de forma segura a un espacio privado de trabajo; y más.

El ML Studio tiene soporte para el lenguaje de análisis estadístico R/R, e incluye la capacidad de trabajar con Raw R así como más de 300 de los paquetes R más populares; y además, Microsoft incluye varios algoritmos listos para usar que trabajan junto a R. Puede colaborar con colegas en cualquier lugar con una conexión a Internet usando la función "compartir mi espacio de trabajo", y los modelos terminados pueden estar listos para el consumo y el uso en cuestión de minutos, en vez de tener que configurar y organizar toda la Inteligencia de Negocio (BI) o el entorno de datos.

Los datos que los modelos dentro del ML studio pueden utilizar pueden venir de una variedad/de distintas fuentes:

  • Los modelos pueden acceder a los datos que ya se encuentran en Azure.
  • Los modelos (se) pueden consultar a través de Big Data en HDInsight.
  • Los modelos pueden extraer sets de datos de los escritorios de los científicos.

Cuando el científico de datos se encuentra listo para publicar, es cuando los modelos ya probados se vuelven disponibles para los desarrolladores a través del servicio API. Los usuarios de negocio pueden acceder a los resultados desde cualquier lugar y en cualquier dispositivo. Además, cualquier actualización del modelo simplemente actualiza el modelo en producción, sin necesidad de nuevos trabajos de desarrollo. Se trata básicamente de machine learning as a service o aprendizaje automático como un servicio (MLaaS).

Azure Machine Learning ya está siendo usado por muchas empresas que usan el servicio de las siguientes maneras:

  • El análisis de los datos de telemetría
  • Los modelos de propensión del comprador
  • Análisis de redes sociales
  • Mantenimiento predictivo
  • Optimización de aplicaciones web
  • Análisis de la rotación
  • Exploración de los recursos naturales
  • Previsión meteorológica
  • Resultados predictivos de salud
  • Detección de fraudes financieros
  • Investigación en ciencias de la vida
  • Publicidad dirigida
  • Detección de intrusiones en la red
  • Monitoreo de medidores inteligentes

La última palabra sobre el aprendizaje automático

El objetivo de Microsoft con Azure Machine Learning es hacer que sea más fácil comenzar con los datos que ya tiene y con el personal que ya emplea -simplemente empiece una suscripción Azure, establezca un espacio de trabajo y comience a jugar con el ML Studio. Microsoft proporciona una amplia documentación técnica adicional y acceso a una prueba gratuita de 30 días. También puede navegar por la galería de ML Studio para encontrar tutoriales educativos de cinco minutos sobre cómo obtener datos de muestra, llevar a cabo experimentos, y más.

Jonathan Hassell, CIO (EE.UU.)

Puede ver también