Llegamos a ustedes gracias a:



Reportajes y análisis

Aprendizaje automático: Cuándo usar cada método y técnica

[19/10/2018] Probablemente escuche más y más sobre el aprendizaje automático, un subconjunto de la inteligencia artificial. Pero, ¿qué se puede hacer exactamente con él?

La tecnología abarca una cantidad de métodos y técnicas, y cada uno tiene un conjunto de casos de uso potencial. Las empresas harían bien en examinarlas antes de seguir adelante con los planes de invertir en herramientas e infraestructura de aprendizaje automático.

Métodos de aprendizaje automático

Aprendizaje supervisado: El aprendizaje supervisado es ideal si sabe lo que quiere que aprenda una máquina. Puede exponerlo a un enorme conjunto de datos de entrenamiento, examinar el resultado y modificar los parámetros hasta obtener los resultados que espera. Más tarde, puede ver lo que la máquina ha aprendido haciendo que prediga los resultados de un conjunto de datos de validación que no haya visto antes.

Las tareas de aprendizaje supervisado más comunes implican clasificación y predicción o regresión.

Los métodos de aprendizaje supervisado se pueden usar para aplicaciones tales como la determinación del riesgo financiero de individuos y organizaciones, en base a información pasada sobre el desempeño financiero. También pueden proporcionar una buena idea de cómo actuarán los clientes o cuáles son sus preferencias basadas en patrones de comportamiento previos.

Por ejemplo, el mercado de préstamos en línea Lending Tree está utilizando una plataforma automatizada de aprendizaje automático de DataRobot para personalizar experiencias para sus clientes y predecir su intención en función de lo que han hecho en el pasado, señala Akshay Tandon, vicepresidente y jefe de estrategia y analítica.

Al predecir la intención del cliente -principalmente a través de la calificación de clientes potenciales- Lending Tree puede clasificar a las personas que están buscando una tasa, en comparación con los que realmente buscan un préstamo y están listos para solicitar uno. Usando técnicas de aprendizaje supervisado, construyó un modelo de clasificación para definir la probabilidad de un lead closing.

Aprendizaje no supervisado: El aprendizaje no supervisado permite a una máquina explorar un conjunto de datos e identificar patrones ocultos que vinculan diferentes variables. Este método se puede usar para agrupar los datos en grupos solo en función de sus propiedades estadísticas.

Una buena aplicación del aprendizaje no supervisado es el algoritmo de agrupamiento utilizado para realizar enlaces de registros probabilísticos, una técnica que extrae las conexiones entre los elementos de datos y los construye para identificar a las personas y organizaciones y sus conexiones en el mundo físico o virtual.

Esto es especialmente útil para las empresas que necesitan, por ejemplo, integrar datos de fuentes dispares y/o en diferentes unidades de negocios para construir una visión coherente y completa de sus clientes, señala Flavio Villanustre, vicepresidente de tecnología en LexisNexis Risk Solutions, una empresa que utiliza análisis para ayudar a los clientes a predecir y administrar los riesgos.

El aprendizaje no supervisado puede usarse para el análisis de sentimientos, que identifica el estado emocional de las personas en función de sus publicaciones en redes sociales, correos electrónicos u otros comentarios escritos, anota Sally Epstein, especialista en ingeniería de aprendizaje automático de la consultora Cambridge Consultants. La firma ha visto un número cada vez mayor de empresas en servicios financieros que utilizan el aprendizaje no supervisado para obtener información sobre la satisfacción del cliente.

Aprendizaje semisupervisado: El aprendizaje semisupervisado es un híbrido de aprendizaje supervisado y no supervisado. Al etiquetar una pequeña porción de los datos, un capacitador puede darle a la máquina pistas sobre cómo debe agrupar el resto del conjunto de datos.

El aprendizaje semisupervisado puede usarse para detectar fraudes de identidad, entre otros usos. Afortunadamente, el fraude no es tan frecuente como la actividad no fraudulenta, señala Villanustre, y como tal, la actividad fraudulenta puede considerarse una "anomalía" en el universo de la actividad legítima. Aun así, existe fraude y los métodos de aprendizaje automático de detección de anomalías semisupervisados pueden usarse para modelar soluciones a este tipo de problemas. Este tipo de aprendizaje se implementa para identificar el fraude en las transacciones en línea.

El aprendizaje semisupervisado también se puede utilizar cuando hay una mezcla de datos etiquetados y no etiquetados, que a menudo se observa en entornos de grandes empresas, anota Epstein. Amazon ha sido capaz de mejorar la comprensión del lenguaje natural de su oferta de Alexa mediante el entrenamiento de algoritmos de inteligencia artificial en una combinación de datos etiquetados y no etiquetados, señala la ejecutiva. Esto ha ayudado a aumentar la precisión de las respuestas de Alexa, indica.

Aprendizaje de refuerzo: El aprendizaje de refuerzo permite que la máquina interactúe con su entorno (por ejemplo, empujando los productos dañados de un transportador a un contenedor) y le proporciona una recompensa cuando hace lo que desea. Al automatizar el cálculo de la recompensa, puede dejar que la máquina aprenda en su propio tiempo.

Un caso de uso para el aprendizaje de refuerzo es la clasificación de la ropa y otros artículos en un establecimiento minorista.

Algunos minoristas de indumentaria han estado probando nuevos tipos de tecnología, como la robótica, para ayudar a clasificar artículos como ropa, calzado y accesorios, comenta David Schatsky, analista de la consultora Deloitte, que se enfoca en la tecnología emergente y las tendencias comerciales.

Los robots usan el aprendizaje de refuerzo (así como el aprendizaje profundo) para determinar cuánta presión deben usar al agarrar objetos y la mejor manera de agarrar estos artículos en el inventario, anota Schatsky.

Una variación del aprendizaje de refuerzo es el aprendizaje de refuerzo profundo, que es muy adecuado para la toma de decisiones autónoma, donde el aprendizaje supervisado o las técnicas de aprendizaje no supervisadas por sí solas no pueden hacer el trabajo.

Aprendizaje profundo: El aprendizaje profundo realiza tipos de aprendizaje como el no supervisado o reforzado. En términos generales, el aprendizaje profundo imita algunos aspectos de cómo las personas aprenden, principalmente mediante el uso de redes neuronales para identificar las características del conjunto de datos en más y más detalles.

El aprendizaje profundo, en forma de redes neuronales profundas (DNN por sus siglas en inglés), se ha utilizado para acelerar el cribado de alto contenido para el descubrimiento de fármacos, señala Schatsky. Se trata de aplicar técnicas de aceleración de DNN para procesar múltiples imágenes en un tiempo significativamente menor, al tiempo que se extrae una mayor percepción de las características de la imagen que el modelo finalmente aprende.

Este método de aprendizaje automático también permite que muchas empresas luchen contra el fraude, mejorando las tasas de detección mediante el uso de la automatización para detectar irregularidades.

El aprendizaje profundo también se puede utilizar en la industria automotriz. Una compañía ha desarrollado un sistema basado en redes neuronales que permite la detección temprana de problemas con los automóviles, señala Schatsky. Este sistema puede reconocer ruidos y vibraciones, y usa cualquier desviación de la norma para interpretar la naturaleza de la falla. Puede convertirse en parte del mantenimiento predictivo, ya que determina las vibraciones de cualquier parte móvil del automóvil y puede notar incluso cambios menores en su rendimiento.

Técnicas de aprendizaje automático

Redes neuronales: Las redes neuronales están diseñadas para imitar la estructura de las neuronas en cerebros humanos, con cada neurona artificial conectándose a otras neuronas dentro del sistema. Las redes neuronales están dispuestas en capas, con neuronas en una capa pasando datos a múltiples neuronas en la siguiente capa, y así sucesivamente. Eventualmente llegan a la capa de salida, donde la red presenta sus mejores conjeturas para resolver un problema, identificar un objeto, etc.

Los casos de uso para redes neuronales abarcan una variedad de industrias:

  • En las ciencias de la vida y el cuidado de la salud, se pueden usar para analizar imágenes médicas para acelerar los procesos de diagnóstico y para el descubrimiento de fármacos, indica Schatsky.
  • En telecomunicaciones y medios, las redes neuronales se pueden usar para traducciones de idiomas, detección de fraude y servicios de asistentes virtuales.
  • En los servicios financieros, se pueden usar para la detección de fraudes, la administración de carteras y el análisis de riesgos.
  • En ventas minoristas, se pueden usar para eliminar líneas de pago y personalizar la experiencia del cliente.

Árboles de decisión: Un algoritmo de árbol de decisión tiene como objetivo clasificar los elementos mediante la identificación de preguntas sobre sus atributos que ayudarán a decidir en qué clase ubicarlos. Cada nodo en el árbol es una pregunta, con ramas que llevan a más preguntas sobre los artículos, y las hojas como las clasificaciones finales.

Los casos de uso para los árboles de decisión pueden incluir la construcción de plataformas de gestión del conocimiento para el servicio al cliente, las predicciones de precios y la planificación de productos.

Una compañía de seguros podría usar un árbol de decisiones cuando requiera información sobre qué tipo de productos de seguro y ajustes de primas se necesitan según el riesgo potencial, indica Ray Johnson, científico jefe de datos de la firma consultora de negocios y tecnología SPR. Utilizando datos de ubicación superpuestos con datos de pérdidas relacionadas con el clima, puede crear categorías de riesgo basadas en las reclamaciones enviadas y los montos de gastos. Luego, puede evaluar nuevas aplicaciones para cobertura contra modelos para proporcionar una categoría de riesgo y el posible impacto financiero, indica el ejecutivo.

Bosques aleatorios: Si bien un árbol de decisión único debe ser entrenado para proporcionar resultados precisos, el algoritmo forestal aleatorio toma un conjunto de árboles de decisión creados al azar que basan sus decisiones en diferentes conjuntos de atributos y les permite votar en la clase más popular.

Los bosques aleatorios son herramientas versátiles para encontrar relaciones en los conjuntos de datos y son rápidos de entrenar, señala Epstein. Por ejemplo, el correo masivo no solicitado ha sido un problema desde hace mucho tiempo, no solo para los usuarios sino también para los proveedores de servicios de Internet que tienen que administrar el aumento de carga a los servidores. Como respuesta a este problema, se han desarrollado métodos automatizados para filtrar el spam del correo electrónico normal, utilizando bosques aleatorios para identificar de manera rápida y precisa correos electrónicos no deseados, señala la ejecutiva.

Otros usos de los bosques aleatorios incluyen la identificación de una enfermedad mediante el análisis de los registros médicos del paciente, la detección de fraude en la banca, la predicción del volumen de llamadas en los centros de llamadas y la previsión de ganancias o pérdidas mediante la compra de un stock en particular.

Clustering: Los algoritmos de agrupamiento utilizan técnicas como K-means, mean-shift, o expectation-maximation para agrupar puntos de datos basados en características compartidas o similares. Esta es una técnica de aprendizaje no supervisada que se puede aplicar a problemas de clasificación.

La técnica de agrupamiento es particularmente útil cuando se necesita segmentar o categorizar, anota Schatsky. Los ejemplos incluyen segmentar a los clientes por características distintas para asignar mejor las campañas de mercadotecnia, recomendar artículos de noticias a ciertos lectores y la aplicación efectiva de la ley.

El clustering también es efectivo para descubrir agrupaciones en conjuntos de datos complejos que pueden no ser obvios para el ojo humano. Los ejemplos van desde la categorización de documentos similares en una base de datos, hasta la identificación de puntos críticos de crímenes en informes de criminalística, señala Epstein.

Aprendizaje de reglas de asociación: El aprendizaje de reglas de asociación es una técnica no supervisada que se utiliza en los motores de recomendación, que busca relaciones entre las variables.

Esta es la técnica detrás de las sugerencias de "personas que compraron X también compraron Y" en muchos sitios de comercio electrónico, y son comunes los ejemplos de cómo se usa.

Un caso de uso específico podría ser un minorista especializado en alimentos que quiera generar ventas adicionales, señala Johnson. Utilizaría esta técnica para examinar el comportamiento de compra de los clientes con el fin de proporcionar latas y paquetes especiales para productos que celebran eventos, equipos deportivos, etc. La asociación rige la técnica que proporciona información que puede revelar cuándo y dónde los clientes compraron la combinación preferida de productos.

El uso de información sobre compras pasadas y plazos permite a la compañía crear de forma proactiva un programa de recompensas, señala Johnson, y ofrece ofertas especiales personalizadas para impulsar las ventas futuras.