Llegamos a ustedes gracias a:



Reportajes y análisis

IA vs aprendizaje automático vs aprendizaje profundo

¿Qué es el aprendizaje profundo?

[14/08/2017] A medida que la Inteligencia Artificial (IA) se vuelve más popular, la terminología que la describe causa confusión.

Las palabras de moda IA, aprendizaje automático y aprendizaje profundo, a menudo se utilizan indistintamente, a pesar de que cada una significa algo diferente.

El informático John McCarthy de Stanford se acredita con acuñar el término "inteligencia artificial". Él lo definió en una conferencia sobre el tema llevada a cabo en 1956 como: "La ciencia e ingeniería de la fabricación de máquinas inteligentes, especialmente los programas informáticos inteligentes".

La ambigüedad de la palabra "inteligente" permite que la IA cubra una gama de aplicaciones, pero la mayoría de los investigadores están de acuerdo en que se refiere ampliamente a algo que replica el pensamiento humano.

El aprendizaje automático es un subconjunto de la IA que otorga a las computadoras un grado de pensamiento independiente. Esto se logra dándole grandes volúmenes de datos que un algoritmo puede procesar, y luego aprender para hacer predicciones y decisiones para las que no ha sido programado específicamente. La máquina aprende de manera efectiva a resolver nuevos problemas a partir de ejemplos existentes.

Por otro lado, el aprendizaje profundo es un tipo de aprendizaje automático inspirado en las conexiones entre las neuronas del cerebro humano. Los investigadores desarrollaron una imitación artificial de esta conectividad biológica, conocida como redes neuronales artificiales (comúnmente conocidas como redes neuronales).

El aprendizaje profundo en la práctica

En las redes neuronales humanas, miles de millones de neuronas interconectadas se comunican entre sí enviando señales eléctricas que se convierten en pensamientos y acciones. En las redes neuronales artificiales, los nodos asumen el rol de las neuronas, y colaboran en una estructura organizada para resolver problemas a través de sus análisis combinados.

Por ejemplo, el software de aprendizaje profundo podría ser utilizado para entender una fotografía compleja compuesta de artículos superpuestos, como una cesta de lavandería completa.

Los nodos están dispuestos en capas separadas y cada uno revisa elementos individuales de la imagen, realizando cálculos sobre ese elemento específico para poder entenderlo completamente. Estos cálculos resultan en una señal que se pasa a los otros nodos.

Luego, todas las señales en las capas son evaluadas en conjunto para hacer una predicción final sobre lo que se encuentra en la imagen con exactitud.

La ventaja que tiene el aprendizaje profundo sobre las formas alternativas de aprendizaje automático es que mientras los otros necesitan analizar un conjunto predefinido de características sobre las cuales basan sus predicciones, el aprendizaje profundo puede identificar estas características individuales.

Por ejemplo, si un sistema quisiera identificar las caras humanas en una foto, no se le tendría que mostrar características individuales primero, como narices y globos oculares. En su lugar, podría dársele una imagen completa para escanear y así comprender las diferentes características, con el fin de hacer una predicción independiente sobre el contenido de las imágenes.

El aprendizaje profundo puede usarse para predecir terremotos o dirigir vehículos autodirigidos. Puede colorear videos en blanco y negro, traducir texto con una cámara de teléfono, imitar voces humanas, componer música, escribir código de computadora y vencer a humanos en juegos de mesa, como lo hizo DeepMind de Google el año pasado contra el campeón surcoreano de 'Go' Lee Sedol.

También cuenta con innumerables aplicaciones potenciales para las empresas, desde sistemas de seguridad y análisis de opiniones, hasta la optimización de la fabricación. El aprendizaje profundo es particularmente competente en la comprensión de imágenes y audio, y puede automatizar muchas tareas profesionales comunes, como el análisis de rayos X o la digitalización de documentos legales.

La historia del aprendizaje profundo

"El aprendizaje profundo no es una idea nueva", señala Sean Owen, director de ciencia de datos de la compañía de software Cloudera. "Es el renacimiento de otra idea que la gente finalmente ha llegado a desarrollar bien".

Los orígenes del aprendizaje profundo se remontan a los años cincuenta, y un intento temprano de imitar la interconectividad de las neuronas en el cerebro biológico conocido como el perceptron. El algoritmo del aprendizaje automático fue desarrollado por el psicólogo estadounidense Frank Rosenblatt en 1957, con fondos de la Oficina de Investigación Naval de los Estados Unidos.

Su invención fue descrita dramáticamente por el New York Times como "el embrión de una computadora electrónica que [la Marina] espera que pueda caminar, hablar, ver, escribir, reproducirse y ser consciente de su existencia".

La complejidad de la tecnología significó que pronto cayera en desgracia, pero volvió a surgir en 1986 con la publicación de un documento titulado "Learning representations by back-propagating errors" que ofrecía una forma más eficiente para que las redes neuronales aprendan.

En la década de los noventa, el centro de atención se desplazó a una nueva clase de aprendizaje automático llamada 'máquina de soporte vectorial', que ofrecía algoritmos de alto rendimiento relativamente sencillos.

Solo en la última década los investigadores han aprendido a realmente aprovechar la gran cantidad de computación disponible en la nube, necesaria para que el aprendizaje profundo funcione a escala.

En 2011, Andrew Ng, pionero en el aprendizaje profundo, fundó Google Brain. El profesor de la Universidad de Stanford ya había ayudado a desarrollar helicópteros autónomos y robots domésticos multifuncionales, pero fue el gigantesco proyecto de investigación de redes neuronales de Google que lo convirtió en un ícono de la IA.

Su creación ganó un titular en el New York Times cuando un grupo de 16 mil procesadores informáticos que simulaban el cerebro humano, escaneó 10 millones de imágenes encontradas en videos de YouTube para reconocer a los gatos y descubrir de forma independiente las características principales de un "gato".

Las redes neuronales desarrolladas en Google Brain se utilizaron nuevamente ese año, aunque con muchos menos bombos y platillos, en el software de reconocimiento de voz utilizado en los teléfonos Android.

Google Brain atrajo la atención hacia el aprendizaje profundo, y demostró que el cerebro humano podría proporcionar un modelo para el aprendizaje automático en un momento en el que muchos ingenieros preferían la automatización simple disfrazada de inteligencia.

"Una parte de la aceleración y la aceptación del aprendizaje profundo no se debió a los descubrimientos de la investigación, sino a la disponibilidad del software que permite hacer estas cosas", anota Owen, ex ingeniero senior de Google.

"Por ejemplo, hace aproximadamente dos años Google lanzó un paquete de aprendizaje profundo llamado TensorFlow; y ese tipo de cosas es lo que realmente ha impulsado la adopción y el uso del aprendizaje profundo hacia las tendencias a pasos agigantados.

"Eso es lo que impulsó la explosión en los últimos cinco años. Es la traducción de esas ideas al software libre", señala.

A menudo, el aprendizaje profundo requiere un hardware especial, pero también se ha vuelto más accesible. Son más desafiante el conocimiento y la experiencia necesarios para utilizar las diversas herramientas y técnicas.

El aprendizaje profundo sigue siendo un territorio en gran parte inexplorado, e incluso los científicos expertos en aprendizaje automático, aprenden con la práctica en el campo. Esto ha resultado en una guerra de talento entre las mayores empresas de tecnología del planeta.

Las limitaciones del aprendizaje profundo

La IA ha recibido cobertura de prensa mixta, y la reciente controversia del acceso de DeepMind Health a los registros de pacientes del NHS ha aumentado las preocupaciones de privacidad. El aprendizaje profundo plantea desafíos únicos, pues a medida que sus modelos se vuelven más complejos, los resultados son más difíciles de interpretar.

"Son modelos muy complicados que tienen una gran cantidad de números, y no está claro lo que significan, así que es difícil entender por qué un resultado está conectado a una entrada determinada".

"Puede convertirse en un problema si se necesita ese tipo de transparencia para detectar que la lógica del modelo no es la que se quiere aceptar. Creo que el conflicto es que estas herramientas pueden permitirnos demostrar inclinaciones latentes con demasiada facilidad, ocultas en nuestros datos, y consagrarlas construyendo modelos predictivos que sugieren acciones futuras".

Un equipo de investigadores del MIT puede haber encontrado una solución. Al analizar la actividad de diferentes neuronas en una red, pudieron entender qué neuronas individuales eran responsables de tomar ciertas decisiones. El descubrimiento puede proporcionar un método para descubrir el sesgo algorítmico, y explicar acciones específicas derivadas de algoritmos del aprendizaje profundo.

A pesar de que el aprendizaje profundo comenzó como un intento de modelar estadísticamente el funcionamiento de las neuronas, Owen se empeña en enfatizar que todavía no reproduce el mismo pensamiento y aprendizaje que el del cerebro humano.

"Lo que hago es advertirle a la gente sobre llegar a la conclusión de que hemos descubierto cómo hacer que las máquinas piensen. Es una poderosa mezcla de técnicas, pero se trata más sobre modelos estadísticos; aquí no hay ningún avance fundamental en la comprensión del cerebro humano".

Además, el crecimiento del aprendizaje profundo tampoco hace que otros algoritmos de aprendizaje automático sean obsoletos. El aprendizaje profundo necesita enormes conjuntos de datos y potencia informática para funcionar eficazmente, y en muchos casos, los algoritmos más sencillos como las máquinas de soporte vectorial serán suficientes.

El futuro del aprendizaje profundo

El aprendizaje profundo puede utilizar la técnica común de aprendizaje supervisado, y la alternativa más compleja y vanguardista del aprendizaje no supervisado.

En el aprendizaje supervisado, las variables de entrada y salida son proporcionadas y clasificadas. Un algoritmo solo necesita seguir un proceso establecido para generar nuevos resultados cuando se agregan más datos de entrada. Esto se utiliza en numerosas aplicaciones actuales, como cuando Amazon hace recomendaciones.

En el aprendizaje no supervisado, los datos de salida son desconocidos, por lo que no hay ejemplos sobre los cuales un sistema pueda basar sus conclusiones. Solo puede utilizar los datos de entrada para resolver el problema. Lo realiza extrayendo información de los datos para descubrir correlaciones y entender la estructura subyacente, y luego poder sacar sus propias conclusiones. Es la alternativa autodidáctica al modelo de profesor de aula utilizado en el aprendizaje supervisado.

Un ejemplo de aprendizaje no supervisado sería un sistema que clasificara, de manera independiente, animales en una foto sin que se le dijera cuáles son. Lo llevaría a cabo a través de un proceso de descripción que implica dividir los datos en categorías basadas en las diferencias y similitudes. Por lo tanto, etiquetaría a los perros y gatos como categorías diferentes basándose en las características distintivas y las correlaciones que encuentra en sus píxeles.

El aprendizaje profundo puede usarse para transformar las fotos de los smartphones en pinturas que imitan el estilo y las pinceladas de los grandes maestros; técnica que hizo que la aplicación móvil rusa Prisma sea la número uno en su país de origen.

Los efectos de una tecnología tan poderosa podrían tener consecuencias nefastas. Por ejemplo, podría ser utilizado para generar videos falsos realmente convincentes.

Su potencial para la manipulación de medios y la desinformación se demostró el año pasado cuando los investigadores de la Universidad de Stanford y la Universidad de Erlangen-Nuremberg en Alemania dieron a conocer un proyecto llamado Face2Face.

El programa utiliza algoritmos de aprendizaje profundo y una cámara web comercial para reanimar las expresiones faciales de las personas que hablan en videos de YouTube en tiempo real. Poner palabras en las bocas de políticos nunca ha sido tan fácil.

El aprendizaje profundo en la empresa

Para las empresas, cualquier temor sobre el aprendizaje profundo será disipado por los beneficios potenciales del negocio. Muchos de ellos ya lo están explotando en aplicaciones de gran alcance, como la agencia de viajes en línea Expedia.

Cuando los clientes del sitio web de reservas revisan sus listados de hoteles, la atención siempre se dirige primero en las imágenes del alojamiento. Mostrar las fotos más atractivas primero mejoraría las posibilidades de que un hotel sea elegido, pero la compañía tiene un total de más de 10 millones de imágenes de 295 mil hoteles. Verlas todas manualmente sería una tarea interminable.

En su lugar, el equipo de ciencia de datos está utilizando el aprendizaje profundo para clasificar automáticamente las imágenes. Un producto de crowdsourcing desarrollado por Amazon llamado Human Turk fue utilizado para proporcionar calificaciones del 1 al 10 en 100 mil imágenes de hoteles. Cada imagen fue calificada dos veces y clasificada por tipo de viajero.

El modelo fue entrenado en este conjunto de datos para clasificar las imágenes de forma independiente. Expedia estima que sería capaz de clasificar diez millones de imágenes en un día.

Las empresas de tecnología están experimentando con diversas aplicaciones de aprendizaje profundo. Tesla lo utiliza para ayudar a sus automóviles autónomos a identificar los peligros en la carretera; DeepMind, para detectar enfermedades que amenazan la vista mediante el análisis de escaneos digitales de los ojos; y Facebook, para ofrecer a los usuarios contenido que se adapta a sus intereses.

Las primeras organizaciones digitales podrían seguir siendo los principales exponentes del aprendizaje profundo, pero la tecnología está creciendo en sofisticación y volviéndose más asequible y accesible. Las posibilidades de que el aprendizaje profundo transforme las empresas de todos los sectores no dejan de aumentar.