Llegamos a ustedes gracias a:



Noticias

Microsoft abre conjunto de datos para enseñar a las computadoras a hablar

[20/12/2016] Microsoft está tratando de ayudar a crear máquinas que puedan tener conversaciones mediante el lanzamiento de un nuevo conjunto de datos gratuitos.

Los datos, llamados Microsoft Machine Reading Comprehension (MS MARCO) son un conjunto de 100 mil consultas en inglés junto con las correspondientes respuestas. Se suponen que ayudan a las personas a crear sistemas de inteligencia artificial que pueden entender el lenguaje humano escrito.

La compañía está abriendo su conjunto de datos con la esperanza de que Microsoft pueda trabajar con otras organizaciones para lograr que las máquinas mejoren en su comprensión lectora, afirma Rangan Majumder, gerente de programa de Microsoft Partner Group, en una entrada de blog el viernes.

Las consultas en MS MARCO se basan en preguntas anónimas que fueron enviadas al motor de búsqueda Bing de Microsoft y al asistente virtual Cortana. Las respuestas se basan en información encontrada en línea, escritas por seres humanos y revisadas en cuanto a su exactitud. Las consultas y las respuestas están creadas para su uso con modelos de aprendizaje profundo.

En estos momentos, el conjunto de datos se puede descargar gratuitamente por las personas que planean usarlo de forma no comercial. Microsoft lo está compartiendo de la misma forma en que comparte otros conjuntos de datos abiertos que son usados para entrenar a los programas de inteligencia artificial.

Uno de ellos es ImageNet, una base de datos de imágenes etiquetadas que se usa para entrenar a los algoritmos de reconocimiento de imágenes. Microsoft usó esa base de datos en el desarrollo de la tecnología de reconocimiento de imágenes que ahora sustenta productos como la API Computer Vision de Microsoft.

Las personas que quieren leer más acerca de MS MARCO pueden descargar un paper de investigación escrito por el equipo de Microsoft que lo creó. El equipo también está uniendo un desafío que evaluará los modelos entrenados usando los datos de MS MARCO. Los scripts de evaluación para ese desafío aún se encuentran en desarrollo.

El esfuerzo es parte de una iniciativa en curso de Microsoft para desarrollar capacidades inteligentes adicionales. El aprendizaje de máquina y la inteligencia artificial han sido las piedras angulares de la plataforma de nube Azure y de las funcionalidades en Office y Windows. Esta semana, Microsoft presentó el servicio de nube QnA Maker, el cual se encuentra diseñado para que sea más sencillo para las personas crear bots que respondan a las preguntas de los usuarios.