Llegamos a ustedes gracias a:



Noticias

Con entendimiento de lenguaje natural

El aprendizaje de máquina de Google

[25/05/2016] Google está promoviendo el entendimiento del lenguaje natural pasando a código abierto SyntaxNet, un marco de red neuronal, y Parsey McParseface, un analizador avanzado para texto en inglés.

SyntaxNet, implementado en la biblioteca de inteligencia de máquina de código abierto de Google TensorFlow y lanzado este mes, proporciona el código necesario para entrenar modelos de entendimiento del lenguaje natural [natural language understanding] (NLU, por sus siglas en inglés) en sus datos junto con el analizador Parsey McParseface para analizar texto en inglés.

"Parsey McParseface se basa en poderosos algoritmos de aprendizaje de máquina que aprenden a analizar la estructura lingüística del idioma y que pueden explicar el rol funcional de cada palabra en una cierta oración, afirmó Slav Petrov, científico de investigación senior de Google. El proyecto surgió cuando Google reflexionaba sobre la forma en que las computadoras pueden leer y entender el lenguaje humano para procesarlo de formas inteligentes.

Accesible en GitHub, SyntaxNet sirve como marco para un analizador sintáctico, un primer componente fundamental de muchos sistemas NLU, afirmó Petrov. "Dada una oración como entrada, el analizador etiqueta cada palabra con una etiqueta que es parte de la expresión y que describe la función sintáctica de la palabra, y determina las relaciones sintácticas entre las palabras en la oración, representadas en el árbol de análisis de dependencias. Estas relaciones sintácticas se relacionan directamente con el significado subyacente de la oración en cuestión.

Parsey McParseface puede analizar una oración y entender su complejidad. En una evaluación comparativa estándar, compuesta por noticias en inglés, Parsey McParseface recupera las dependencias individuales entre las palabras con una exactitud de más del 94%.

El análisis es difícil para las computadoras debido a la ambigüedad de los lenguajes humanos. Una oración de longitud moderada de 20 a 30 palabras puede tener decenas de cientos de posibles estructuras sintácticas. "Un analizador de lenguaje natural de alguna manera debe buscar entre todas estas alternativas y encontrar la estructura más plausible dado el contexto, afirmó Petrov. SyntaxNet usa redes neuronales para enfrentar el problema de la ambigüedad.

Paul Krill, InfoWorld (EE.UU.)