Llegamos a ustedes gracias a:



Noticias

HTML5 podría hacer que las páginas web hablen y escuchen

[08/09/2010] El W3C está investigando la posibilidad de incorporar reconocimiento de voz e interfases de síntesis de voz dentro de las páginas web. Un nuevo grupo de trabajo realizará un informe al respecto dentro de un año, en el que resumirá la posibilidad de añadir características de voz y habla en HTML, el estándar del W3C para renderizar páginas web.

De hecho, AT&T, Google, Microsoft y la Fundación Mozilla, entre otros, tienen ingenieros trabajando en este sentido.
La voz humana y la web no han sido extrañas. Google incluye una aplicación de búsqueda web basada en voz en su sistema operativo Android, y Microsoft promete nuevas características de voz en su próximo Windows Phone 7. El HTML Speech Incubator Group está estudiando la posibilidad de desarrollar una interfase web estándar tanto para reconocimiento de voz como para síntesis del habla, según ha explicado el responsable del grupo, Dan Brunett, que también es el director de tecnologías de voz y estándares del proveedor de sistemas de respuesta por voz, Voxeo.
Una interfase de ese tipo podría utilizarse en múltiples navegadores. Utilizando un plugin de reconocimiento de voz y síntesis del habla, los navegadores podrían leer páginas en alto o permitir que los usuarios rellenen formularios en la web de forma audible.
Si bien este trabajo podría superponerse con otro proyecto de W3C basado en la voz, VoiceXML, los dos esfuerzos son ligeramente distintos. VoiceXML no funcionaría con la web, puesto que fue diseñado en principio para aplicaciones controladas por voz, tales como sistemas de respuesta basados en voz para teléfonos, donde es ampliamente utilizado.
Burnett también señaló que, si finalmente se considera posible desarrollar este tipo de capacidades, sería otro grupo del W3C el encargado de ello. Por ejemplo, el HTML Working Group.
El W3C ha estado muy ocupado con tecnologías de voz en toda una serie de frentes. La organización lanzó recientemente la versión 3.0 de VoiceXML. En ella, el grupo de trabajo añadió descripciones semánticas de las características y organizó la funcionalidad de las mismas en módulos.
El W3C también planea lanzar en breve la versión 1.1 de SSML, Speech Synthesis Markup Language, que se utiliza a menudo con VoiceXML y que incorporará idiomas asiáticos. Además, proporcionará a los desarrolladores más flexibilidad en la selección de la voz y en el manejo de lenguas no muy frecuentes.
Joab Jackson, IDG News Service