Llegamos a ustedes gracias a:



Reportajes y análisis

Usé Windows Dictation para escribir este artículo con mi voz

[25/07/2023] He promocionado la capacidad de Windows para escribir solo con su voz durante años, así que finalmente decidí demostrarla: usé Windows Voice Access y Windows Dictation para escribir toda esta historia. Fue más fácil de lo que pensaba... y, extrañamente, más difícil.

[Reciba lo último de CIO Perú suscribiéndose a nuestro newsletter semanal]

Windows 11 contiene dos métodos para controlar una PC con su voz: Voice Access y Windows Dictation, cuya versión original debutó en Windows 10. Voice Access le permite navegar dentro de su PC usando solo su voz, mientras que Windows Dictation le permite dictar texto en un documento. Si bien ambos fueron diseñados para la accesibilidad, podrían, ¿potencialmente?, mejorar la productividad para las personas acostumbradas a los inputs del teclado y el mouse.

¿El gran problema, lo encontré? Simplemente acostumbrarse a los controles.

Sí, escribir dentro de Windows usando solo mi voz fue un desafío en sí mismo. Pero navegar dentro de una aplicación, usando solo mi voz, a veces parecía casi imposible. Esto subraya que tenemos un largo camino por recorrer para mejorar la accesibilidad dentro del ambiente de Windows, y revela los desafíos que enfrentan quienes dependen de estas funciones. Descubrí que una persona que está acostumbrada a dictar sus pensamientos puede aumentar drásticamente la productividad, pero los obstáculos para navegar dentro de ese texto pueden socavar cualquiera de las ganancias potenciales.

Cómo usar Voice Access y Windows Dictation

El Voice Access se puede encontrar en el menú de accesibilidad de Windows 11. Abra el menú Configuración, luego Accesibilidad > Voz. Deberá activar el acceso por voz, pero no debería necesitar seleccionar específicamente la escritura por voz. Después de activar el acceso por voz, tendrá la opción de continuar y ver un breve tutorial sobre cómo usarlo, que demuestra cómo puede usar su voz para seleccionar elementos resaltados e interactuar con ellos. (También puede poner el acceso de voz en modo de suspensión, una buena idea si va a ver un video de YouTube).

Puede habilitar Voice Access dentro del menú de Configuración. No necesita activar manualmente el Reconocimiento de voz de Windows, una aplicación previa.
Windows Voice, Dictation

Mi primer consejo: asegúrese de usar auriculares o una buena laptop con micrófonos con cancelación de ruido. Querrá minimizar tantos errores como pueda, y un buen micrófono es equivalente a un buen teclado en este sentido.

Sin embargo, mis problemas comenzaron de inmediato. Windows es lo suficientemente inteligente como para comprender cuándo desea hacer clic en un botón resaltado, ¡pero ni siquiera pude hacer eso! Lo primero que aprendí es que ser zurdo no favorece el dictado. Cada vez que intenté usar el acceso por voz en el tutorial, descubrí que mi comando de clic se interpretó como un clic derecho y no funcionó. Cambiar la configuración predeterminada de mi mouse a una configuración para diestros resolvió ese problema, incluso cuando me marcó como zurdo.

Microsoft incluye un pequeño tutorial para que se acostumbre a usar los comandos de voz.
Windows Voice, Dictation

Es cuando desea interactuar con un elemento de pantalla no obvio, como un botón, que las cosas se complican. Si el botón está resaltado, hacer clic en Aceptar hará clic en el botón en su pantalla marcado como Aceptar. Esa es la parte fácil. Pero si desea hacer clic en algo un tanto aleatorio, puede ser complicado.

El acceso por voz también utiliza un sistema de cuadrícula que le permite buscar y seleccionar un elemento en la página. Windows pinta una superposición con una cuadrícula con los números del uno al nueve, y luego le permite seleccionar un número individual para acercar más. Decir clic siete, mueve el cursor para hacer clic en lo que sea que esté en el área numerada, con suerte. Pero hacer zoom lleva tiempo, y no siempre es perfectamente preciso.

Windows 11 también incluye algunos controles básicos para interactuar con el propio Windows. Por ejemplo, para cambiar entre aplicaciones, puede decir el comando show task switcher. Eso abre el menú de pestañas Alt+Tab y le permite cambiar entre aplicaciones. Sin embargo, hacerlo requiere un poco de esfuerzo: deberá usar un comando de desplazamiento manual o usar el sistema de cuadrícula para reducir su elección.

Intentar navegar entre elementos visuales usando Voice Access requiere ir afinando progresivamente una red. En este caso, decir clic en asunto debería llevar el cursor a la línea de asunto, pero no funciona.
Windows Voice, Dictation

También puede cambiar directamente a una aplicación como Edge a través del switch cambiar a. Aunque eso también tiene algunas arrugas inesperadas. Por un lado, si tiene más de una ventana de Edge abierta, no es realmente obvio cómo cambiar de una a otra solo con su voz. Usé la cuadrícula de navegación.

Abrir el Explorador de archivos fue bastante fácil, pero tratar de seleccionar la carpeta Documentos parecía imposible solo con mi voz. Una vez más, tuve que usar el sistema de cuadrícula. Ciertamente es posible que existiera un atajo que hubiera resuelto mi problema, pero ni siquiera revisar los documentos de ayuda de Microsoft me indicó de inmediato lo que tenía que hacer. Al cambiar oralmente a Word, hizo a aparezca una lista de documentos recientes. ¿Pero no pude seleccionar uno con mi voz? Yo estaba perdido.

Aun así, navegar a través de Windows fue pan comido en comparación con el uso real de un editor de texto.

Alternativamente, puede navegar a través de un comando para mostrar números. Esto adjunta números a los campos con los que puede interactuar, pero se desordena visualmente rápidamente.
Windows Vocie, Dictation

Editar con comandos de voz es una pesadilla

Con el acceso por voz de Windows 11, el dictado se realiza automáticamente si el cursor está en un cuadro de texto. Esto es bastante fácil y Windows hace un buen trabajo al transcribir lo que usted le indica. (Solo tenga cuidado si habla consigo mismo).

Pero Windows se confunde cuando usa palabras que pueden interpretarse como palabras y como acciones, o como puntuación.

Para ello, existen tres opciones: Modo predeterminado, Modo dictado y Modo comando. El modo de dictado le permite escribir de forma natural con su voz, lo que le permite a Windows insertar signos de puntuación donde cree que es necesario, o mediante su comando a través de palabras como coma. El modo de comando se puede utilizar para controlar Windows. El valor predeterminado es un híbrido de los dos.

El problema es que ciertas funciones de edición funcionan solo en modo comando y ciertas funciones de edición solo funcionan en modo dictado. Entonces, si desea eliminar toda la línea, debe emitir ese comando en el modo de comando o predeterminado. Si está en modo de dictado, ese comando no funciona. Por otro lado, el modo de dictado a veces es la única opción para dictar palabras que podrían interpretarse como comandos, como en este artículo.

Microsoft incluye una guía útil para Voice Access, con comandos que puede emitir a su PC.
Windows Voice, Dictation

Afortunadamente, si hace clic en el pequeño ícono ? en la esquina superior derecha de la ventana de acceso por voz, puede ver una lista de los comandos disponibles. Terminé poniéndolos en un segundo monitor para usarlos como guía de referencia.

Pero sigue siendo una molestia enorme editar usando solo la voz. Algunas cosas son bastante fáciles; poner en cursiva enorme es tan fácil como decir literalmente en cursiva enorme. Pero tratar de eliminar una letra adicional o cambiar un homófono por la palabra correcta, puede requerir mucha prueba y error si no sabe lo que está haciendo. En lugar de mover el mouse para corregir una palabra, es posible que deba decirle a Windows que suba un párrafo, luego resalte la palabra correcta, y luego realice los cambios de edición que sean necesarios. (Windows no siempre se reconoce como un sustantivo, aunque puede decir mayúsculas de Windows para solucionar este problema).

Aun así, es bastante fácil seleccionar una palabra con su voz. Pero navegar dentro de una interfaz de usuario puede ser un verdadero dolor de cabeza. (Así es tratar de decirle a Windows que ponga la interfaz de usuario en mayúsculas). Usamos WordPress como editor de texto, y rápidamente uno se da cuenta de que tiene varios pequeños fragmentos en los que debe hacer clic con precisión para que todo funcione correctamente. Menús desplegables, opciones de clic derecho, gráficos, selección y adición de categorías: lo hice todo manualmente. La forma más rápida de apreciar las tecnologías de asistencia es tratar de usarlas usted mismo.

Un enfoque híbrido funciona mejor

Entonces, ¿hice todo en este artículo completamente por voz? No. Si bien fue relativamente sencillo dictar a través de mi voz, la edición fue demasiado. Algunas personas esencialmente escriben casi en modo dictado de forma predeterminada. Tiendo a detenerme, comenzar, corregirme y luego seguir adelante. Sin embargo, si se detiene demasiado, Windows lo interpreta como un punto y comienza una nueva oración. Eso es un dolor para corregir, también.

Sin embargo, hay esperanza. Cuando estaba en lo que yo llamaría flujo, escribir a través de la voz era tan rápido como escribir con las manos, o incluso más rápido. Y supongo que esto mejorará aún más. Microsoft está aplicando inteligencia artificial a prácticamente todas las facetas de Windows. Esperaría que esto suceda también en las tecnologías de asistencia. Con el tiempo, lo que espero que suceda es alguna fusión de mi escritura, la interpretación de Microsoft de mi escritura, y posiblemente la transcripción automática de una entrevista o presentación -un híbrido de dictado, mecanografiado y transcripción.

Sin embargo, lo que me quedó fue una profunda apreciación de las tecnologías de asistencia y los desafíos que enfrentan los usuarios que tienen que usarlas todos los días. Windows Dictation y Voice Access son lo suficientemente simples: el verdadero desafío es solo el último 5% al 10% del esfuerzo requerido para que su output sea profesional.

Casos de éxito

Más »