Reflexiones sobre ecologías y espacios del aprendizaje, análisis del aprendizaje y análisis de redes sociales, visualización de datos, Big Data y otros temas emergentes

Síntesis de voz para la educación

Actualmente nos encontramos con grandes avances en la síntesis de voz. Recuerdo algunos añadidos de Windows 98, en los que ya podíamos disponer de voces sintéticas, y bien sintéticas, para leer un texto. Eran esas voces robotizadas. Existen múltiples aplicaciones de texto a voz (TTS) que lo guardan en formato mp3. El uso de esta tecnología viene de muy atrás, pero lo importante de ella es que nos puede servir para el mundo de la educación. Para personas con deficiencias visuales, para reforzar conceptos textuales, facilitar la memorización, alumnos con déficit de atención, etc. Para el aprendizaje de idiomas también es interesante. José Mª Campo en su blog nos habla de bustos parlantes con Flipz. Como dice:

Dentro del movimiento sobre utilización del audio en los blogs, este sencillo programa gratuito constituye una variante especialmente interesante para los profesores de idiomas. El programa tiene una ventaja adicional: los archivos de audio de partida realizados en wav, al ser transformados a swf, quedan reducidos a la décima parte. Un paso más pues dentro de la revolución audiovisual en los blogs que se está produciendo últimamente.

O sea, que nos puede servir para la dicción y enseñanza de determinadas materias, como bien comenta José Mª.
En cuanto a leer texto y pasarlo a formatos como wav, o más frecuentemente mp3, tenemos varias aplicaciones:
TextAloud, 2nd Speech Center, text to speech, Agent Reader y SodelsCot, este último uno de los mejores. Tiene versión Estándar y Empresarial. Dispone también de un servicio de red para pasar a audio el texto que le digamos. Todo pagando, claro ;-). En algunos de ellos, y especialmente en éste que comento, se pueden instalar voces de la empresa Cepstral, AT&T Natural Voices (muy logradas, pero que ocupan mucho) y Loquendo (las mejores para mi gusto; los ficheros son menos pesados y de más calidad). Cada voz ocupa entre 80 y 100 Mb, los de Loquendo unos 30 Mb y el precio ronda en torno a unos 30 € por cada voz. También nos puede servir para aplicaciones móviles con Symbian OS.
Espero que este post dé ideas para comenzar a integrar audio, podcasting o bustos parlantes o lo que se les ocurra ¿no? Especialmente para dinamizar las clases. Me gustaría que me contáseis la experiencia de trasladar esto al aula.

Se me olvidaba: para que las buenas voces funcionen se necesita una licencia. Dejo un ejemplo de este texto con la voz que IBM tiene por defecto. Dadle al reproductor, escuchad y opinad.

About the author

Fernando Santamaría González Soy un investigador y formador en espacios online. Trabajando e investigando en temas de aprendizaje emergente.

2 comentarios

  1. heraclio gonzalez

    Ecxelent servis

  2. maria

    Lo mejor en conversores o sintetizadores de texto a voz lo puedes encontrar en:
    http://www.elloboaullador.commuy buena inciativa la de los contenidos con voz. Saludo2

Deja un comentario