A partir del post de Leonor Quintana (en El Tinglado) y uno que he escrito yo hace unos meses sobre «Síntesis de voz para la educación«, veo que cada día hay más recursos, y más perfeccionados, para oir y practicar con «personas virtuales» que contestan a lo que se les pregunta, incluso algunos con bocadillos para los que dominan poco el inglés hablado. Leonor nos ha dado un ejemplo de hostabot para hablar con el bot de Mary, que es una creación de Media Semantics. Mediante AIML podemos crear nuestros personajes, caracterizarlos con la aplicación Character Builder con ejemplos y demos para ver su utilidad. Ejemplo de ello es la rubia Alice. En neospeech tenemos una demo para hacer uso de lectura de texto en inglés con varios personajes. En Pandorabots tenemos también la posibilidad de crear personajes virtuales con sólo registrarnos. Ahora es más fácil integrar bots en nuestra web para el aprendizaje del inglés; para otros idiomas la cosa está un poco más complicada.
Categoría: voz
En Genbeta me encuentro con el post HotRecorder: graba tus conversaciones, que nos cuenta de la posibilidad de grabar conversaciones (de voz, claro) desde Skype, Google Talk, AIM, Net2Phone, Yahoo! Messenger , FireFly u otros clientes de telefonía VoIP con la aplicación HotRecorder. A partir de ahí podemos usar las grabaciones para, por ejemplo, hacer podcastings.
En el artículo citado nos informan de que esa aplicación graba en el formato .elp (propietario) pero con la posibilidad de pasarlo a .wav, .mp3 u .ogg de una manera muy sencilla. Tiene versión gratuita y otra de pago por 15$.
Por otra parte, en Voxmedia publican una guía de uso de i-Sound WMA MP3 Recorder , para grabar conversaciones, difusión vía Internet, streaming y cualquier otro sonido emitido desde un micrófono.
Vía 21talks.net hay otras aplicaciones como skylook, donde convergen VoIP, IM y correo electrónico. Es una especie de plugin sobre Outlook en el que añadimos la capacidad de dejar mensajes en el buzón de nuestros contactos. Tiene diferentes versiones. La Basic es gratuita, pero también tenemos una licencia académica que nos permitirá hacer grabaciones. La Business y Home son de pago.
Pamela es un asistente para Skype que nos permite autoreplicar en el chat, una mejor gestión de las llamadas y contestador automático. Tiene distintas versiones pero sólo las versiones de pago (la versión estándar y la profesional) nos permiten grabar conversaciones. La profesional nos permite blogear y hacer podcasting con los ficheros de audio.
Otro interesante añadido para Skype es KishKish SAM, que la versión Silver y Gold (de pago las dos) nos permite autorespuestas y grabación de las conversaciones en mp3, entre otras funcionalidades. Hay versión gratuita pero las buenas funciones (como grabar) no las integra.
Es decir, ya no tenemos disculpa para no hacer podcasting. ¿Qué tal si decimos sí a la propuesta de Genbeta? Dicen: «¿Os gustaría que hiciéramos entrevistas en Genbeta para emitirlas en PodCast?«. Yo encantao. 🙂
Actualmente nos encontramos con grandes avances en la síntesis de voz. Recuerdo algunos añadidos de Windows 98, en los que ya podíamos disponer de voces sintéticas, y bien sintéticas, para leer un texto. Eran esas voces robotizadas. Existen múltiples aplicaciones de texto a voz (TTS) que lo guardan en formato mp3. El uso de esta tecnología viene de muy atrás, pero lo importante de ella es que nos puede servir para el mundo de la educación. Para personas con deficiencias visuales, para reforzar conceptos textuales, facilitar la memorización, alumnos con déficit de atención, etc. Para el aprendizaje de idiomas también es interesante. José Mª Campo en su blog nos habla de bustos parlantes con Flipz. Como dice:
Dentro del movimiento sobre utilización del audio en los blogs, este sencillo programa gratuito constituye una variante especialmente interesante para los profesores de idiomas. El programa tiene una ventaja adicional: los archivos de audio de partida realizados en wav, al ser transformados a swf, quedan reducidos a la décima parte. Un paso más pues dentro de la revolución audiovisual en los blogs que se está produciendo últimamente.
O sea, que nos puede servir para la dicción y enseñanza de determinadas materias, como bien comenta José Mª.
En cuanto a leer texto y pasarlo a formatos como wav, o más frecuentemente mp3, tenemos varias aplicaciones:
TextAloud, 2nd Speech Center, text to speech, Agent Reader y SodelsCot, este último uno de los mejores. Tiene versión Estándar y Empresarial. Dispone también de un servicio de red para pasar a audio el texto que le digamos. Todo pagando, claro ;-). En algunos de ellos, y especialmente en éste que comento, se pueden instalar voces de la empresa Cepstral, AT&T Natural Voices (muy logradas, pero que ocupan mucho) y Loquendo (las mejores para mi gusto; los ficheros son menos pesados y de más calidad). Cada voz ocupa entre 80 y 100 Mb, los de Loquendo unos 30 Mb y el precio ronda en torno a unos 30 € por cada voz. También nos puede servir para aplicaciones móviles con Symbian OS.
Espero que este post dé ideas para comenzar a integrar audio, podcasting o bustos parlantes o lo que se les ocurra ¿no? Especialmente para dinamizar las clases. Me gustaría que me contáseis la experiencia de trasladar esto al aula.
Se me olvidaba: para que las buenas voces funcionen se necesita una licencia. Dejo un ejemplo de este texto con la voz que IBM tiene por defecto. Dadle al reproductor, escuchad y opinad.
Comentarios recientes