Cómo usar el componente “TTS Respuesta de audio” en routing points de tipo Chat en wolkvox Studio
Table of Contents
Introducción
El componente “TTS Respuesta de audio” permite convertir texto escrito en un mensaje de audio dentro de un flujo de chat en wolkvox Studio. Es una herramienta ideal para complementar experiencias conversacionales multimodales, enviando audios generados automáticamente desde texto gracias a la tecnología TTS (Text-to-Speech).
Este componente está disponible exclusivamente para routing points de tipo Chat, y permite definir la voz, el texto a convertir y si el chatbot debe continuar sin esperar respuesta del usuario. Además, incluye la opción de entrenar una voz personalizada, lo que abre posibilidades avanzadas de personalización para experiencias de marca.
¿Cómo usar el componente “TTS Respuesta de audio” en un routing point de tipo Chat?
Sigue estos pasos para configurarlo correctamente:
- En el editor de Chat Routing, dentro del grupo Básicos, ubica el ícono de TTS Audio Response y arrástralo al flujo.
- En el panel derecho de configuración encontrarás el campo “Voz”, un menú desplegable donde podrás elegir entre las diferentes voces disponibles.
- Las voces con la palabra “neural” son las más avanzadas, con entonación más natural y mayor calidad.
- En el campo “Texto a convertir en audio”, ingresa el mensaje que el sistema transformará en sonido.
- Puedes utilizar texto simple, dinámico o incluir variables según tu flujo conversacional.
- Tienes los siguientes campos:
- La casilla “Continuar chatbot” indica si el flujo debe seguir sin esperar una respuesta del usuario:
- Activada: el chatbot continúa inmediatamente al siguiente componente.
- Desactivada: el sistema espera que el usuario responda en el chat antes de avanzar.
- Haz clic en el botón “Play” para escuchar una vista previa del audio generado y validar que la voz y la entonación cumplen con lo esperado.
- Da clic en el botón “Guardar” para aplicar la configuración y dejar activo el componente dentro del flujo.
- La casilla “Continuar chatbot” indica si el flujo debe seguir sin esperar una respuesta del usuario:

Entrena una voz personalizada
- Si deseas que el audio use una voz exclusiva de tu marca o empresa, haz clic en el botón “¿Te gustaría tener una voz personalizada?”.
- Esto abrirá el módulo de entrenamiento donde podrás grabar y generar una voz única para tu operación.
- Cómo funciona: debes grabar aproximadamente un minuto de audio para que el sistema pueda entrenar la voz.
- Costo: se aclara que el servicio tiene un costo inicial de entrenamiento y un costo mensual por uso.
- Uso previsto: generar voces propias para convertir texto en audio en tus flujos.
- “Idioma”: Este menú desplegable permite seleccionar el idioma base en el que se entrenará la voz.
- “Nombre Completo del actor de voz”: Aquí se ingresa el nombre real de la persona cuya voz se está grabando.
-
"Nombre de la voz": Permite asignar un nombre interno a la voz personalizada que se va a crear. Ejemplos:
- “Voz_soporte”
- “Voz_maria”
- “Voz_corporativa_ES”
-
“Texto a leer”: En este campo se escribe el texto que el actor de voz deberá leer durante la grabación.
- Recomendaciones:
- Usar un texto continuo que dure aproximadamente 1 minuto.
- Incluir variedad de palabras, números y frases para mejorar la calidad del entrenamiento.
- Este texto será el guion que la persona leerá mientras se graba su voz.
- Recomendaciones:
- Controles de grabación: En la parte inferior aparecen los botones de grabación.
- Grabar.
- Detener.
- Reproducir.
- Subir (Entrenar wolkvox TTS): Envía la grabación al sistema y da inicio al entrenamiento automático de la voz.
- Es fundamental que la grabación sea clara, continua y sin ruidos para obtener una voz TTS de alta calidad.
- La voz quedará disponible como una opción dentro del selector de voces del componente TTS Respuesta de audio.
- El usuario podrá convertir cualquier texto a audio utilizando su nueva voz personalizada.
