Configurar el componente TTS (Texto a Voz) en routing points de tipo Voice en wolkvox Studio
Table of Contents
Introducción
El componente “TTS” (Texto a Voz) permite transformar texto en audio dentro de los routing points de tipo Voice. Su principal función es reproducir audios generados dinámicamente a partir de textos o variables del flujo. Además, incorpora un modo de grabación que permite guardar el audio generado en una variable para reutilizarlo en diferentes partes del diagrama, optimizando tiempos y costos.
Este componente se encuentra dentro del grupo “Cognitivos” y su configuración es distinta al TTS usado en routing de tipo Chat, por lo que este artículo explica exclusivamente su funcionamiento en Voice Routing.
Configuración
El componente TTS cuenta con dos modos de funcionamiento: PLAY y REC, cada uno diseñado para atender diferentes necesidades dentro del flujo.
Configurar TTS en modo PLAY
El modo PLAY reproduce de inmediato el audio generado a partir del texto definido en el componente. Pasos para configurarlo:
- En la ventana lateral de configuración, en el campo “Tipo de TTS”, selecciona “PLAY”.
- En el campo “Voz”, elige el modelo de voz que desees utilizar.
- El idioma está indicado al inicio del nombre de la voz.
- Las voces con la etiqueta neural son las más avanzadas y realistas.
- En el campo “Texto a convertir o variable”, escribe:
- El texto que el cliente escuchará, y/o una variable cuyo valor será convertido a audio.
- Usa el ícono ▶ (Play) para escuchar una previsualización del audio generado.
- (Opcional) Activa la casilla Interrumpir TTS al detectar voz del cliente si deseas permitir que el cliente interrumpa el audio al hablar.
- Haz clic en “Guardar configuración TTS”.

Configurar TTS en modo REC
El modo REC convierte el texto a voz y además guarda el audio resultante en una variable, lo que permite reproducirlo múltiples veces desde otros componentes (por ejemplo, con un Play Audio), optimizando la generación de TTS y reduciendo costos de facturación.
Pasos para configurarlo:
- En Tipo de “TTS”, selecciona “REC”.
- En el campo “Variable para guardar TTS”, escribe el nombre de la variable donde se almacenará el audio.
- Ejemplo: $tts_bienvenida
- En “Voz”, elige el tipo de voz a utilizar.
- Las voces con la etiqueta neural son las más avanzadas y realistas.
- En “Texto a convertir o variable”, ingresa el texto y/o variable que deseas convertir en audio.
- Reproduce el resultado con el ícono “▶”.
- Haz clic en “Guardar configuración TTS”.

Crear una voz personalizada con wolkvox TTS
El componente incluye una función adicional: crear voces personalizadas mediante un proceso de entrenamiento de audio.
- Haz clic en el botón “¿Te gustaría tener una voz personalizada?” ubicado junto al campo de selección de voz.
- Completa los siguientes campos:
- Idioma.
- Nombre completo del actor de voz.
- Nombre de la voz personalizada.
- Texto a leer (debe coincidir exactamente con lo que se grabará).
- Graba el audio mediante los botones:
- ● Grabar.
- ■ Detener.
- ▶ Reproducir.
- Cuando estés conforme, haz clic en “Entrenar wolkvox TTS”.
- Nota: El entrenamiento inicial tiene un costo único y posteriormente se mantiene con un cargo mensual por almacenamiento y uso.
