Cómo capturar y convertir la voz del cliente en texto con el componente "ASR" en wolkvox Studio
Table of Contents
Introducción
El componente “ASR” (Automatic Speech Recognition) permite que tu flujo de voz en wolkvox Studio escuche al cliente, transcriba lo que dice y guarde ese resultado en una variable para usarlo más adelante (por ejemplo, para validaciones, bifurcar el flujo o enviar información a otro sistema).
Además, puedes ajustar el idioma, el tiempo de escucha y aplicar medidas de seguridad para proteger datos sensibles.
Este componente solo está disponible para routing points de tipo voice y se encuentra en el grupo de componentes “Cognitivos”.
Configuración
- Haz doble clic sobre el componente “ASR” para abrir su panel de configuración.
- Configura los campos:
- En el campo “Tiempo de analisis ASR” escribe el número de segundos durante los cuales el sistema escuchará la respuesta del cliente.
- Ejemplo: si la pregunta es corta (“¿Cuál es su número de documento?”), podrías usar entre 3 y 6 segundos, dependiendo del contexto.
- Si esperas una respuesta más larga, aumenta este tiempo para evitar que el sistema corte la respuesta.
- En el campo “Idioma ASR”, selecciona el idioma y región adecuados para la llamada (por ejemplo, es-CO para español Colombia, es-MX para español México, etc.).
- Verifica que el idioma coincida con la forma de hablar de tus clientes, ya que esto mejora la precisión del reconocimiento.
- En el campo “Variable resultado ASR”, escribe el nombre de la variable donde se almacenará el texto transcrito.
- Ejemplo: cliente_respuesta, numero_documento, motivo_llamada, etc.
- Además, ten en cuenta que el componente ASR también genera una variable interna llamada $precision_asr, donde se guarda el puntaje de precisión del reconocimiento. Puedes utilizarla para validar cuán confiable fue la transcripción (por ejemplo, solo continuar si la precisión supera cierto umbral).
- Marca o desmarca el checkbox “Activar beeps al inicio y fin del reconocimiento” según tu necesidad:
- Marcado: el cliente escuchará un beep cuando el sistema empieza a escuchar y otro cuando termina. Esto ayuda a indicar claramente cuándo debe hablar.
- Desmarcado: el reconocimiento será silencioso, sin tonos de guía.
- Si en la respuesta del cliente podrían aparecer datos sensibles (por ejemplo, tarjetas de pago, claves u otra información crítica), activa el checkbox “Enmascarar texto en el log (PCI)”.
- Al activarlo, el valor reconocido por el ASR se enmascarará con asteriscos en los logs y reportes, evitando que pueda ser leído directamente, en línea con prácticas de seguridad tipo PCI.
- Nota: el flujo seguirá usando la variable normalmente, pero en reportes y registros quedará protegido.
- Haz clic en el botón “Guardar configuración ASR” para aplicar todos los cambios en el componente.
- En el campo “Tiempo de analisis ASR” escribe el número de segundos durante los cuales el sistema escuchará la respuesta del cliente.
