Cómo capturar y convertir la voz del cliente en texto con el componente "ASR" en wolkvox Studio

Updated at April 17th, 2026

Table of Contents

Introducción Configuración

Introducción

El componente “ASR” (Automatic Speech Recognition) permite que tu flujo de voz en wolkvox Studio escuche al cliente, transcriba lo que dice y guarde ese resultado en una variable para usarlo más adelante (por ejemplo, para validaciones, bifurcar el flujo o enviar información a otro sistema).

Además, puedes ajustar el idioma, el tiempo de escucha y aplicar medidas de seguridad para proteger datos sensibles.

Este componente solo está disponible para routing points de tipo voice y se encuentra en el grupo de componentes “Cognitivos”.

Configuración

Haz doble clic sobre el componente “ASR” para abrir su panel de configuración.
Configura los campos:
- En el campo “Tiempo de análisis ASR” escribe el número de segundos durante los cuales el sistema escuchará la respuesta del cliente. El valor mínimo son 5 segundos.
  - Ejemplo: si la pregunta es corta (“¿Cuál es su número de documento?”), podrías usar entre 5 y 6 segundos, dependiendo del contexto.
  - Si esperas una respuesta más larga, aumenta este tiempo para evitar que el sistema corte la respuesta.
- En el campo “Idioma ASR”, selecciona el idioma y región adecuados para la llamada (por ejemplo, es-CO para español Colombia, es-MX para español México, etc.).
  - Verifica que el idioma coincida con la forma de hablar de tus clientes, ya que esto mejora la precisión del reconocimiento.
- En el campo “Variable resultado ASR”, escribe el nombre de la variable donde se almacenará el texto transcrito.
  - Ejemplo: cliente_respuesta, numero_documento, motivo_llamada, etc.
  - Además, ten en cuenta que el componente ASR también genera una variable interna llamada $precision_asr, donde se guarda el puntaje de precisión del reconocimiento. Puedes utilizarla para validar cuán confiable fue la transcripción (por ejemplo, solo continuar si la precisión supera cierto umbral).
- Marca o desmarca el checkbox “Activar beeps al inicio y fin del reconocimiento” según tu necesidad:
  - Marcado: el cliente escuchará un beep cuando el sistema empieza a escuchar y otro cuando termina. Esto ayuda a indicar claramente cuándo debe hablar.
  - Desmarcado: el reconocimiento será silencioso, sin tonos de guía.
- Si en la respuesta del cliente podrían aparecer datos sensibles (por ejemplo, tarjetas de pago, claves u otra información crítica), activa el checkbox “Enmascarar texto en el log (PCI)”.
  - Al activarlo, el valor reconocido por el ASR se enmascarará con asteriscos en los logs y reportes, evitando que pueda ser leído directamente, en línea con prácticas de seguridad tipo PCI.
  - Nota: el flujo seguirá usando la variable normalmente, pero en reportes y registros quedará protegido.
- Haz clic en el botón “Guardar configuración ASR” para aplicar todos los cambios en el componente.

Cómo capturar y convertir la voz del cliente en texto con el componente "ASR" en wolkvox Studio

Contact Us

Introducción

Configuración

Related Articles