Cómo usar el componente "wolkvox vision" de wolkvox Studio

Updated at February 5th, 2026

Table of Contents

Introducción Configuración

Introducción

El componente “wolkvox vision” te permite aplicar Inteligencia Artificial para analizar imágenes dentro de un flujo conversacional: desde detectar objetos/etiquetas, leer texto en una imagen, detectar rostros, hasta realizar análisis avanzados guiados por instrucciones. Con esto puedes automatizar validaciones, extracción de datos (por ejemplo, documentos, pantallazos, recibos) y enriquecer la interacción con el cliente sin intervención manual.

Este componente está en el grupo Cognitivos y está disponible para routing points de tipo Interaction, Chat y CRM + Webhook.

Configuración

Haz doble clic izquierdo sobre el componente para abrir su panel de configuración
Configura sus campos:
- En el campo “Type of wolkvox Vision”, elige qué necesitas obtener de la imagen. Las opciones disponibles son:
  - DETECT_LABELS: detecta etiquetas/categorías de lo que aparece en la imagen (objetos o elementos).
  - DETECT_TEXT: extrae el texto visible en la imagen (útil para letreros, pantallas, texto impreso, etc.).
  - DETECT_FACES: detecta rostros y entrega información asociada (por ejemplo, ubicación del rostro y estimaciones como edad/género).
  - OBJECT_LOCALIZATION: localiza objetos específicos e indica su ubicación dentro de la imagen.
  - TEXT_DETECTION: similar a DETECT_TEXT, con foco en detección/extracción de texto y potencialmente más detalle sobre estructura.
  - WV_TOTAL_VISION: análisis más avanzado y “guiado”, pensado para escenarios donde necesitas una respuesta más completa y confiable (normalmente apoyado por instrucciones claras).
    - Tip práctico: si tu objetivo es “extraer datos específicos” (por ejemplo: número de documento, valor, fecha, entidad), normalmente conviene WV_TOTAL_VISION + buenas instrucciones.
- En el campo “URL Imagen” escribe:
  - Una URL pública donde esté alojada la imagen, o una variable que contenga esa URL (según tu flujo y el canal).
  - Importante: el componente necesita poder acceder a la imagen. Si la URL no es pública o no es accesible desde el servicio, el análisis puede fallar o devolver resultados vacíos.
- En el campo “Instrucciones”, escribe de forma clara y específica lo que quieres que la IA extraiga o reporte.
  - Ejemplos de instrucciones (puedes adaptarlos):
    - “Extrae: tipo de documento, número, nombre completo y fecha de expedición.”
    - “Lee el texto y devuelve un resumen en 3 líneas.”
    - “Identifica los elementos principales de la imagen y descríbelos en una lista.”
    - “Detecta si hay un comprobante de pago y extrae: valor, referencia y fecha.”
    - Recomendación: pide solo lo necesario y define formato esperado (lista, campos, texto corto, etc.) para obtener respuestas más consistentes.
- En el bloque “Info Vars” (visible en el panel), el componente te muestra las variables disponibles para consumir el resultado:
  - $count_vision: número de resultados obtenidos en el análisis.
  - $txt_vision: respuesta completa del análisis en texto.
  - $json_vision: respuesta completa del análisis en formato JSON (array).
  - Estas variables son las que usarás después en tu flujo.
- Haz clic en “Guardar” para aplicar los cambios del componente.

Cómo usar el componente "wolkvox vision" de wolkvox Studio

Contact Us

Introducción

Configuración

Related Articles