Cómo usar el componente "wolkvox vision" de wolkvox Studio
Table of Contents
Introducción
El componente “wolkvox vision” te permite aplicar Inteligencia Artificial para analizar imágenes dentro de un flujo conversacional: desde detectar objetos/etiquetas, leer texto en una imagen, detectar rostros, hasta realizar análisis avanzados guiados por instrucciones. Con esto puedes automatizar validaciones, extracción de datos (por ejemplo, documentos, pantallazos, recibos) y enriquecer la interacción con el cliente sin intervención manual.
Este componente está en el grupo Cognitivos y está disponible para routing points de tipo Interaction, Chat y CRM + Webhook.
Configuración
- Haz doble clic izquierdo sobre el componente para abrir su panel de configuración
- Configura sus campos:
- En el campo “Type of wolkvox Vision”, elige qué necesitas obtener de la imagen. Las opciones disponibles son:
- DETECT_LABELS: detecta etiquetas/categorías de lo que aparece en la imagen (objetos o elementos).
- DETECT_TEXT: extrae el texto visible en la imagen (útil para letreros, pantallas, texto impreso, etc.).
- DETECT_FACES: detecta rostros y entrega información asociada (por ejemplo, ubicación del rostro y estimaciones como edad/género).
- OBJECT_LOCALIZATION: localiza objetos específicos e indica su ubicación dentro de la imagen.
- TEXT_DETECTION: similar a DETECT_TEXT, con foco en detección/extracción de texto y potencialmente más detalle sobre estructura.
-
WV_TOTAL_VISION: análisis más avanzado y “guiado”, pensado para escenarios donde necesitas una respuesta más completa y confiable (normalmente apoyado por instrucciones claras).
- Tip práctico: si tu objetivo es “extraer datos específicos” (por ejemplo: número de documento, valor, fecha, entidad), normalmente conviene WV_TOTAL_VISION + buenas instrucciones.
- En el campo “URL Imagen” escribe:
- Una URL pública donde esté alojada la imagen, o una variable que contenga esa URL (según tu flujo y el canal).
- Importante: el componente necesita poder acceder a la imagen. Si la URL no es pública o no es accesible desde el servicio, el análisis puede fallar o devolver resultados vacíos.
- En el campo “Instrucciones”, escribe de forma clara y específica lo que quieres que la IA extraiga o reporte.
- Ejemplos de instrucciones (puedes adaptarlos):
- “Extrae: tipo de documento, número, nombre completo y fecha de expedición.”
- “Lee el texto y devuelve un resumen en 3 líneas.”
- “Identifica los elementos principales de la imagen y descríbelos en una lista.”
- “Detecta si hay un comprobante de pago y extrae: valor, referencia y fecha.”
- Recomendación: pide solo lo necesario y define formato esperado (lista, campos, texto corto, etc.) para obtener respuestas más consistentes.
- Ejemplos de instrucciones (puedes adaptarlos):
- En el bloque “Info Vars” (visible en el panel), el componente te muestra las variables disponibles para consumir el resultado:
- $count_vision: número de resultados obtenidos en el análisis.
- $txt_vision: respuesta completa del análisis en texto.
- $json_vision: respuesta completa del análisis en formato JSON (array).
- Estas variables son las que usarás después en tu flujo.
- Haz clic en “Guardar” para aplicar los cambios del componente.
- En el campo “Type of wolkvox Vision”, elige qué necesitas obtener de la imagen. Las opciones disponibles son:
