Cómo usar un Bot que reconozca imágenes

Updated at October 23rd, 2025

Table of Contents

Introducción Configuración

Introducción

Puedes configurar un bot que pueda analizar contenido de imágenes y extraer información útil, como texto, etiquetas o detalles específicos, utilizando Wolkvox Studio.

Configuración del componente de visión en Wolkvox Studio: Utilizar el componente "Visión" para analizar imágenes.
Tipos de análisis disponibles: Detectar texto, etiquetas, rostros u otros elementos en imágenes.
Uso práctico: Crear flujos automatizados que respondan a los clientes con base en el análisis de imágenes enviadas.

Configuración

Configuración del Componente Visión en Wolkvox Studio

Acceso al Componente Visión:
- El componente “Visión” está disponible en el grupo de componentes "Cognitivos".
- Es compatible con routing points de tipo Interaction, Chat y CRM + Webhook.
Configuración del Componente:
- Campo "Type of Wolkvox Vision": Selecciona el tipo de análisis deseado:
  - Detect_labels: Detecta etiquetas o categorías de objetos en una imagen.
  - Detect_text: Extrae texto contenido en imágenes.
  - Detect_faces: Detecta rostros y analiza características como edad y género estimado.
  - Object_localization: Identifica y localiza objetos específicos dentro de una imagen.
  - Text_detection: Similar a "Detect_text", pero con análisis más detallado del diseño del texto.
- Campo "URL Imagen": Introduce la URL (pública) o variable donde está almacenada la imagen a analizar.
- Campo "Info Vars": Variables disponibles para manejar los resultados:
  - $count_vision: Número total de resultados obtenidos.
  - $txt_vision: Respuesta textual del análisis.
  - $json_vision: Respuesta completa en formato JSON.
- Da clic en "Guardar" para aplicar la configuración.

Análisis Avanzado: Funcionalidad "Total Vision"

Configuración:
- Selecciona "WV_TOTAL_VISION" en el campo "Type of Wolkvox Vision".
- En "URL Imagen", usa la variable que contiene la imagen (por ejemplo, $txt_query).
- En "Instrucciones", define la acción a realizar (ejemplo: “Transcribe en texto todos los números y letras que encuentres en la imagen '$txt_query'”).
- Las variables disponibles son:
  - $txt_vision: Contiene la respuesta procesada por la IA.
- Guarda los cambios.
Ejemplo Práctico:
- Routing Chat:
  - Usa un componente ReplyChat para pedir al cliente que envíe una imagen.
  - Añade el componente Visión y configura el tipo de análisis como "WV_TOTAL_VISION".
  - En el campo "URL Imagen", utiliza la variable $txt_query.
  - En "Instrucciones", escribe: “Transcribe en texto todos los números y letras que encuentres en la imagen '$txt_query'”.
- Usa la variable $txt_vision para imprimir la respuesta procesada en un componente ReplyChat.

Recomendaciones Adicionales

Cifrado: Asegúrate de que las imágenes analizadas cumplen con estándares de seguridad y privacidad.
Pruebas: Valida el flujo creado para confirmar que el análisis del componente Visión responde correctamente a las instrucciones configuradas.

Cómo usar un Bot que reconozca imágenes

Contact Us

Introducción

Configuración

Related Articles