Cómo usar un Bot que reconozca imágenes
Table of Contents
Síntoma / Necesidad
Configurar un bot que pueda analizar contenido de imágenes y extraer información útil, como texto, etiquetas o detalles específicos, utilizando Wolkvox Studio.
Contexto / Escenarios
- Configuración del componente de visión en Wolkvox Studio: Utilizar el componente "Visión" para analizar imágenes.
- Tipos de análisis disponibles: Detectar texto, etiquetas, rostros u otros elementos en imágenes.
- Uso práctico: Crear flujos automatizados que respondan a los clientes con base en el análisis de imágenes enviadas.
Respuesta (Solución / Recomendación)
Configuración del Componente Visión en Wolkvox Studio
-
Acceso al Componente Visión:
- El componente “Visión” está disponible en el grupo de componentes "Cognitivos".
- Es compatible con routing points de tipo Interaction, Chat y CRM + Webhook.
-
Configuración del Componente:
- Campo "Type of Wolkvox Vision": Selecciona el tipo de análisis deseado:
- Detect_labels: Detecta etiquetas o categorías de objetos en una imagen.
- Detect_text: Extrae texto contenido en imágenes.
- Detect_faces: Detecta rostros y analiza características como edad y género estimado.
- Object_localization: Identifica y localiza objetos específicos dentro de una imagen.
- Text_detection: Similar a "Detect_text", pero con análisis más detallado del diseño del texto.
- Campo "URL Imagen": Introduce la URL (pública) o variable donde está almacenada la imagen a analizar.
- Campo "Info Vars": Variables disponibles para manejar los resultados:
- $count_vision: Número total de resultados obtenidos.
- $txt_vision: Respuesta textual del análisis.
- $json_vision: Respuesta completa en formato JSON.
- Da clic en "Guardar" para aplicar la configuración.
- Campo "Type of Wolkvox Vision": Selecciona el tipo de análisis deseado:
Análisis Avanzado: Funcionalidad "Total Vision"
-
Configuración:
- Selecciona "WV_TOTAL_VISION" en el campo "Type of Wolkvox Vision".
- En "URL Imagen", usa la variable que contiene la imagen (por ejemplo, $txt_query).
- En "Instrucciones", define la acción a realizar (ejemplo: “Transcribe en texto todos los números y letras que encuentres en la imagen '$txt_query'”).
- Las variables disponibles son:
- $txt_vision: Contiene la respuesta procesada por la IA.
- Guarda los cambios.
-
Ejemplo Práctico:
- Routing Chat:
- Usa un componente ReplyChat para pedir al cliente que envíe una imagen.
- Añade el componente Visión y configura el tipo de análisis como "WV_TOTAL_VISION".
- En el campo "URL Imagen", utiliza la variable $txt_query.
- En "Instrucciones", escribe: “Transcribe en texto todos los números y letras que encuentres en la imagen '$txt_query'”.
- Usa la variable $txt_vision para imprimir la respuesta procesada en un componente ReplyChat.
- Routing Chat:
Recomendaciones Adicionales
- Cifrado: Asegúrate de que las imágenes analizadas cumplen con estándares de seguridad y privacidad.
- Pruebas: Valida el flujo creado para confirmar que el análisis del componente Visión responde correctamente a las instrucciones configuradas.