Spanish

Uso de la función Snapshot de Vision con un servicio OCR externo

08 Jan 2025
3 Minutos para leer
Colaboradores

Impresión
Compartir
Twitter
Linkedin
Facebook
Email

Uso de la función Snapshot de Vision con un servicio OCR externo

Actualizado en 08 Jan 2025
3 Minutos para leer
Colaboradores

Impresión
Compartir
Twitter
Linkedin
Facebook
Email

Resumen del artículo

¿Te ha resultado útil este resumen?

Gracias por sus comentarios

Uso de la función Instantánea de Vision con un servicio OCR externo

Capturar y enviar imágenes a un servicio externo de visión por ordenador API

NOTE

While you can accomplish this with Vision - another alternative is to use CoPilot. Read more about CoPilot and OCR here.

Visión general

La función Snapshot de Vision puede utilizarse junto con Tulip Connectors y un servicio OCR externo. Este artículo le guiará sobre cómo construir rápidamente un robusto OCR (reconocimiento óptico de caracteres) tubería que detecta el texto de la instantánea tomada con una cámara de visión. Aprovechando esta funcionalidad, podrá escanear documentos, leer texto de etiquetas impresas o incluso texto en relieve o grabado en objetos.

En el siguiente artículo se explica cómo utilizar esta función con Google Vision OCR. La función Google Vision OCR es capaz de leer texto en condiciones de imagen muy difíciles.

Los pasos que este artículo le llevará a través de:

Configuración de Tulip Vision y Google Cloud Vision API
Cómo crear un conector Tulip a la API GCV
Cómo crear una aplicación para tomar una instantánea y comunicarse con la función del conector OCR

Requisitos previos

Configurar una instantánea junto con una configuración de cámara

Asegúrate de haber configurado correctamente una cámara Vision y de estar familiarizado con la función Snapshot de Vision. Para más información, consulte: Uso de la función Snapshot de Vision

Habilite la API de Google Cloud Vision y un proyecto de Google Cloud Platform

Cree un proyecto GCP y habilite la API de Vision siguiendo las instrucciones que se indican en este artículo: https://cloud.google.com/vision/docs/ocr.

Cree una clave de API en Google Cloud Platform que se utilizará para la autenticación

Siga las instrucciones indicadas en el artículo: https://cloud.google.com/docs/authentication/api-keys para crear una clave de API para su proyecto GCP. Puede restringir el uso de esta clave de API y establecer los permisos adecuados. Consulta a tu administrador de red para que te ayude a configurar esto.

Creación de una función de conector de Tulip para Google OCR

El conector y la función de conector que crees se configurarán para que coincidan con el tipo de solicitud que espera la Vision API, como se indica en la siguiente imagen:

Configuración de tu función de conector:

Crear un Conector HTTP.

Configura el conector para que apunte al punto final de Google Vision API.

Host: vision.googleapis.com

TLS: Sí3. Edita las cabeceras del conector para incluir Content-Type.

Prueba el conector y guarda la configuración.
A continuación, crea una función de conector de solicitud POST y añade la siguiente ruta al punto final: v1/images:annotate

Añada una imagen como entrada a la función del conector. Asegúrese de que el tipo de entrada es Texto.

Asegúrate de que el tipo de solicitud sea JSON y de que el cuerpo de la solicitud coincida con el tipo de solicitud de la API de Google Vision:

Nota: sustituye PUT_YOUR_API_KEY_HERE por tu propia clave de API creada en los pasos anteriores.8. A continuación, prueba esta función de conector convirtiendo una imagen de texto en una cadena base64 (para ello, puedes utilizar este sitio web). Utilice esta cadena como valor de prueba para su variable de entrada de imagen.

Deberías recibir una respuesta similar a

Establezca la variable de salida para que apunte a**.responses.0.textAnnotations.0.description**
Guarde la función del conector.

Creación de una aplicación Tulip que utilice Snapshots y el conector Google OCR

Ve al Editor de aplicaciones y utiliza la aplicación creada al configurar el activador de instantáneas: Uso de la función de instantáneas
A continuación, crea un botón con un Trigger para llamar a la Función del Conector. Utilice la variable de imagen almacenada por la salida de instantánea como entrada para la función del conector.

Añade una Variable, detected_text, al Paso de tu app para poder ver los resultados devueltos por la función del conector:

Prueba la app y observa los resultados del OCR:

Ahora has creado una aplicación Tulip Vision que se conecta al servicio OCR de Google Vision API. Pruébala ahora en tu tienda.

Más información:

Primeros pasos con Vision
Uso del detector de cambios (Requiere: Intel RealSense D415)
Uso del detector de plantilla
Uso del detector de color
Uso del widget de la cámara Vision en aplicaciones

¿Te ha sido útil este artículo?

Tabla de contenido

Uso de la función Instantánea de Vision con un servicio OCR externo
Visión general
- Los pasos que este artículo le llevará a través de:
Requisitos previos
- Configurar una instantánea junto con una configuración de cámara
Creación de una función de conector de Tulip para Google OCR
- Configuración de tu función de conector:
Creación de una aplicación Tulip que utilice Snapshots y el conector Google OCR
Más información: