Uso de la función Snapshot de Vision con un servicio OCR externo
  • 26 Mar 2024
  • 3 Minutos para leer
  • Colaboradores

Uso de la función Snapshot de Vision con un servicio OCR externo


Resumen del artículo

Uso de la función Instantánea de Vision con un servicio OCR externo

Capturar y enviar imágenes a una API externa de servicio de visión por computador

:::(Warning) (NOTA) Aunque puede realizar esto con Visión, otra alternativa es utilizar CoPilot. Lea más sobre CoPilot y OCR aquí. :::

Visión

La función Snapshot de Vision puede utilizarse junto con Tulip Connectors y un servicio OCR externo. Este artículo le guiará sobre cómo construir rápidamente una robusta tubería OCR (Reconocimiento Óptico de Caracteres) que detecta el texto de la instantánea tomada con una cámara Vision. Aprovechando esta funcionalidad, podrá escanear documentos, leer texto de etiquetas impresas o incluso texto en relieve o grabado en objetos.

En el siguiente artículo se explica cómo utilizar esta función con Google Vision OCR. La función Google Vision OCR es capaz de leer texto en condiciones de imagen muy difíciles.

Los pasos que este artículo le llevará a través de:

  1. Configuración de Tulip Vision y Google Cloud Vision API
  2. Cómo crear un conector Tulip a la API GCV
  3. Cómo crear una aplicación para tomar una instantánea y comunicarse con la función del conector OCR

Requisitos previos

Configurar una instantánea junto con una configuración de cámara

Asegúrate de haber configurado correctamente una cámara Vision y de estar familiarizado con la función Snapshot de Vision. Para más información, consulte: Uso de la función Snapshot de Vision

Habilite la API de Google Cloud Vision y un proyecto de Google Cloud Platform

Cree un proyecto GCP y habilite la API de Vision siguiendo las instrucciones que se indican en este artículo: https://cloud.google.com/vision/docs/ocr.

Cree una clave de API en Google Cloud Platform que se utilizará para la autenticación

Siga las instrucciones indicadas en el artículo: https: //cloud.google.com/docs/authentication/api-keys para crear una clave de API para su proyecto GCP. Puede restringir el uso de esta clave de API y establecer los permisos adecuados. Consulta a tu administrador de red para que te ayude a configurar esto.

Creación de una función de conector de Tulip para Google OCR

El conector y la función de conector que crees se configurarán para que coincidan con el tipo de solicitud que espera la Vision API, como se indica en la siguiente imagen:

Configuración de tu función de conector:

  1. Crea un Conector HTTP.

  1. Configura el conector para que apunte al punto final de Google Vision API.

Host: vision.googleapis.com

TLS: Sí 3. Edita las cabeceras del conector para incluir Content-Type.

  1. Prueba el conector y guarda la configuración.
  2. A continuación, crea una función de conector de solicitud POST y añade la siguiente ruta al punto final: v1/images:annotate

  1. Añada una imagen como entrada a la función del conector. Asegúrese de que el tipo de entrada es Texto.

  1. Asegúrate de que el tipo de solicitud sea JSON y de que el cuerpo de la solicitud coincida con el tipo de solicitud de la API de Google Vision:

Nota: sustituye PUT_YOUR_API_KEY_HERE por tu propia clave de API creada en los pasos anteriores. A continuación, prueba esta función del conector convirtiendo una imagen de texto en una cadena base64 (para ello, puedes utilizar este sitio web). Utilice esta cadena como valor de prueba para su variable de entrada de imagen.

Deberías recibir una respuesta similar a

  1. Establezca la variable de salida para que apunte a**.responses.0.textAnnotations.0.description**
  2. Guarde la función del conector.

Creación de una aplicación Tulip que utilice Snapshots y el conector Google OCR

  1. Ve al Editor de aplicaciones y utiliza la aplicación creada al configurar el activador de instantáneas: Uso de la función de instantáneas
  2. A continuación, crea un botón con un Trigger para llamar a la Función del Conector. Utilice la variable de imagen almacenada por la salida de instantánea como entrada para la función del conector.

  1. Añade una Variable, detected_text, al Paso de tu app para poder ver los resultados devueltos por la función del conector:

  1. Prueba la app y observa los resultados del OCR:

Ahora has creado una aplicación Tulip Vision que se conecta al servicio OCR de Google Vision API. Pruébala ahora en tu tienda.

Más información:


¿Te ha sido útil este artículo?