Utilizzo della funzione Snapshot di Vision con un servizio OCR esterno
  • 26 Mar 2024
  • 3 Minuti da leggere
  • Contributori

Utilizzo della funzione Snapshot di Vision con un servizio OCR esterno


Article Summary

Utilizzo della funzione Snapshot di Vision con un servizio OCR esterno

Catturare e inviare immagini a un servizio di visione computerizzata esterno API

:::(Warning) (NOTA) Sebbene sia possibile ottenere questo risultato con Vision, un'altra alternativa è utilizzare CoPilot. Per saperne di più su CoPilot e l'OCR, consultate il sito:::

Panoramica

La funzione Snapshot di Vision può essere utilizzata insieme a Tulip Connectors e a un servizio OCR esterno. Questo articolo vi guiderà su come creare rapidamente una robusta pipeline OCR (Optical Character Recognition) che rileva il testo dall'istantanea scattata con una telecamera Vision. Sfruttando questa funzionalità, sarete in grado di scansionare documenti, leggere il testo da etichette stampate o persino il testo in rilievo o inciso su oggetti.

Il seguente articolo spiega come utilizzare questa funzione con Google Vision OCR. La funzione OCR di Google Vision è in grado di leggere il testo in condizioni di immagine molto difficili.

L'articolo illustra i passi da seguire:

  1. Impostazione di Tulip Vision e dell'API Google Cloud Vision
  2. Come creare un connettore Tulip all'API GCV
  3. Creare un'applicazione per scattare un'istantanea e comunicare con la funzione del connettore OCR.

Prerequisiti

Impostazione dell'istantanea e della configurazione della telecamera

Assicurarsi di aver impostato correttamente una configurazione della telecamera di Vision e di avere familiarità con la funzione Snapshot di Vision. Per ulteriori informazioni, vedere: Utilizzo della funzione Snapshot di Vision

Abilitare l'API di Google Cloud Vision e un progetto Google Cloud Platform

Creare un progetto GCP e abilitare l'API di Vision seguendo le istruzioni riportate in questo articolo: https://cloud.google.com/vision/docs/ocr.

Creare una chiave API su Google Cloud Platform da utilizzare per l'autenticazione

Seguire le istruzioni riportate nell'articolo: https://cloud.google.com/docs/authentication/api-keys per creare una chiave API per il progetto GCP. È possibile limitare l'uso di questa chiave API e impostare le autorizzazioni appropriate. Consultate il vostro manager di rete per aiutarvi a configurarla.

Creazione di una funzione connettore Tulip per Google OCR

Il connettore e la funzione connettore creati saranno configurati in modo da corrispondere al tipo di richiesta prevista dall'API di Vision, come indicato nell'immagine seguente:

Configurazione della funzione connettore:

  1. Creare un connettore HTTP.

  1. Configurare il connettore per puntare all'endpoint dell'API di Google Vision.

Host: vision.googleapis.com

TLS: Sì 3. Modificare le intestazioni del collegamento per includere il Content-Type.

  1. Testare il connettore e salvare la configurazione.
  2. Successivamente, creare una funzione connettore di richiesta POST e aggiungere il seguente percorso all'endpoint: v1/images:annotate

  1. Aggiungere un'immagine come input alla funzione connettore. Assicurarsi che il tipo di input sia Text.

  1. Assicurarsi che il tipo di richiesta sia JSON e che il corpo della richiesta corrisponda al tipo di richiesta dell'API di Google Vision:

Nota: Sostituire PUT_YOUR_API_KEY_HERE con la propria chiave API creata nei passaggi precedenti. 8. Quindi, testare questa funzione di connettore convertendo l'immagine in un'immagine di testo. Successivamente, testare questa funzione connettore convertendo un'immagine di testo in una stringa base64 (per farlo, si può utilizzare questo sito web). Utilizzare questa stringa come valore di prova per la variabile di input dell'immagine.

Si dovrebbe ricevere una risposta simile a:

  1. Impostare la variabile di output in modo che punti a**.responses.0.textAnnotations.0.description**
  2. Salvare la funzione connettore.

Creazione di un'applicazione Tulip che utilizza Snapshots e il connettore OCR di Google

  1. Passare all'Editor di app e utilizzare l'app creata durante l'impostazione dell'innesco di istantanee: Uso della funzione Istantanea
  2. Quindi, creare un pulsante con un trigger per chiamare la funzione Connector. Utilizzare la variabile immagine memorizzata dall'output dell'istantanea come input della funzione connettore.

  1. Aggiungere una variabile, detected_text, al passo dell'applicazione, in modo da poter visualizzare i risultati restituiti dalla funzione connettore:

  1. Testare l'applicazione e osservare i risultati dell'OCR:

Ora avete creato un'applicazione Tulip Vision che si collega al servizio OCR di Google Vision API. Provatela subito in officina!

Ulteriori letture:


Questo articolo è stato utile?