Utilizzo del rilevatore di riconoscimento ottico dei caratteri (OCR)
  • 20 Feb 2024
  • 3 Minuti da leggere
  • Contributori

Utilizzo del rilevatore di riconoscimento ottico dei caratteri (OCR)


Article Summary

:::(Warning) (Nota) Con Frontline Coplilot™ è possibile estrarre il testo direttamente da immagini e documenti, semplificando notevolmente il processo di OCR delle immagini in Tulip. In futuro, questo è l'approccio consigliato:

Rilevare il testo nella vista di una telecamera e attivare le azioni dell'applicazione utilizzando il rilevatore OCR di Vision.

Panoramica del rilevatore OCR

Il riconoscimento ottico dei caratteri(OCR) è il processo di decodifica delle immagini per trovare e leggere il testo in esse contenuto. L'OCR è un'attività che la tecnologia di computer vision persegue da decenni, ma è ancora uno dei problemi di riconoscimento più difficili che esistano.

Utilizzando il rilevatore OCR, è possibile monitorare regioni predefinite nel flusso della telecamera per rilevare il testo in tempo reale. È quindi possibile utilizzare gli eventi di rilevamento del testo per costruire una logica all'interno della propria applicazione.

:::(Info) (NOTA) I risultati del rilevatore OCR in tempo reale dipendono fortemente dalla qualità dell'immagine in ingresso. Per avere successo e ottenere risultati ripetibili, è necessario fare ogni sforzo per avere un ambiente di lettura coerente e ben illuminato. Avvicinate la telecamera il più possibile al punto in cui appare il testo. Prendete in considerazione l'utilizzo di una telecamera Zoom o Document, come suggerito nell'articolo sui consigli per l'hardware:

In questo articolo, imparerete...

  • Come impostare un rilevatore OCR
  • Uso dei trigger in-app per gli eventi del rilevatore OCR
  • Come regolare le impostazioni di un rilevatore OCR

Prerequisiti

  • Per comprendere le funzionalità e i requisiti di Vision e per le istruzioni su come configurare la fotocamera, consultare la Guida introduttiva a Vision.
  • Questa funzione funziona sia con le telecamere a colori che con quelle di profondità.
  • La funzione OCR è disponibile nelle versioni Tulip r210+ e Player 1.1.0+.

Impostazione del rilevatore OCR

Dopo aver completato la configurazione della telecamera, si dovrebbe vedere il flusso video. Per impostare il rilevatore OCR, selezionare la regione che si desidera monitorare per rilevare il testo. Potrebbe essere necessario creare una nuova regione, facendo clic e trascinando sull'immagine per definire la regione:

Creating a region for OCR detection

Quindi, creare un rilevatore OCR facendo clic sul link Crea rilevatore. Dare un nome al rilevatore e una descrizione (opzionale) e scegliere OCR come tipo di rilevatore. Attivare il rilevatore OCR per questa regione utilizzando la levetta.

Creating an OCR detector

Il confine della regione diventa verde se il testo viene rilevato nella regione, altrimenti rimane rosso. Se la soglia di rilevamento è del 50%, il testo rilevato in questa regione dovrebbe avere più del 50% di sicurezza di essere rilevato correttamente. È a questo punto che viene attivato un evento nell'applicazione che utilizza questa configurazione della telecamera.

Impostazioni della regione del rilevatore OCR

È probabile che sia necessario regolare le impostazioni di una regione per ottenere risultati adeguati al caso d'uso. Per modificare le impostazioni della regione, fare clic sulla configurazione della telecamera e selezionare le regioni da regolare.

Sono disponibili le seguenti impostazioni:

OCR detector confidence threshold

Soglia di rilevamento OCR Confidence

È la percentuale di fiducia necessaria per attivare un evento 'Testo rilevato'. Se si desidera che il testo venga rilevato in condizioni difficili, è possibile impostare questa soglia su un valore inferiore, ad esempio 40-50%. Qualsiasi valore superiore a questa soglia attiverà l'evento Testo rilevato se non è stato rilevato alcun testo in precedenza nell'area.

Utilizzo del rilevatore OCR in un'applicazione

Passare all'editor dell'applicazione e creare un nuovo trigger di uscita del dispositivo.

Tutte le configurazioni della telecamera appariranno nel sottoelenco Dispositivo specifico. Selezionare la configurazione della telecamera dall'elenco a discesa.

Si noti che la sezione Dispositivo specifico consente di utilizzare più telecamere nella stessa applicazione. Tutte le stazioni che eseguono questa applicazione devono avere la configurazione specifica della telecamera selezionata. In caso contrario, all'avvio dell'applicazione verrà visualizzato un avviso.

A questo punto viene visualizzato un menu a tendina con vari eventi da cui far partire l'attivazione:

Per questo esempio, selezionare Testo rilevato dall'elenco degli eventi.

Creating a text detection trigger

Se si dispone di un Widget di anteprima video nel proprio Passo, notare che l'opzione "Mostra sovrapposizione" consente di disattivare la visualizzazione delle Regioni sopra il video. Attivare la sovrapposizione "OCR DETECTOR" per visualizzare le informazioni sul rilevamento OCR.

Eseguire l'applicazione nella stazione a cui è stata assegnata la configurazione della telecamera.

Quando si apre la fase con il Vision Camera Widget nel lettore, si vedrà il flusso video della telecamera. Quando si sposta un oggetto all'interno della regione che ha un colore simile a quello specificato nelle impostazioni, il confine della regione diventa verde e l'azione di attivazione viene eseguita.

OCR detector running in an App

A questo punto è stata completata l'impostazione del rilevatore OCR nella configurazione della telecamera e si è pronti a integrare questa funzionalità nelle applicazioni di produzione.

Ulteriori letture


Questo articolo è stato utile?