Estrazione del testo dall'immagine Azione di attivazione
  • 07 Jun 2024
  • 5 Minuti da leggere
  • Contributori

Estrazione del testo dall'immagine Azione di attivazione


Sommario dell'articolo

L'azione trigger Estrai testo da immagine estrae il testo da un'immagine in base a una query. Un altro modo per descriverla è "OCR (riconoscimento ottico dei caratteri) basato su query" o "Estrazione di testo da un'immagine chiedendolo".

Il trigger restituirà sempre e solo il testo effettivamente presente nell'immagine. Non aggiungerà ulteriori informazioni o interpretazioni. Questo lo rende molto potente per trasferire i dati dal mondo fisico a quello digitale.

Esempi di casi d'uso:

  • Ingerire i dati di un modulo d'ordine proveniente da un fornitore esterno. Dimenticatevi di trasferire manualmente il numero d'ordine di 14 caratteri dalla fattura di un fornitore al vostro WMS: basta un'applicazione semplice e "Extract Text from Image" per estrarre questi dati in pochi secondi.
  • Digitalizzazione dei moduli cartacei. I dati contenuti nei viaggiatori cartacei esistenti sono ancora più preziosi se possono essere consultati all'interno delle app Tulip. Le azioni di "estrazione del testo dall'immagine" sono un ottimo meccanismo per creare un ponte tra il mondo fisico e quello digitale.
  • Lavorate con testi in lingue sconosciute ai vostri operatori, in modo affidabile. Il mondo della produzione è globale, date ai vostri operatori dei superpoteri combinando le azioni trigger "Estrai testo dall'immagine" e "Traduci" per trasformare le informazioni cartacee in qualcosa su cui i vostri operatori possono agire.

Esempio di attivazione

Utilizzare un'applicazione mobile per fotografare l'etichetta di un prodotto e ottenere il numero di lotto.

Immagine | Trigger | Risultato | --- | --- | | --- | | | | | | | image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX |

Estrarre il valore dall'immagine

Ingressi e uscite

L'azione di attivazione ha due ingressi, Immagine di input e Query, e un'uscita, il testo estratto.

Ingresso: Immagine di ingresso

È l'immagine da cui estrarre il testo. Può provenire dal widget di input della telecamera, da Tulip Vision o da sistemi esterni.

| | Tipo di dati supportati | | --- | --- | | Input | URL dell'immagine |

Ingresso: Query

È la query utilizzata per estrarre il testo dall'immagine o dal documento.

Le migliori pratiche per le query: * Se possibile, utilizzare le parole del documento. Questo è particolarmente utile per gli acronimi e le abbreviazioni (ad esempio SN, ID, SSN, Lot No., ecc.). Le azioni di attivazione dell'estratto di testo supportano query meno complesse rispetto alle azioni di attivazione della risposta a una domanda dai dati/documento* Es. Ottimo input: "Chi è il fornitore?" * Es. Input negativo: "Chi pensi possa averci inviato questo?" * Anche specificare la posizione delle informazioni può essere utile (ad esempio, "Qual è il numero di riferimento sul fondo?").

| | Tipo di dati supportato | | --- | --- | | Input | Testo |

Uscita: Testo estratto

È il testo estratto dall'immagine in base alla query.

| | Tipo di dati supportati | | --- | --- | | Output | Text |


Estrarre valori da immagini/documenti

:::(Warning) (Nota) L'estrazione dei valori dai documenti è un'operazione relativamente lenta. Per limitare il tempo di esecuzione, i documenti sono limitati a 10 pagine.
:::

Estrai valori da immagine/documento funziona come Estrai valore da immagine, ma supporta una serie di domande. Questa operazione sarà molto più performante rispetto all'esecuzione dell'azione di trigger Estrai valore dall'immagine.

Ingresso: Immagine/documento di input

È l'immagine da cui estrarre il testo. Può provenire dal widget di input della telecamera, da Tulip Vision o da sistemi esterni. Per i file, può essere impostata staticamente, inserita con il widget di input file o con i file di riferimento memorizzati nelle Tabelle.

| | Tipo di dati supportati | | --- | --- | | Ingresso | URL immagine |

Ingresso: Query

È la query usata per estrarre il testo dall'immagine. Deve essere un array/elenco di valori di testo.

| | Tipo di dati supportati | | --- | --- | | Input | Elenco di testi |

Uscita: Testo estratto

È il testo estratto dall'immagine in base alla query.

| | Tipo di dati supportati | | --- | --- | | Output | Array di oggetti. Ogni elemento avrà un attributo "Domanda" e "Risposta".


Estrarre tutto il testo dall'immagine/documento

In alcuni casi, il paradigma chiave:valore delle azioni di trigger del valore estratto non ha senso per il vostro caso d'uso. La lettura di tutti i dati da un'immagine offre una flessibilità quasi infinita per quanto riguarda i problemi che possono essere affrontati da copilot. Le azioni trigger "Estrai tutto il testo" offrono questa flessibilità.

image.png

Ingresso: Immagine/documento di input

È l'immagine da cui estrarre il testo. Può provenire dal widget di input della telecamera, da Tulip Vision o da sistemi esterni. Per i file, può essere impostata staticamente, inserita con il widget di inserimento file o con i file di riferimento memorizzati nelle Tabelle.

| | Tipo di dati supportati | | --- | --- | | Ingresso | URL immagine o URL file |

Uscita: Testo estratto

Si tratta di tutto il testo trovato nella rispettiva immagine o documento. Documenti restituirà un array di dati, in cui ogni elemento rappresenta il testo di una pagina del documento fornito.

| | Tipo di dati supportati | | --- | --- | | Output | (per le immagini) Testo. (per i documenti) Elenco di testo |


Casi limite

Nessuna immagine di input e/o nessuna query fornita

Se non viene fornita alcuna immagine di input o alcuna query all'azione di attivazione, l'applicazione mostrerà il seguente errore di sistema:L'input o la query sono vuoti.

Questo accade in tutti i seguenti casi: * L'immagine di input e/o la query di input non hanno un valore assegnato. La query ha una stringa vuota.

Nessun risultato per la query

Se non è stato possibile trovare alcun risultato per la query, l'azione di attivazione restituirà un testo vuoto.

Limiti

:::(Warning) (Attenzione) Le seguenti lingue sono le uniche supportate per i documenti in cui vengono estratti i valori: Inglese, Spagnolo, Italiano, Portoghese, Francese, Tedesco. ::: Attualmente esistono i seguenti limiti per i trigger "Estrai testo da immagine". Questi limiti sono monitorati a livello di istanza. Nel caso in cui questi limiti siano stati superati, l'azione di trigger "Estrai testo dall'immagine" fallirà.

Dimensione dell'immagine: Tutte le immagini devono essere inferiori a 5MB Limite mensile: 10.000 richieste/mese Limite di velocità: 10 richieste/minutoLimite di utilizzo dell'account: Vedere i dettagli qui


Questo articolo è stato utile?