Estrazione del testo dall'immagine Azione di attivazione
  • 24 Jan 2024
  • 6 Minuti da leggere
  • Contributori

Estrazione del testo dall'immagine Azione di attivazione


Article Summary

:::(Info) (Open Beta) Le azioni di attivazione del Copilota di prima linea sono attualmente in open beta. Contattate copilot@tulip.co se siete interessati a partecipare alla beta. ::::::(Warning) (Beta Disclaimer) L'uso delle versioni beta offerte da Tulip è facoltativo ed è a vostro esclusivo rischio. A causa della natura non testata/non provata delle versioni Beta, esse sono fornite "così come sono", "come disponibili" e senza garanzia. Ciò significa che tutte le garanzie, le indennità e gli altri obblighi di Tulip ai sensi dei termini di servizio o dell'MSA non si applicano alle versioni Beta. * Frontline Copilot è potente! Ci impegniamo a guidarvi, ma siete voi i responsabili finali dell'impatto di ciò che costruite. * Ci riserviamo il diritto di disattivare tutti i Trigger di Copilot in qualsiasi momento se notiamo qualcosa di inaspettato. * Ci riserviamo il diritto di limitare i Trigger di Copilot durante il corso della beta se e come necessario. * Non vi verrà addebitato l'uso dei Trigger di Copilot durante il programma. Avrete tre mesi di tempo dopo la conclusione del programma per decidere se continuare o meno a utilizzare la funzione.
* Ad un certo punto, in futuro, potremmo implementare una tariffazione basata sull'utilizzo per le funzionalità beta.
:::

L'azione trigger Estrai testo da immagine estrae il testo da un'immagine in base a una query. Un altro modo per descriverla è "OCR (riconoscimento ottico dei caratteri) basato su una query" o "Estrai il testo da un'immagine chiedendolo".

Il trigger restituirà sempre e solo il testo effettivamente presente nell'immagine. Non aggiungerà ulteriori informazioni o interpretazioni. Questo lo rende molto potente per trasferire i dati dal mondo fisico a quello digitale.

Esempi di casi d'uso:

  • Ingerire i dati di un modulo d'ordine proveniente da un fornitore esterno. Dimenticatevi di trasferire manualmente il numero d'ordine di 14 caratteri dalla fattura di un fornitore al vostro WMS: basta un'applicazione semplice e "Extract Text from Image" per estrarre questi dati in pochi secondi.
  • Digitalizzazione dei moduli cartacei. I dati contenuti nei viaggiatori cartacei esistenti sono ancora più preziosi se possono essere consultati all'interno delle app Tulip. Le azioni di "estrazione del testo dall'immagine" sono un ottimo meccanismo per creare un ponte tra il mondo fisico e quello digitale.
  • Lavorate con testi in lingue sconosciute ai vostri operatori, in modo affidabile. Il mondo della produzione è globale, date ai vostri operatori dei superpoteri combinando le azioni trigger "Estrai testo dall'immagine" e "Traduci" per trasformare le informazioni cartacee in qualcosa su cui i vostri operatori possono agire.

Esempio di attivazione

Utilizzare un'applicazione mobile per fotografare l'etichetta di un prodotto e ottenere il numero di lotto.

Immagine | Trigger | Risultato | --- | --- | | --- | | | | | | | image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX |

Estrazione del valore dall'immagine

Ingressi e uscite

L'azione di attivazione ha due ingressi, Immagine di input e Query, e un'uscita, il testo estratto.

Ingresso: Immagine di ingresso

È l'immagine da cui estrarre il testo. Può provenire dal widget di input della telecamera, da Tulip Vision o da sistemi esterni.

| | Tipo di dati supportati | | --- | --- | | Input | URL immagine |

Ingresso: Query

È la query utilizzata per estrarre il testo dall'immagine o dal documento.

Le migliori pratiche per le query: * Se possibile, utilizzare le parole del documento. Questo è particolarmente utile per gli acronimi e le abbreviazioni (ad esempio SN, ID, SSN, Lot No., ecc.). Le azioni di attivazione dell'estratto di testo supportano query meno complesse rispetto alle azioni di attivazione di Risposta a domanda da dati/documento. * Es. Ottimo input: "Chi è il fornitore?" * Es. Input negativo: "Chi pensi possa averci inviato questo?" * Anche specificare la posizione delle informazioni può essere utile (ad esempio, "Qual è il numero di riferimento sul fondo?").

| | Tipo di dati supportato | | --- | --- | | Input | Testo |

Uscita: Testo estratto

È il testo estratto dall'immagine in base alla query.

| | Tipo di dati supportati | | --- | --- | | Output | Text |


Estrarre valori da immagini/documenti

:::(Warning) (Nota) L'estrazione dei valori dai documenti è un'operazione relativamente lenta. Per limitare il tempo di esecuzione, i documenti sono limitati a 10 pagine.
:::

Estrai valori da immagine/documento funziona come Estrai valore da immagine, ma supporta una serie di domande. Questa operazione sarà molto più performante rispetto all'esecuzione dell'azione di trigger Estrai valore dall'immagine.

Ingresso: Immagine/documento di input

È l'immagine da cui estrarre il testo. Può provenire dal widget di input della telecamera, da Tulip Vision o da sistemi esterni. Per i file, può essere impostata staticamente, inserita con il widget di input file o con i file di riferimento memorizzati nelle Tabelle.

| | Tipo di dati supportati | | --- | --- | | Ingresso | URL immagine |

Ingresso: Query

È la query usata per estrarre il testo dall'immagine. Deve essere un array/elenco di valori di testo.

| | Tipo di dati supportati | | --- | --- | | Input | Elenco di testi |

Uscita: Testo estratto

È il testo estratto dall'immagine in base alla query.

| | Tipo di dati supportati | | --- | --- | | Output | Array di oggetti. Ogni elemento avrà un attributo "Domanda" e "Risposta".


Estrarre tutto il testo dall'immagine/documento

In alcuni casi, il paradigma chiave:valore delle azioni di trigger del valore estratto non ha senso per il vostro caso d'uso. La lettura di tutti i dati da un'immagine offre una flessibilità quasi infinita per quanto riguarda i problemi che possono essere affrontati da copilot. Le azioni trigger "Estrai tutto il testo" offrono questa flessibilità.

image.png

Ingresso: Immagine/documento di input

È l'immagine da cui estrarre il testo. Può provenire dal widget di input della telecamera, da Tulip Vision o da sistemi esterni. Per i file, può essere impostata staticamente, inserita con il widget di inserimento file o con i file di riferimento memorizzati nelle Tabelle.

| | Tipo di dati supportati | | --- | --- | | Ingresso | URL immagine o URL file |

Uscita: Testo estratto

Si tratta di tutto il testo trovato nella rispettiva immagine o documento. Documenti restituirà un array di dati, in cui ogni elemento rappresenta il testo di una pagina del documento fornito.

| | Tipo di dati supportati | | --- | --- | | Output | (per le immagini) Testo. (per i documenti) Elenco di testo |


Casi limite

Nessuna immagine di input e/o nessuna query fornita

Se non viene fornita alcuna immagine di input o alcuna query all'azione di attivazione, l'applicazione mostrerà il seguente errore di sistema:L'input o la query sono vuoti.

Questo accade in tutti i seguenti casi: * L'immagine di input e/o la query di input non hanno un valore assegnato. La query ha una stringa vuota.

Nessun risultato per la query

Se non è stato possibile trovare alcun risultato per la query, l'azione di attivazione restituirà un testo vuoto.

Limiti

:::(Warning) (Attenzione) I limiti sono soggetti a modifiche.
Attualmente esistono i seguenti limiti per i trigger "Estrai testo dall'immagine". Questi limiti sono tracciati a livello di istanza. Nel caso in cui questi limiti siano stati superati, l'azione di trigger "Estrai testo dall'immagine" fallirà.

Limite mensile: 10.000 richieste/mese Limite di velocità: 10 richieste/minuto


Questo articolo è stato utile?