Akcja wyzwalająca wyodrębnianie tekstu z obrazu
  • 07 Jun 2024
  • 4 Minuty do przeczytania
  • Współtwórcy

Akcja wyzwalająca wyodrębnianie tekstu z obrazu


Streszczenie artykułu

Akcja wyzwalacza Wyodrębnij tekst z obrazu wyodrębnia tekst z obrazu na podstawie zapytania. Innym sposobem na opisanie tego jest "OCR oparty na zapytaniu (optyczne rozpoznawanie znaków)" lub "Wyodrębnij tekst z obrazu, pytając o niego".

Wyzwalacz zawsze zwróci tylko tekst, który jest faktycznie obecny na obrazie. Nie doda do niego dodatkowych informacji ani interpretacji. Sprawia to, że jest on bardzo skuteczny w przenoszeniu danych ze świata fizycznego do cyfrowego.

Przykładowe przypadki użycia:

  • Pozyskiwanie danych z formularza zamówienia pochodzącego od zewnętrznego dostawcy. Zapomnij o ręcznym przenoszeniu tego 14-znakowego numeru PO z faktury dostawcy do systemu WMS, połącz prostą aplikację i "Wyodrębnij tekst z obrazu", aby pobrać te dane w ciągu kilku sekund.
  • Digitalizacja formularzy papierowych. Dane zawarte na istniejących papierowych dokumentach są jeszcze bardziej wartościowe, gdy można uzyskać do nich dostęp w aplikacjach Tulip. Akcje "Wyodrębnij tekst z obrazu" to świetny mechanizm łączący świat fizyczny i cyfrowy.
  • Niezawodna praca z tekstem w językach obcych dla operatorów. Świat produkcji jest globalny, daj swoim operatorom supermoce, łącząc akcje wyzwalające "Wyodrębnij tekst z obrazu" i "Przetłumacz", aby przekształcić informacje papierowe w coś, na czym operatorzy mogą działać.

Przykład wyzwalacza

Użyj aplikacji mobilnej, aby zrobić zdjęcie etykiety na produkcie w celu uzyskania numeru partii.

Obraz | Wyzwalacz | Wynik | | --- | --- | --- | | | | image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX |

Wyodrębnianie wartości z obrazu

Wejścia i wyjścia

Akcja wyzwalania ma dwa wejścia, obraz wejściowy i zapytanie, oraz jedno wyjście, wyodrębniony tekst.

Wejście: Obraz wejściowy

Jest to obraz, z którego należy wyodrębnić tekst. Może on pochodzić z widżetu wejściowego kamery, Tulip Vision lub systemów zewnętrznych.

| Obsługiwany typ danych | | --- | --- | Wejście | Adres URL obrazu |

Wejście: Zapytanie

Jest to zapytanie używane do wyodrębniania tekstu z obrazu lub dokumentu.

Najlepsze praktyki dotyczące zapytań: * Jeśli to możliwe, użyj słów z dokumentu. Jest to szczególnie pomocne w przypadku akronimów i skrótów (np. SN, ID, SSN, Lot No. itp.). Akcje wyzwalania wyodrębniania tekstu obsługują mniej złożone zapytania niż akcje wyzwalania odpowiedzi na pytanie z danych/dokumentu* Np. Świetne dane wejściowe: "Kto jest dostawcą?" * Przykład. Złe dane wejściowe: "Jak myślisz, kto mógł nam to wysłać?" * Określenie lokalizacji informacji może również pomóc (np. "Jaki jest numer referencyjny na spodzie?")

| Obsługiwany typ danych | | --- | --- | Wejście | Tekst |

Wyjście: Wyodrębniony tekst

Jest to tekst wyodrębniony z obrazu na podstawie zapytania.

| Obsługiwany typ danych | | --- | --- | | Wyjście | Tekst |


Wyodrębnianie wartości z obrazu/dokumentu

:::(Warning) (Uwaga) Wyodrębnianie wartości z dokumentów jest stosunkowo powolną operacją. Ograniczamy dokumenty do 10 stron, aby ograniczyć czas wykonania.
:::

Extract Values from Image/Document działa tak samo jak Extract value from image, ale obsługuje tablicę pytań. Będzie to znacznie bardziej wydajne niż uruchamianie akcji wyzwalacza wyodrębniania wartości z obrazu.

Dane wejściowe: Obraz wejściowy/dokument

Jest to obraz, z którego należy wyodrębnić tekst. Może on pochodzić z widżetu wejściowego kamery, Tulip Vision lub systemów zewnętrznych. W przypadku plików może to być ustawione statycznie, wprowadzone za pomocą widżetu wprowadzania plików lub plików referencyjnych przechowywanych w Tabelach.

| Obsługiwany typ danych | | --- | --- | Wejście | URL obrazu |

Wejście: Zapytanie

Jest to zapytanie używane do wyodrębniania tekstu z obrazu. Powinna to być tablica/lista wartości tekstowych.

| Obsługiwany typ danych | | --- | --- | | Wejście | Lista tekstowa |

Wyjście: Wyodrębniony tekst

Jest to tekst wyodrębniony z obrazu na podstawie zapytania.

| Obsługiwany typ danych | | --- | --- | | Wyjście | Tablica obiektów. Każdy element będzie miał atrybut "Pytanie" i "Odpowiedź".|


Wyodrębnianie całego tekstu z obrazu/dokumentu

W niektórych przypadkach paradygmat klucz:wartość akcji wyzwalacza wyodrębniania wartości nie ma sensu w danym przypadku użycia. Odczytywanie wszystkich danych z obrazu zapewnia niemal nieskończoną elastyczność w zakresie problemów, które mogą być rozwiązywane przez copilota. Akcje wyzwalające "Wyodrębnij cały tekst" zapewniają tę elastyczność.

image.png

Dane wejściowe: Obraz wejściowy/dokument

Jest to obraz, z którego należy wyodrębnić tekst. Może on pochodzić z widżetu wejściowego kamery, Tulip Vision lub systemów zewnętrznych. W przypadku plików można to ustawić statycznie, wprowadzić za pomocą widżetu wprowadzania plików lub odwołać się do plików przechowywanych w Tabelach.

| Obsługiwany typ danych | | --- | --- | Wejście | Adres URL obrazu lub adres URL pliku |

Wyjście: Wyodrębniony tekst

Jest to cały tekst znaleziony na odpowiednim obrazie lub dokumencie. Documents zwróci tablicę danych, gdzie każdy element reprezentuje tekst z jednej strony dostarczonego dokumentu.

| Obsługiwany typ danych | | --- | --- | Wyjście | (dla obrazów) Tekst. (dla dokumentów) Text List |


Przypadki brzegowe

Brak obrazu wejściowego i/lub zapytania

Jeśli nie podano obrazu wejściowego lub zapytania do akcji wyzwalacza, aplikacja wyświetli następujący błąd systemowy:Twoje dane wejściowe lub zapytanie są puste

Dzieje się tak we wszystkich następujących przypadkach: * Obraz wejściowy i/lub zapytanie wejściowe nie mają przypisanej wartości. Zapytanie ma przypisany pusty ciąg znaków.

Brak wyniku dla zapytania

Jeśli nie można znaleźć wyniku dla zapytania, akcja wyzwalacza zwróci pusty tekst.

Limity

:::(Warning) (Ostrzeżenie) Następujące języki są jedynymi obsługiwanymi językami dla dokumentów, w których wyodrębniane są wartości: Angielski, hiszpański, włoski, portugalski, francuski, niemiecki. :: Obecnie istnieją następujące limity dla wyzwalaczy "Wyodrębnij tekst z obrazu". Limity te są śledzone na poziomie instancji. W przypadku przekroczenia tych limitów akcja wyzwalacza "Wyodrębnij tekst z obrazu" zakończy się niepowodzeniem.

Rozmiar obrazu: Wszystkie obrazy muszą mieć rozmiar poniżej 5 MB Limit miesięczny: 10 000 żądań/miesiąc Limit szybkości: 10 żądań/minutęLimit użycia konta: Zobacz szczegóły tutaj.


Czy ten artykuł był pomocny?