Optikai karakterfelismerő (OCR) érzékelő használata
  • 20 Feb 2024
  • 3 Elolvasandó percek
  • Közreműködők

Optikai karakterfelismerő (OCR) érzékelő használata


Cikk összefoglaló

:::(Warning) (Megjegyzés) A Frontline Coplilot™ segítségével a szöveg közvetlenül kivonható a képekből és dokumentumokból, ami jelentősen leegyszerűsíti a Tulipban a képek OCR-felismerésének folyamatát. A továbbiakban ez a javasolt megközelítés. :::

Szöveg észlelése a kamera nézetében, és az alkalmazás műveleteinek kiváltása a Vision OCR-érzékelőjének használatával.

OCR Detector áttekintés

Az optikai karakterfelismerés(OCR) a képek dekódolásának folyamata a bennük lévő szöveg megtalálása és olvasása érdekében. Az OCR a számítógépes látástechnológia hosszú és célzott törekvése évtizedek óta, azonban még mindig az egyik legnehezebb felismerési probléma.

Az OCR-érzékelő segítségével előre meghatározott régiókat figyelhet a kamera adatfolyamán, hogy valós időben észlelje a szöveget. Ezután felhasználhatja a szövegfelismerési eseményeket, hogy logikát építsen az alkalmazáson belül.

:::(Info) (MEGJEGYZÉS) A valós idejű OCR-érzékelő eredményei nagymértékben függnek a bemeneti kép minőségétől. A sikeres és megismételhető eredmények elérése érdekében tegyen meg minden erőfeszítést egy konzisztens és nagyon jól megvilágított olvasási környezet érdekében. Vigye a kamerát a lehető legközelebb ahhoz a helyhez, ahol a szöveg megjelenne. Fontolja meg a zoom vagy dokumentumkamerák használatát, ahogyan azt a hardverre vonatkozó ajánlásban javasoltuk. :::

Ebben a cikkben megtudhatja...

  • Hogyan állítsunk be egy OCR detektort
  • Az OCR Detector eseményeinek használata az alkalmazáson belüli kiváltásokban
  • Az OCR-érzékelő beállításainak módosítása

Előfeltételek

  • Kérjük, olvassa el a Bevezetés a Vision használatába című részt, hogy megismerje a Vision funkcióit és követelményeit, valamint a kamera beállítására vonatkozó utasításokat.
  • Ez a funkció mind a színes, mind a mélységi kamerákkal működik.
  • Az OCR funkció a Tulip r210+ és a Player 1.1.0+ verzióiban érhető el.

Az OCR-érzékelő beállítása

Miután befejezte a kamera konfigurációjának beállítását, látnia kell a videófolyamot. Az OCR detektor beállításához válassza ki azt a régiót, amelyet a szöveg észlelésére monitorozni szeretne. Előfordulhat, hogy új régiót kell létrehoznia a képre kattintva és a képre húzva, hogy meghatározza a régiót:

Creating a region for OCR detection

Ezután hozzon létre egy OCR-érzékelőt az Érzékelő létrehozása hivatkozásra kattintva. Adjon nevet az érzékelőnek, adjon hozzá leírást (opcionális), és válassza az OCR-t az érzékelő típusaként. Engedélyezze az OCR detektort ehhez a régióhoz a kapcsoló segítségével.

Creating an OCR detector

A régió határa zöldre változik, ha a régió területén a szöveget észleli, egyébként piros marad. Ha az észlelési küszöbérték 50%, akkor az ebben a régióban észlelt szövegnek több mint 50%-os biztonsággal kell helyesen észleltnek lennie. Ezen a ponton egy esemény fog elindulni abban az alkalmazásban, amely ezt a kamerakonfigurációt használja.

OCR-érzékelő régió beállításai

Valószínűleg szükség lesz a régió beállításainak módosítására, hogy a felhasználási esetnek megfelelően megfelelő eredményeket kapjon. A régió beállításainak szerkesztéséhez kattintson a Kamera konfigurációra, és válassza ki a módosítani kívánt régiókat.

A következő beállítások állnak rendelkezésre:

OCR detector confidence threshold

OCR Bizalomérzékelési küszöbérték

Ez az a százalékos megbízhatóság, amely a "Szöveg észlelése" esemény kiváltásához szükséges. Ha a szöveget nehéz körülmények között is fel kell ismerni, akkor ezt a küszöbértéket alacsonyabb értékre, például 40-50%-ra állíthatja. Bármely, e küszöbérték feletti érték kiváltja a Szöveg észlelése eseményt, ha korábban nem volt szöveg észlelve a régióban.

Az OCR-érzékelő használata egy alkalmazásban

Váltson át az alkalmazásszerkesztőre, és hozzon létre egy új eszközkimeneti kiváltót.

Az összes kamerakonfiguráció a Speciális eszköz allista alatt fog megjelenni. Kérjük, válassza ki a legördülő listából a kívánt kamerakonfigurációt.

Vegye figyelembe, hogy a Speciális eszköz rész lehetővé teszi több kamera használatát ugyanabban az alkalmazásban. Minden állomásnak, amely ezt az alkalmazást futtatja, rendelkeznie kell a kamera számára kiválasztott specifikus Kamera konfigurációval. Ellenkező esetben az alkalmazás futtatásakor figyelmeztetés jelenik meg.

Most megjelenik egy legördülő menü különböző eseményekből, amelyek alapján a kiváltó programot futtathatja:

Ehhez a példához válassza a Text Detected (Szöveg észlelése ) lehetőséget az események listájából.

Creating a text detection trigger

Ha van egy videóelőnézeti Widget a Stepben, vegye figyelembe a "Show Overlay" (Felület megjelenítése) opciót, amely lehetővé teszi a Régiók megjelenítésének letiltását a videó tetején. Engedélyezze az "OCR DETECTOR" rétegfelületet az OCR-felismerési információk megjelenítéséhez.

Futtassa az alkalmazást azon az állomáson, amelyhez hozzárendelte a kamera konfigurációját.

Amikor megnyitja a lépést a Vision Camera Widget-tel a lejátszóban, látni fogja a kamera videófolyamát. Ha a beállításokban megadott színnel megegyező színű objektumot mozgat a régióban, a régió határa zöldre vált, és a Trigger Action (kiváltó művelet) végrehajtásra kerül.

OCR detector running in an App

Most már sikeresen befejezte az OCR-érzékelő beállítását a kamera konfigurációjában, és készen áll arra, hogy ezt a funkciót beépítse a termelő alkalmazásokba.

További olvasnivalók


Hasznos volt ez a cikk?