Hungarian

A Vision pillanatkép funkciójának használata külső OCR szolgáltatással

08 Jan 2025
2 Elolvasandó percek
Közreműködők

Nyomtat
Részvény
Twitter
Linkedin
Facebook
Email

A Vision pillanatkép funkciójának használata külső OCR szolgáltatással

Frissítve 08 Jan 2025
2 Elolvasandó percek
Közreműködők

Nyomtat
Részvény
Twitter
Linkedin
Facebook
Email

Cikk összefoglaló

Hasznosnak találta ezt az összefoglalót?

Köszönjük visszajelzését

A Vision pillanatkép funkciójának használata külső OCR szolgáltatással

Képek rögzítése és küldése egy külső számítógépes látás szolgáltatás API-jának

NOTE

While you can accomplish this with Vision - another alternative is to use CoPilot. Read more about CoPilot and OCR here.

Áttekintés

A Vision Snapshot funkciója a Tulip Connectors és egy külső OCR szolgáltatással együtt használható. Ez a cikk útmutatást ad arról, hogyan lehet gyorsan létrehozni egy robusztus OCR (optikai karakterfelismerő) csővezetéket, amely a szöveget a Vision kamerával készített pillanatképből érzékeli. Ezt a funkciót kihasználva képes lesz dokumentumokat beolvasni, szöveget olvasni nyomtatott címkékről, vagy akár a tárgyakon dombornyomott vagy maratott szöveget is.

A következő cikk azt mutatja be, hogyan használhatja ezt a funkciót a Google Vision OCR segítségével. A Google Vision OCR funkció nagyon zord képi körülmények között is képes szöveget olvasni.

A lépéseken ez a cikk végigvezet:

A Tulip Vision és a Google Cloud Vision API beállítása.
Hogyan hozzunk létre egy Tulip csatlakozót a GCV API-hoz
Egy alkalmazás létrehozása egy pillanatkép készítéséhez, és az OCR csatlakozó funkcióval való kommunikációhoz

Előfeltételek

Pillanatkép beállítása a kamera konfigurációjával együtt

Győződjön meg róla, hogy sikeresen beállította a Vision kamerakonfigurációt, és ismeri a Vision Pillanatkép funkcióját. További információkért lásd: A Vision pillanatkép funkció használata

A Google Cloud Vision API és a Google Cloud Platform projekt engedélyezése

Hozzon létre egy GCP-projektet, és engedélyezze a Vision API-t az ebben a cikkben leírtak szerint: https://cloud.google.com/vision/docs/ocr.

Hozzon létre egy API-kulcsot a Google Cloud Platformon a hitelesítéshez.

Kövesse a következő cikkben megadott utasításokat: https://cloud.google.com/docs/authentication/api-keys, hogy létrehozzon egy API-kulcsot a GCP-projekthez. Korlátozhatja ennek az API-kulcsnak a használatát, és beállíthatja a megfelelő jogosultságokat. Kérjük, forduljon a hálózati menedzseréhez, hogy segítsen ennek beállításában.

Tulip Connector funkció létrehozása a Google OCR számára

Az Ön által létrehozott csatlakozót és csatlakozófüggvényt úgy kell konfigurálni, hogy megfeleljen a Vision API által elvárt kérés típusának, ahogy az a következő képen látható:

A csatlakozófunkció konfigurálása:

HTTP-csatlakozó létrehozása.

Konfigurálja a csatlakozót úgy, hogy a Google Vision API végpontjára mutasson.

Host: vision.googleapis.com

TLS: Igen3. Szerkessze a csatlakozó fejléceit, hogy tartalmazza a Content-Type.

Tesztelje a csatlakozót és mentse a konfigurációt.
Ezután hozzon létre egy POST-kérelem csatlakozó funkciót, és adja hozzá a következő elérési utat a végponthoz: v1/images:annotate

Adjon hozzá egy képet bemenetként a csatlakozófüggvényhez. Győződjön meg róla, hogy a bemeneti típus Text.

Győződjön meg arról, hogy a kérés típusa JSON, és hogy a kérés teste megfelel a Google Vision API kérés típusának:

Megjegyzés: Helyettesítse a PUT_YOUR_API_KEY_HERE-t a fenti lépésekben létrehozott saját API-kulcsával. 8. Ezután tesztelje ezt a csatlakozófüggvényt egy szöveges kép base64stringgé alakításával (ehhez használhatja ezt a webhelyet). Használja ezt a karakterláncot a kép bemeneti változójának tesztértékeként.

A következőhöz hasonló választ kell visszakapnia:

Állítsa be a kimeneti változót úgy, hogy az a**.responses.0.textAnnotations.0.description-ra mutasson.**
Mentse el a csatlakozófüggvényt.

A pillanatfelvételeket és a Google OCR-csatlakozót használó Tulip-alkalmazás létrehozása

Menjen az alkalmazásszerkesztőbe, és használja a pillanatfelvétel-indító beállítása során létrehozott alkalmazást: A pillanatfelvétel funkció használata
Ezután hozzon létre egy gombot egy Triggerrel a Connector Function hívásához. Használja a Pillanatkép kimenet által tárolt képváltozót a csatlakozó funkció bemeneteként.

Adjon hozzá egy Változót, detected_text, az alkalmazás Lépéséhez, hogy megtekinthesse a csatlakozófüggvény által visszaküldött eredményeket:

Tesztelje az alkalmazást, és figyelje meg az OCR eredményeket:

Most már létrehozott egy Tulip Vision alkalmazást, amely csatlakozik a Google Vision API OCR szolgáltatáshoz. Próbálja ki most az üzletében!

További olvasnivalók:

A Vision használatának kezdetei
A változásérzékelő használata (Szükséges: Intel RealSense D415)
A Jig Detector használata
A színérzékelő használata
A Vision Camera Widget használata alkalmazásokban

Hasznos volt ez a cikk?

Tartalomjegyzék

A Vision pillanatkép funkciójának használata külső OCR szolgáltatással
Áttekintés
- A lépéseken ez a cikk végigvezet:
Előfeltételek
- Pillanatkép beállítása a kamera konfigurációjával együtt
Tulip Connector funkció létrehozása a Google OCR számára
- A csatlakozófunkció konfigurálása:
A pillanatfelvételeket és a Google OCR-csatlakozót használó Tulip-alkalmazás létrehozása
További olvasnivalók: