A Vision pillanatkép funkciójának használata külső OCR szolgáltatással
  • 26 Mar 2024
  • 2 Elolvasandó percek
  • Közreműködők

A Vision pillanatkép funkciójának használata külső OCR szolgáltatással


Article Summary

A Vision pillanatkép funkciójának használata külső OCR szolgáltatással

Képek rögzítése és küldése egy külső számítógépes látás szolgáltatás API-jának

:::(Warning) (MEGJEGYZÉS) Bár ezt a feladatot a Vision segítségével is elvégezheti - egy másik alternatíva a CoPilot használata. A CoPilotról és az OCR-ről bővebben itt olvashat. :::

.

A Vision Snapshot funkciója a Tulip Connectors és egy külső OCR szolgáltatással együtt használható. Ez a cikk útmutatást ad arról, hogyan lehet gyorsan létrehozni egy robusztus OCR (optikai karakterfelismerő) csővezetéket, amely a szöveget a Vision kamerával készített pillanatképből észleli. Ezt a funkciót kihasználva képes lesz dokumentumokat beolvasni, szöveget olvasni nyomtatott címkékről, vagy akár a tárgyakon dombornyomott vagy maratott szöveget is.

A következő cikk azt mutatja be, hogyan használhatja ezt a funkciót a Google Vision OCR segítségével. A Google Vision OCR funkció nagyon zord képi körülmények között is képes szöveget olvasni.

A lépéseken ez a cikk végigvezet:

  1. A Tulip Vision és a Google Cloud Vision API beállítása.
  2. Hogyan hozzunk létre egy Tulip csatlakozót a GCV API-hoz
  3. Egy alkalmazás létrehozása egy pillanatkép készítéséhez, és az OCR csatlakozó funkcióval való kommunikációhoz

Előfeltételek

Pillanatkép beállítása a kamera konfigurációjával együtt

Győződjön meg róla, hogy sikeresen beállította a Vision kamerakonfigurációt, és ismeri a Vision Pillanatkép funkcióját. További információkért lásd: A Vision pillanatkép funkció használata

A Google Cloud Vision API és a Google Cloud Platform projekt engedélyezése

Hozzon létre egy GCP-projektet, és engedélyezze a Vision API-t az ebben a cikkben leírtak szerint: https://cloud.google.com/vision/docs/ocr.

Hozzon létre egy API-kulcsot a Google Cloud Platformon a hitelesítéshez.

Kövesse a következő cikkben megadott utasításokat: https://cloud.google.com/docs/authentication/api-keys, hogy létrehozzon egy API-kulcsot a GCP-projekthez. Korlátozhatja ennek az API-kulcsnak a használatát, és beállíthatja a megfelelő jogosultságokat. Kérjük, forduljon a hálózati menedzseréhez, hogy segítsen ennek beállításában.

Tulip Connector funkció létrehozása a Google OCR számára

Az Ön által létrehozott csatlakozót és csatlakozófüggvényt úgy kell konfigurálni, hogy megfeleljen a Vision API által elvárt kérés típusának, ahogy az a következő képen látható:

A csatlakozófunkció konfigurálása:

  1. HTTP-csatlakozó létrehozása.

  1. Konfigurálja a csatlakozót úgy, hogy a Google Vision API végpontjára mutasson.

Host: vision.googleapis.com

TLS: Igen 3. Szerkessze a csatlakozó fejléceit, hogy tartalmazza a Content-Type.

  1. Tesztelje a csatlakozót és mentse a konfigurációt.
  2. Ezután hozzon létre egy POST-kérelem csatlakozó funkciót, és adja hozzá a következő elérési utat a végponthoz: v1/images:annotate

  1. Adjon hozzá egy képet bemenetként a csatlakozófüggvényhez. Győződjön meg róla, hogy a bemeneti típus Text.

  1. Győződjön meg arról, hogy a kérés típusa JSON, és hogy a kérés teste megfelel a Google Vision API kérés típusának:

Megjegyzés: Helyettesítse a PUT_YOUR_API_KEY_HERE-t a fenti lépések során létrehozott saját API-kulcsával. 8. Válassza ki a PUT_YOUR_API_KEY_HERE-t. Ezután tesztelje ezt a csatlakozó funkciót egy szöveges kép base64stringgé alakításával (ehhez használhatja ezt a weboldalt). Használja ezt a karakterláncot a kép bemeneti változójának tesztértékeként.

A következőhöz hasonló választ kell visszakapnia:

  1. Állítsa be a kimeneti változót úgy, hogy az a**.responses.0.textAnnotations.0.**description-ra mutasson.
  2. Mentse el a csatlakozófüggvényt.

A pillanatfelvételeket és a Google OCR-csatlakozót használó Tulip-alkalmazás létrehozása

  1. Menjen az alkalmazásszerkesztőbe, és használja a pillanatfelvétel-indító beállítása során létrehozott alkalmazást: A pillanatfelvétel funkció használata
  2. Ezután hozzon létre egy gombot egy Triggerrel a Connector Function hívásához. Használja a Pillanatkép kimenet által tárolt képváltozót a csatlakozó funkció bemeneteként.

  1. Adjon hozzá egy Változót, detected_text, az alkalmazás Lépéséhez, hogy megtekinthesse a csatlakozófüggvény által visszaküldött eredményeket:

  1. Tesztelje az alkalmazást, és figyelje meg az OCR eredményeket:

Most már létrehozott egy Tulip Vision alkalmazást, amely csatlakozik a Google Vision API OCR szolgáltatáshoz. Próbálja ki most az üzletében!

További olvasnivalók:


Hasznos volt ez a cikk?