MENU
    A Vision pillanatkép funkciójának használata külső OCR szolgáltatással
    • 08 Jan 2025
    • 2 Elolvasandó percek
    • Közreműködők

    A Vision pillanatkép funkciójának használata külső OCR szolgáltatással


    Cikk összefoglaló

    A Vision pillanatkép funkciójának használata külső OCR szolgáltatással

    Képek rögzítése és küldése egy külső számítógépes látás szolgáltatás API-jának

    NOTE

    While you can accomplish this with Vision - another alternative is to use CoPilot. Read more about CoPilot and OCR here.

    Áttekintés

    A Vision Snapshot funkciója a Tulip Connectors és egy külső OCR szolgáltatással együtt használható. Ez a cikk útmutatást ad arról, hogyan lehet gyorsan létrehozni egy robusztus OCR (optikai karakterfelismerő) csővezetéket, amely a szöveget a Vision kamerával készített pillanatképből érzékeli. Ezt a funkciót kihasználva képes lesz dokumentumokat beolvasni, szöveget olvasni nyomtatott címkékről, vagy akár a tárgyakon dombornyomott vagy maratott szöveget is.

    A következő cikk azt mutatja be, hogyan használhatja ezt a funkciót a Google Vision OCR segítségével. A Google Vision OCR funkció nagyon zord képi körülmények között is képes szöveget olvasni.

    A lépéseken ez a cikk végigvezet:

    1. A Tulip Vision és a Google Cloud Vision API beállítása.
    2. Hogyan hozzunk létre egy Tulip csatlakozót a GCV API-hoz
    3. Egy alkalmazás létrehozása egy pillanatkép készítéséhez, és az OCR csatlakozó funkcióval való kommunikációhoz

    Előfeltételek

    Pillanatkép beállítása a kamera konfigurációjával együtt

    Győződjön meg róla, hogy sikeresen beállította a Vision kamerakonfigurációt, és ismeri a Vision Pillanatkép funkcióját. További információkért lásd: A Vision pillanatkép funkció használata

    A Google Cloud Vision API és a Google Cloud Platform projekt engedélyezése

    Hozzon létre egy GCP-projektet, és engedélyezze a Vision API-t az ebben a cikkben leírtak szerint: https://cloud.google.com/vision/docs/ocr.

    Hozzon létre egy API-kulcsot a Google Cloud Platformon a hitelesítéshez.

    Kövesse a következő cikkben megadott utasításokat: https://cloud.google.com/docs/authentication/api-keys, hogy létrehozzon egy API-kulcsot a GCP-projekthez. Korlátozhatja ennek az API-kulcsnak a használatát, és beállíthatja a megfelelő jogosultságokat. Kérjük, forduljon a hálózati menedzseréhez, hogy segítsen ennek beállításában.

    Tulip Connector funkció létrehozása a Google OCR számára

    Az Ön által létrehozott csatlakozót és csatlakozófüggvényt úgy kell konfigurálni, hogy megfeleljen a Vision API által elvárt kérés típusának, ahogy az a következő képen látható:

    A csatlakozófunkció konfigurálása:

    1. HTTP-csatlakozó létrehozása.

    1. Konfigurálja a csatlakozót úgy, hogy a Google Vision API végpontjára mutasson.

    Host: vision.googleapis.com

    TLS: Igen3. Szerkessze a csatlakozó fejléceit, hogy tartalmazza a Content-Type.

    1. Tesztelje a csatlakozót és mentse a konfigurációt.
    2. Ezután hozzon létre egy POST-kérelem csatlakozó funkciót, és adja hozzá a következő elérési utat a végponthoz: v1/images:annotate

    1. Adjon hozzá egy képet bemenetként a csatlakozófüggvényhez. Győződjön meg róla, hogy a bemeneti típus Text.

    1. Győződjön meg arról, hogy a kérés típusa JSON, és hogy a kérés teste megfelel a Google Vision API kérés típusának:

    Megjegyzés: Helyettesítse a PUT_YOUR_API_KEY_HERE-t a fenti lépésekben létrehozott saját API-kulcsával. 8. Ezután tesztelje ezt a csatlakozófüggvényt egy szöveges kép base64stringgé alakításával (ehhez használhatja ezt a webhelyet). Használja ezt a karakterláncot a kép bemeneti változójának tesztértékeként.

    A következőhöz hasonló választ kell visszakapnia:

    1. Állítsa be a kimeneti változót úgy, hogy az a**.responses.0.textAnnotations.0.description-ra mutasson.**
    2. Mentse el a csatlakozófüggvényt.

    A pillanatfelvételeket és a Google OCR-csatlakozót használó Tulip-alkalmazás létrehozása

    1. Menjen az alkalmazásszerkesztőbe, és használja a pillanatfelvétel-indító beállítása során létrehozott alkalmazást: A pillanatfelvétel funkció használata
    2. Ezután hozzon létre egy gombot egy Triggerrel a Connector Function hívásához. Használja a Pillanatkép kimenet által tárolt képváltozót a csatlakozó funkció bemeneteként.

    1. Adjon hozzá egy Változót, detected_text, az alkalmazás Lépéséhez, hogy megtekinthesse a csatlakozófüggvény által visszaküldött eredményeket:

    1. Tesztelje az alkalmazást, és figyelje meg az OCR eredményeket:

    Most már létrehozott egy Tulip Vision alkalmazást, amely csatlakozik a Google Vision API OCR szolgáltatáshoz. Próbálja ki most az üzletében!

    További olvasnivalók:


    Hasznos volt ez a cikk?