MENU
    Uso de la función Snapshot de Vision con un servicio OCR externo
    • 08 Jan 2025
    • 3 Minutos para leer
    • Colaboradores

    Uso de la función Snapshot de Vision con un servicio OCR externo


    Resumen del artículo

    Uso de la función Instantánea de Vision con un servicio OCR externo

    Capturar y enviar imágenes a un servicio externo de visión por ordenador API

    NOTE

    While you can accomplish this with Vision - another alternative is to use CoPilot. Read more about CoPilot and OCR here.

    Visión general

    La función Snapshot de Vision puede utilizarse junto con Tulip Connectors y un servicio OCR externo. Este artículo le guiará sobre cómo construir rápidamente un robusto OCR (reconocimiento óptico de caracteres) tubería que detecta el texto de la instantánea tomada con una cámara de visión. Aprovechando esta funcionalidad, podrá escanear documentos, leer texto de etiquetas impresas o incluso texto en relieve o grabado en objetos.

    En el siguiente artículo se explica cómo utilizar esta función con Google Vision OCR. La función Google Vision OCR es capaz de leer texto en condiciones de imagen muy difíciles.

    Los pasos que este artículo le llevará a través de:

    1. Configuración de Tulip Vision y Google Cloud Vision API
    2. Cómo crear un conector Tulip a la API GCV
    3. Cómo crear una aplicación para tomar una instantánea y comunicarse con la función del conector OCR

    Requisitos previos

    Configurar una instantánea junto con una configuración de cámara

    Asegúrate de haber configurado correctamente una cámara Vision y de estar familiarizado con la función Snapshot de Vision. Para más información, consulte: Uso de la función Snapshot de Vision

    Habilite la API de Google Cloud Vision y un proyecto de Google Cloud Platform

    Cree un proyecto GCP y habilite la API de Vision siguiendo las instrucciones que se indican en este artículo: https://cloud.google.com/vision/docs/ocr.

    Cree una clave de API en Google Cloud Platform que se utilizará para la autenticación

    Siga las instrucciones indicadas en el artículo: https://cloud.google.com/docs/authentication/api-keys para crear una clave de API para su proyecto GCP. Puede restringir el uso de esta clave de API y establecer los permisos adecuados. Consulta a tu administrador de red para que te ayude a configurar esto.

    Creación de una función de conector de Tulip para Google OCR

    El conector y la función de conector que crees se configurarán para que coincidan con el tipo de solicitud que espera la Vision API, como se indica en la siguiente imagen:

    Configuración de tu función de conector:

    1. Crear un Conector HTTP.

    1. Configura el conector para que apunte al punto final de Google Vision API.

    Host: vision.googleapis.com

    TLS: Sí3. Edita las cabeceras del conector para incluir Content-Type.

    1. Prueba el conector y guarda la configuración.
    2. A continuación, crea una función de conector de solicitud POST y añade la siguiente ruta al punto final: v1/images:annotate

    1. Añada una imagen como entrada a la función del conector. Asegúrese de que el tipo de entrada es Texto.

    1. Asegúrate de que el tipo de solicitud sea JSON y de que el cuerpo de la solicitud coincida con el tipo de solicitud de la API de Google Vision:

    Nota: sustituye PUT_YOUR_API_KEY_HERE por tu propia clave de API creada en los pasos anteriores.8. A continuación, prueba esta función de conector convirtiendo una imagen de texto en una cadena base64 (para ello, puedes utilizar este sitio web). Utilice esta cadena como valor de prueba para su variable de entrada de imagen.

    Deberías recibir una respuesta similar a

    1. Establezca la variable de salida para que apunte a**.responses.0.textAnnotations.0.description**
    2. Guarde la función del conector.

    Creación de una aplicación Tulip que utilice Snapshots y el conector Google OCR

    1. Ve al Editor de aplicaciones y utiliza la aplicación creada al configurar el activador de instantáneas: Uso de la función de instantáneas
    2. A continuación, crea un botón con un Trigger para llamar a la Función del Conector. Utilice la variable de imagen almacenada por la salida de instantánea como entrada para la función del conector.

    1. Añade una Variable, detected_text, al Paso de tu app para poder ver los resultados devueltos por la función del conector:

    1. Prueba la app y observa los resultados del OCR:

    Ahora has creado una aplicación Tulip Vision que se conecta al servicio OCR de Google Vision API. Pruébala ahora en tu tienda.

    Más información:


    ¿Te ha sido útil este artículo?