Uso del detector de reconocimiento óptico de caracteres (OCR)
  • 20 Feb 2024
  • 4 Minutos para leer
  • Colaboradores

Uso del detector de reconocimiento óptico de caracteres (OCR)


Article Summary

:::(Warning) (Nota) Con Frontline Coplilot™, el texto puede ser extraído directamente de imágenes y documentos, simplificando significativamente el proceso para hacer OCR contra imágenes en Tulip. En adelante este es el enfoque recomendado :::

Detectar texto en la vista de una cámara, y Trigger app Actions using Vision's OCR Detector.

Visión General del Detector OCR

El Reconocimiento Óptico de Caracteres (OCR) es el proceso de decodificación de imágenes para encontrar y leer el texto en ellas. El OCR es una larga y centrada búsqueda de la tecnología de visión por computador durante décadas, sin embargo, sigue siendo uno de los problemas de reconocimiento más difíciles que existen.

Utilizando el detector de OCR, puedes monitorizar regiones predefinidas en el flujo de tu cámara para detectar texto en tiempo real. A continuación, puede utilizar los eventos de detección de texto, para construir la lógica dentro de su aplicación.

:::(Info) (NOTA) Los resultados del detector OCR en tiempo real dependen en gran medida de la calidad de la imagen de entrada. Para tener éxito y obtener resultados repetibles, haga todo lo posible para tener un entorno de lectura consistente y muy bien iluminado. Acerque la cámara lo máximo posible al lugar donde aparecería el texto. Considere el uso de una cámara Zoom o Document, como se sugiere en el artículo de recomendación de hardware:::

En este artículo, aprenderás...

  • Cómo configurar un Detector OCR
  • Cómo utilizar los eventos del Detector OCR en la aplicación
  • Cómo ajustar la configuración de un Detector OCR

Requisitos previos

  • Por favor, revise Introducción a Visión para comprender las funcionalidades y requisitos de Visión, y para obtener instrucciones sobre cómo configurar su cámara.
  • Esta función funciona tanto con cámaras de Color como de Profundidad.
  • La función OCR está disponible en las versiones r210+ de Tulip y Player 1.1.0+.

Configuración del Detector OCR

Después de completar la configuración de la cámara, debería ver el flujo de vídeo. Para configurar el detector de OCR, seleccione la región que desea supervisar para detectar texto. Puede que tenga que crear una nueva región, haciendo clic y arrastrando sobre la imagen para definir su región:

Creating a region for OCR detection

A continuación, cree un Detector OCR haciendo clic en el enlace Crear Detector. Dé un nombre al detector y una descripción (opcional) y elija OCR como tipo de detector. Habilite el detector OCR para esta región utilizando el conmutador.

Creating an OCR detector

El límite de la región se volverá verde si el texto se detecta en la región, de lo contrario permanecerá en rojo. Si el umbral de detección es del 50%, entonces el texto detectado en esta región debe tener más del 50% de confianza de que se detecta correctamente. Es en este punto cuando se activará un evento en la aplicación que esté utilizando esta Configuración de Cámara.

Ajustes de región del detector OCR

Es probable que tenga que ajustar la configuración de una región para obtener resultados que se ajusten adecuadamente a su caso de uso. Para editar los ajustes de su región, haga clic en la configuración de la cámara y seleccione las regiones que desea ajustar.

Están disponibles los siguientes ajustes:

OCR detector confidence threshold

Umbral de detección de confianza OCR

Este es el porcentaje de confianza que se requiere para activar un evento de "Texto detectado". Si necesita que el texto se detecte en condiciones difíciles, puede ajustar este umbral a un valor más bajo como 40-50%. Cualquier valor por encima de este umbral activará el evento Texto Detectado si no se ha detectado texto previamente en la región.

Usando el Detector OCR en una Aplicación

Cambie al editor de su aplicación, y cree un nuevo Disparador de Salida de Dispositivo.

Todas las Configuraciones de Cámara aparecerán bajo la sub-lista de Dispositivo Específico. Seleccione su configuración de cámara en el menú desplegable.

Tenga en cuenta que la sección Dispositivo específico le permite utilizar varias cámaras en la misma aplicación. Cualquier estación que ejecute esta aplicación debe tener la configuración de cámara específica que haya seleccionado para la cámara. De lo contrario, aparecerá una advertencia cuando se ejecute la aplicación.

Ahora verá un desplegable de varios eventos para ejecutar el disparador:

Para este ejemplo, seleccione Texto Detectado de la lista de eventos.

Creating a text detection trigger

Si tiene un Widget de previsualización de vídeo en su Paso, tenga en cuenta que la opción "Mostrar superposición" le permite desactivar la visualización de las Regiones encima del vídeo. Habilite la superposición "DETECTOR OCR" para mostrar la información de detección OCR.

Ejecute la aplicación en la estación a la que asignó la configuración de su cámara.

Al abrir el paso con el Widget de Cámara de Visión en su Reproductor, verá el flujo de vídeo de la cámara. Cuando mueva un objeto dentro de la región que tenga un color similar al especificado en la configuración, el límite de la región se volverá verde y tendrá lugar la Acción de activación.

OCR detector running in an App

Ahora ha completado con éxito la configuración del detector OCR en la configuración de la cámara, y está listo para construir esta funcionalidad en aplicaciones de producción.

Más información


¿Te ha sido útil este artículo?