Extraer texto de una imagen
  • 24 Jan 2024
  • 6 Minutos para leer
  • Colaboradores

Extraer texto de una imagen


Article Summary

:::(Info) (Beta abierta) Las acciones de activación del copiloto de primera línea están actualmente en beta abierta. Póngase en contacto con copilot@tulip.co si estás interesado en unirte a la beta. ::::::(Warning) (Descargo de responsabilidad Beta) El uso de las versiones Beta ofrecidas por Tulip es opcional y bajo tu propia responsabilidad. Debido a la naturaleza no probada/probada de las versiones Beta, se proporcionan "tal cual", "según disponibilidad" y sin garantía. ¡Esto significa que cualquier garantía, indemnización y otras obligaciones de Tulip bajo cualquier término de servicio o MSA no se aplican a las Versiones Beta * Frontline Copilot es poderoso! Te ayudaremos a guiarte, pero tú eres el responsable último del impacto de lo que construyas. * Nos reservamos el derecho a desactivar todos y cada uno de los Activadores Copilot en cualquier momento si notamos algo inesperado. * Nos reservamos el derecho a limitar los Activadores Copilot durante el transcurso de la beta si y como sea necesario. * No se te cobrará por el uso de los Activadores Copilot durante el programa. Dispondrá de tres meses tras la finalización del programa para decidir si desea continuar o no con la función.
* En el futuro, es posible que apliquemos precios basados en el uso para las funciones beta.
:::

La acción desencadenante Extraer texto de una imagen extrae texto de una imagen basándose en una consulta. Otra forma de describirlo es "OCR (reconocimiento óptico de caracteres) basado en una consulta" o "Extraer texto de una imagen pidiéndolo".

El disparador siempre devolverá sólo el texto que esté realmente presente en la imagen. No añadirá información adicional ni la interpretará. Esto lo hace muy potente para transferir datos del mundo físico al digital.

Ejemplos de uso:

  • Ingerir datos de un formulario de pedido procedente de un proveedor externo. Olvídese de transferir manualmente ese número de pedido de 14 caracteres de una factura de proveedor a su SGA, combine una sencilla aplicación y "Extraer texto de una imagen" para extraer estos datos en cuestión de segundos.
  • Digitalice los formularios en papel. Los datos contenidos en los viajeros de papel existentes son aún más valiosos cuando se puede acceder a ellos dentro de las aplicaciones de Tulip. Las acciones "Extraer texto de una imagen" son un gran mecanismo para tender un puente entre el mundo físico y el digital.
  • Trabaje con texto en idiomas ajenos a sus operarios, de forma fiable. El mundo de la fabricación es global, dé a sus operarios superpoderes combinando las acciones de activación "Extraer texto de una imagen" y "Traducir" para convertir la información en papel en algo sobre lo que sus operarios puedan actuar.

Ejemplo de activador

Utilice una aplicación móvil para fotografiar la etiqueta de un producto y obtener el número de lote.

| Imagen | Activador | Resultado | | --- | --- | --- | | | image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX

Extraer valor de la imagen

Entradas y salidas

La acción trigger tiene dos entradas, Input Image y Query, y una salida, el texto extraído.

Entrada: Imagen de entrada

Es la imagen de la que debe extraerse el texto. Puede proceder del widget de entrada de la cámara, de Tulip Vision o de sistemas externos.

| | Tipo de datos soportados | | --- | --- | | Entrada | URL de la imagen |

Entrada: Consulta

Esta es la consulta que se utiliza para extraer el texto de la imagen o documento.

Mejores prácticas de consulta: * Siempre que sea posible, utilice palabras del documento. Esto es especialmente útil para acrónimos y abreviaturas (por ejemplo, SN, ID, SSN, Nº de lote, etc.). Las acciones desencadenantes de extracción de texto admiten consultas menos complejas que las acciones desencadenantes de respuesta a preguntas a partir de datos/documentos* Ej. Gran Entrada: "¿Quién es el proveedor? Mal Input: "¿Quién cree que podría habernos enviado esto?" * Especificar la ubicación de la información también puede ayudar (por ejemplo, "¿Cuál es el número de referencia en la parte inferior?")

| Tipo de datos soportado | | --- | --- | Entrada | Texto |

Salida Texto extraído

Es el texto que se extrajo de la imagen en función de la consulta.

| | Tipo de datos soportados | | --- | --- | | Salida | Texto |


Extraer Valores de Imagen/Documento

:::(Warning) (Nota) Extraer valores de documentos es una operación relativamente lenta. Limitamos los documentos a 10 páginas para limitar el tiempo de ejecución.
:::

Extraer valores de imagen/documento funciona igual que Extraer valores de imagen, pero admite una matriz de preguntas. Esto será significativamente más eficaz que ejecutar la acción desencadenante Extraer valor de imagen.

Entrada: Imagen/Documento de entrada

Es la imagen de la que se extraerá el texto. Puede proceder del widget de entrada de la cámara, de Tulip Vision o de sistemas externos. En el caso de los archivos, puede establecerse estáticamente, introducirse con el widget de entrada de archivos o almacenar archivos de referencia en Tablas.

| | Tipo de datos soportados | | --- | --- | | Entrada | URL de la imagen |

Entrada: Consulta

Es la consulta que se utiliza para extraer el texto de la imagen. Debe ser un array/lista de valores de texto.

| Entrada: Lista de texto.

Salida: Texto Extraído

Este es el texto que se extrajo de la imagen basado en la consulta.

| Salida: Matriz de objetos. Cada elemento tendrá un atributo "Pregunta" y "Respuesta".


Extraer todo el texto de la imagen/documento

En algunos casos, el paradigma clave:valor de las acciones de activación de extracción de valor no tiene sentido para su caso de uso. La lectura de todos los datos de una imagen proporciona una flexibilidad casi infinita en cuanto a los problemas que pueden ser abordados por copilot. Las acciones de activación "Extraer todo el texto" le proporcionan esta flexibilidad.

image.png

Entrada: Imagen/Documento de entrada

Es la imagen de la que debe extraerse el texto. Puede proceder del widget de entrada de la cámara, de Tulip Vision o de sistemas externos. En el caso de los archivos, puede establecerse estáticamente, introducirse con el widget de entrada de archivos o almacenar archivos de referencia en Tablas.

| Entrada: URL de imagen o URL de archivo.

Salida Texto extraído

Este es todo el texto encontrado en la imagen o documento respectivo. Documents devolverá una matriz de datos, en la que cada elemento representa el texto de una página del documento proporcionado.

| Tipo de datos soportados | | --- | --- | Salida | (para imágenes) Texto. (para documentos) Lista de texto |


Casos extremos

Sin imagen de entrada y/o sin consulta

Si no se proporciona ninguna imagen de entrada o ninguna consulta a la acción desencadenante, la aplicación mostrará el siguiente error del sistema:Your Input or Query is empty (Su entrada o consulta está vacía).

Esto ocurre en todos los casos siguientes: * La imagen de entrada y/o la consulta de entrada no tienen ningún valor asignado. La consulta tiene asignada una cadena vacía.

No hay resultados para la consulta

Si no se ha podido encontrar ningún resultado para la consulta, la acción desencadenante devolverá un texto vacío.

Límites

:::(Warning) (Advertencia) Los límites están sujetos a cambios.
Actualmente existen los siguientes límites para los disparadores "Extraer texto de una imagen". Estos límites se controlan a nivel de instancia. Si se superan estos límites, la acción "Extraer texto de una imagen" fallará.

Límite Mensual: 10.000 Peticiones/Mes Límite de Frecuencia: 10 Peticiones/Minuto


¿Te ha sido útil este artículo?