Extrair texto da ação de disparo da imagem
  • 24 Jan 2024
  • 6 Minutos para Ler
  • Contribuintes

Extrair texto da ação de disparo da imagem


Article Summary

:::(Info) (Beta aberto) As ações de acionamento do Frontline Copilot estão atualmente em beta aberto. Entre em contato com copilot@tulip.co se estiver interessado em participar da versão beta. ::::::(Warning) (Isenção de responsabilidade sobre a versão beta) O uso das versões beta oferecidas pela Tulip é opcional e é de sua exclusiva responsabilidade. Devido à natureza não testada/não comprovada das versões Beta, elas são fornecidas "como estão", "conforme disponíveis" e sem garantia. Isso significa que quaisquer garantias, indenizações e outras obrigações da Tulip sob quaisquer termos de serviço ou MSA não se aplicam às versões Beta. * O Frontline Copilot é poderoso! Ajudaremos a orientar, mas, em última análise, você é responsável pelo impacto do que construir. * Reservamo-nos o direito de desativar todo e qualquer acionador do Copilot a qualquer momento se notarmos algo inesperado. * Reservamo-nos o direito de limitar os acionadores do Copilot durante o curso da versão beta, se e conforme necessário. * Você não será cobrado pelo uso dos acionadores do Copilot durante o programa. Você terá três meses após a conclusão do programa para decidir se deseja continuar com o recurso ou não.
* Em algum momento no futuro, poderemos implementar preços baseados no uso para os recursos beta.
:::

A ação de acionamento Extrair texto da imagem extrai o texto de uma imagem com base em uma consulta. Outra forma de descrever isso é "OCR (reconhecimento óptico de caracteres) baseado em consulta" ou "Extrair texto de uma imagem solicitando-o".

O acionador sempre retornará apenas o texto que está de fato presente na imagem. Ele não acrescentará informações ou interpretações adicionais. Isso o torna muito eficiente na transferência de dados do mundo físico para o digital.

Exemplos de casos de uso:

  • Ingerir dados de um formulário de pedido proveniente de um fornecedor externo. Esqueça a transferência manual daquele número de pedido de 14 caracteres de uma fatura de fornecedor para o seu WMS. Combine um aplicativo simples e o "Extract Text from Image" para extrair esses dados em segundos.
  • Digitalize formulários em papel. Os dados contidos nos viajantes de papel existentes são ainda mais valiosos quando podem ser acessados nos aplicativos da Tulip. As ações "Extrair texto da imagem" são um ótimo mecanismo para fazer a ponte entre o mundo físico e o digital.
  • Trabalhe com textos em idiomas estrangeiros para seus operadores, de forma confiável. O mundo da manufatura é global. Dê aos seus operadores superpoderes combinando as ações de acionamento "Extrair texto da imagem" e "Traduzir" para transformar informações em papel em algo em que seus operadores possam agir.

Exemplo de acionador

Use um aplicativo móvel para tirar uma foto de uma etiqueta em um produto para obter o número do lote.

| Imagem | Gatilho | Resultado | --- | --- | --- | --- | | image.png{height="" width="400"} | image.png{height="" width="400"} | 11EP8F4WA58CCX |

Extrair valor da imagem

Entradas e saídas

A ação de acionamento tem duas entradas, Imagem de entrada e Consulta, e uma saída, o texto extraído.

Entrada: Imagem de entrada

Essa é a imagem da qual o texto deve ser extraído. Pode vir do widget de entrada da câmera, da Tulip Vision ou de sistemas externos.

| Tipo de dados suportado | | --- | --- | | Entrada | URL da imagem |

Entrada: Consulta

Essa é a consulta usada para extrair o texto da imagem ou do documento.

Práticas recomendadas de consulta: * Sempre que possível, use palavras do documento. Isso é particularmente útil para acrônimos e abreviações (por exemplo, SN, ID, SSN, número do lote, etc.). As ações de acionamento de extração de texto suportam consultas menos complexas do que as ações de acionamento de Resposta à pergunta dos dados/documento. Ótima entrada: "Quem é o fornecedor?" * Ex. Entrada ruim: "Especificar o local das informações também pode ajudar (por exemplo, "Qual é o número de referência na parte inferior?").

| Tipo de dados suportado | | | --- | --- | | Entrada | Texto |

Saída: Extracted Text (Texto extraído)

Esse é o texto que foi extraído da imagem com base na consulta.

| Tipo de dados suportado | | | --- | --- | | Saída | Texto | Extração de valores da imagem/do documento


Extrair valores da imagem/documento

:::(Warning) (Observação) A extração de valores de documentos é uma operação relativamente lenta. Limitamos os documentos a 10 páginas para limitar o tempo de execução.
:::

Extract Values from Image/Document (Extrair valores de imagem/documento) funciona da mesma forma que Extract value from image (Extrair valor de imagem), mas suporta uma matriz de perguntas. Isso terá um desempenho significativamente melhor do que a execução da ação de acionamento Extrair valor da imagem.

Entrada: Imagem/Documento de entrada

Essa é a imagem da qual o texto deve ser extraído. Pode vir do widget de entrada da câmera, da Tulip Vision ou de sistemas externos. Para arquivos, isso pode ser definido estaticamente, entrada com o widget de entrada de arquivo ou arquivos de referência armazenados em Tabelas.

| Tipo de dados suportados | | --- | --- | | Entrada | URL da imagem |

Entrada: Consulta

Essa é a consulta usada para extrair o texto da imagem. Deve ser uma matriz/lista de valores de texto.

| Entrada: Lista de texto

Saída: Extracted Text (Texto extraído)

Esse é o texto que foi extraído da imagem com base na consulta.

| Tipo de dados suportado | | | --- | --- | | Saída | Matriz de objetos. Cada elemento terá um atributo "Pergunta" e "Resposta".


Extrair todo o texto da imagem/documento

Em alguns casos, o paradigma chave:valor das ações de acionamento de extração de valor não faz sentido para o seu caso de uso. A leitura de todos os dados de uma imagem oferece flexibilidade quase infinita em relação aos problemas que podem ser resolvidos pelo copiloto. As ações de acionamento "Extrair todo o texto" proporcionam essa flexibilidade.

image.png

Entrada: Imagem/Documento de entrada

Essa é a imagem da qual o texto deve ser extraído. Ela pode vir do widget de entrada da câmera, do Tulip Vision ou de sistemas externos. No caso de arquivos, isso pode ser definido estaticamente, inserido com o widget de entrada de arquivos ou arquivos de referência armazenados em Tabelas.

| Entrada: URL da imagem ou URL do arquivo

Saída: Texto extraído

Esse é todo o texto encontrado na respectiva imagem ou documento. Os documentos retornarão uma matriz de dados, com cada item representando o texto de uma página do documento fornecido.

| Tipo de dados suportados | | | --- | --- | | Saída | (para imagens) Texto. (para documentos) Lista de texto


Casos de borda

Nenhuma imagem de entrada e/ou nenhuma consulta fornecida

Se nenhuma imagem de entrada ou consulta for fornecida para a ação de acionamento, o aplicativo mostrará o seguinte erro de sistema:Your Input or Query is empty (Sua entrada ou consulta está vazia)

Isso acontece em todos os casos a seguir: * A imagem de entrada e/ou a entrada de consulta não têm um valor atribuído. A consulta tem uma cadeia de caracteres vazia atribuída.

Nenhum resultado para a consulta

Se não for possível encontrar nenhum resultado para a consulta, a ação do acionador retornará um texto vazio.

Limites

:::(Warning) (Aviso) Os limites estão sujeitos a alterações.
::: Atualmente, existem os seguintes limites para os acionadores "Extrair texto da imagem". Esses limites são rastreados em nível de instância. Se esses limites forem excedidos, a ação do acionador "Extrair texto da imagem" falhará.

Limite mensal: 10.000 solicitações/mês Limite de taxa: 10 solicitações/minuto


Este artigo foi útil?