MENU
    Extraction de texte à partir d'une image Action de déclenchement
    • 24 Jan 2025
    • 5 Minutes à lire
    • Contributeurs

    Extraction de texte à partir d'une image Action de déclenchement


    Résumé de l’article

    L'action de déclenchement Extraire le texte d'une image permet d'extraire le texte d'une image sur la base d'une requête. Une autre façon de décrire cette action est "OCR (reconnaissance optique de caractères) basée sur une requête" ou "Extraire du texte d'une image en le demandant".

    Le déclencheur ne renvoie toujours que le texte effectivement présent dans l'image. Il n'ajoutera pas d'informations supplémentaires ni d'interprétation. Cela le rend très puissant pour transférer des données du monde physique au monde numérique.

    Exemples de cas d'utilisation :

    • Intégrer les données d'un bon de commande provenant d'un fournisseur externe. Oubliez le transfert manuel du numéro de commande à 14 caractères d'une facture fournisseur dans votre WMS, combinez une simple application et "Extraire du texte d'une image" pour extraire ces données en quelques secondes.
    • Numériser les formulaires papier. Les données contenues dans les formulaires papier existants sont encore plus précieuses lorsqu'elles peuvent être accédées dans les applications Tulip. Les actions "Extraire le texte de l'image" sont un excellent moyen de faire le lien entre le monde physique et le monde numérique.
    • Travaillez avec des textes dans des langues étrangères à vos opérateurs, de manière fiable. Le monde de la fabrication est global, donnez à vos opérateurs des super-pouvoirs en combinant les actions "Extraire le texte de l'image" et "Traduire" pour transformer les informations papier en quelque chose sur lequel vos opérateurs peuvent agir.

    Exemple de déclencheur

    Utiliser une application mobile pour prendre une photo de l'étiquette d'un produit afin d'obtenir le numéro de lot.

    ImageDéclencheurRésultat
    image.png{height="" width="400"}image.png{height="" width="400"}11EP8F4WA58CCX

    Extraire une valeur d'une image

    Entrées et sorties

    L'action de déclenchement a deux entrées, Image d'entrée et Requête, et une sortie, le texte extrait.

    Entrée : Image d'entrée

    Il s'agit de l'image à partir de laquelle le texte doit être extrait. Elle peut provenir du widget d'entrée de la caméra, de Tulip Vision ou de systèmes externes.

    Type de données pris en charge
    EntréeURL de l'image

    Entrée : Requête

    Il s'agit de la requête utilisée pour extraire le texte de l'image ou du document.

    Meilleures pratiques en matière d'interrogation:* Dans la mesure du possible, utilisez les mots du document. Cela est particulièrement utile pour les acronymes et les abréviations (par exemple, SN, ID, SSN, numéro de lot, etc.). Les actions de déclenchement d'extraction de texte prennent en charge des requêtes moins complexes que les actions de déclenchement de réponse à une question à partir de données/documents. * Ex. Grande entrée : "Qui est le fournisseur ?" * Ex. Mauvaise entrée : "Qui, selon vous, aurait pu nous envoyer ce document ? "* Il peut également être utile de préciser l'emplacement de l'information (par exemple, "Quel est le numéro de référence sur le fond ?").

    Type de données pris en charge
    EntréeTexte

    Sortie : Texte extrait

    Il s'agit du texte extrait de l'image en fonction de la requête.

    Type de données pris en charge
    SortieTexte

    Extraire des valeurs d'une image/d'un document

    Note

    Extracting values from documents is a relatively slow operation. We limit documents to 10 pages to limit execution time.

    L'extraction de valeurs à partir d'une image/d'un document fonctionne de la même manière que l'extraction de valeurs à partir d'une image, mais prend en charge un tableau de questions. Cette action est nettement plus performante que l'action de déclenchement "Extraire la valeur d'une image".

    Entrée : Image/document d'entrée

    Il s'agit de l'image à partir de laquelle le texte doit être extrait. Elle peut provenir du widget d'entrée de la caméra, de Tulip Vision ou de systèmes externes. Pour les fichiers, elle peut être définie de manière statique, saisie à l'aide du widget d'entrée de fichier, ou faire référence à des fichiers stockés dans des tableaux.

    Type de données pris en charge
    EntréeURL de l'image

    Entrée : Requête

    Il s'agit de la requête utilisée pour extraire le texte de l'image. Il doit s'agir d'un tableau ou d'une liste de valeurs de texte.

    Type de données pris en charge
    EntréeListe de texte

    Sortie : Texte extrait

    Il s'agit du texte extrait de l'image en fonction de la requête.

    Type de données pris en charge
    SortieTableau d'objets. Chaque élément aura un attribut "Question" et un attribut "Réponse".

    Extraire tout le texte d'une image/d'un document

    Dans certains cas, le paradigme clé/valeur des actions de déclenchement d'extraction de valeur n'a pas de sens pour votre cas d'utilisation. La lecture de toutes les données d'une image offre une flexibilité presque infinie en ce qui concerne les problèmes qui peuvent être traités par Copilot. Les actions de déclenchement "Extraire tout le texte" vous offrent cette flexibilité.

    image.png

    Entrée : Image/document d'entrée

    Il s'agit de l'image à partir de laquelle le texte doit être extrait. Elle peut provenir du widget d'entrée de la caméra, de Tulip Vision ou de systèmes externes. Les fichiers peuvent être définis de manière statique, saisis à l'aide de l'outil de saisie de fichiers ou référencés dans les tableaux.

    Type de données pris en charge
    EntréeURL de l'image ou URL du fichier

    Sortie : Texte extrait

    Il s'agit de tout le texte trouvé sur l'image ou le document en question. Les documents renvoient un tableau de données, chaque élément représentant le texte d'une page du document fourni.

    Type de données pris en charge
    Sortie(pour les images) Texte. (pour les documents) Liste de texte

    Cas limites

    Aucune image d'entrée et/ou aucune requête n'est fournie

    Si aucune image d'entrée ou aucune requête n'est fournie à l'action de déclenchement, l'application affichera l'erreur système suivante*: Votre entrée ou votre requête est vide.*

    Cela se produit dans tous les cas suivants:* L'image d'entrée et/ou la requête d'entrée n'ont pas de valeur assignée. L'image d'entrée et/ou la requête n'ont pas de valeur assignée, ce qui équivaut à "null".* La requête a une chaîne vide assignée.

    Aucun résultat pour la requête

    Si aucun résultat n'a pu être trouvé pour la requête, l'action déclencheuse renvoie un texte vide.

    Limites

    Warning

    The following languages are the only languages supported for documents where values are being extracted: English, Spanish, Italian, Portuguese, French, German.

    Les limites suivantes s'appliquent actuellement aux déclencheurs "Extraire du texte d'une image". Ces limites sont suivies au niveau de l'instance. Si ces limites sont dépassées, l'action "Extraire le texte d'une image" échouera.


    Cet article vous a-t-il été utile ?