MENU
    画像からテキストを抽出するトリガーアクション
    • 08 Jan 2025
    • 1 読む分
    • 寄稿者

    画像からテキストを抽出するトリガーアクション


    記事の要約

    画像からテキストを抽出トリガアクションは、クエリに基づいて画像からテキストを抽出します。別の言い方をすると、"クエリベースのOCR(光学式文字認識)"または "画像からテキストを抽出する "です。

    トリガは常に、画像に実際に存在するテキストのみを返します。トリガーは、画像に追加情報や解釈を加えることはありません。このため、物理的な世界からデジタルの世界へデータを転送するのに非常に強力です。

    使用例

    • **外部ベンダーからの注文書からデータを取り込む。**サプライヤーの請求書からWMSに14文字の注文書番号を手作業で転送する必要はありません。シンプルなアプリと「画像からテキストを抽出」を組み合わせれば、このデータを数秒で取り込むことができます。
    • **紙のフォームをデジタル化。**既存の紙伝票に含まれるデータは、チューリップのアプリでアクセスできれば、さらに価値が高まります。「画像からテキストを抽出」アクションは、物理的な世界とデジタルの世界を橋渡しする優れたメカニズムです。
    • **オペレーターにとって外国語のテキストを確実に扱うことができます。**製造業の世界はグローバルです。"画像からテキストを抽出 "と "翻訳 "トリガーアクションを組み合わせることで、オペレータにスーパーパワーを与え、紙ベースの情報をオペレータが行動できるものに変えることができます。

    トリガー例

    モバイルアプリを使って製品のラベルを撮影し、バッチ番号を取得する。

    画像トリガー結果
    image.png{高さ="" 幅="400"}。image.png高さ="" 幅="400"} {height="11EP8F4WA58CCX

    画像からの値抽出

    入力と出力

    トリガー・アクションには、2つの入力(Input ImageとQuery)と1つの出力(Extracted Text)があります。

    入力入力画像

    テキストを抽出する画像。カメラ入力ウィジェット、Tulip Vision、または外部システムから取得できます。

    サポートされるデータ型
    入力画像URL

    入力:クエリ

    これは、画像またはドキュメントからテキストを抽出するために使用されるクエリです。

    クエリのベストプラクティス:* 可能な限り、文書に記載されている単語を使用します。これは、頭字語や略語(SN、ID、SSN、Lot No.など)に特に役立ちます。テキスト抽出トリガーアクションは、データ/文書トリガーアクションからの質問に答えるよりも複雑なクエリをサポートします。 * 例偉大な入力:「サプライヤーは誰ですか? * 例悪い入力:「情報の場所を指定することも役立つ(例:「底にある参照番号は?)

    サポートされるデータ型
    入力テキスト

    出力抽出テキスト

    クエリに基づいて画像から抽出されたテキストです。

    サポートされるデータ型
    出力テキスト

    画像/ドキュメントからの値の抽出

    Note

    Extracting values from documents is a relatively slow operation. We limit documents to 10 pages to limit execution time.

    画像/ドキュメントから値を抽出は、画像から値を抽出と同様に動作しますが、質問の配列をサポートします。これは、画像から値を抽出するトリガーアクションを実行するよりもかなりパフォーマンスが高くなります。

    入力入力画像/ドキュメント

    これはテキストを抽出する画像です。カメラ入力ウィジェット、Tulip Vision、または外部システムから取得できます。ファイルの場合は、静的に設定するか、ファイル入力ウィジェットで入力するか、テーブルに保存されているファイルを参照します。

    サポートされるデータ型
    入力画像URL

    入力クエリ

    画像からテキストを抽出するためのクエリー。テキスト値の配列/リストである必要があります。

    サポートされるデータ型
    入力テキストリスト

    出力抽出テキスト

    クエリに基づいて画像から抽出されたテキストです。

    サポートされるデータ型
    出力オブジェクト配列。各要素は "Question "属性と "Answer "属性を持ちます。

    画像/ドキュメントからすべてのテキストを抽出

    場合によっては、抽出値トリガーアクションのkey:valueパラダイムは、ユースケースにとって意味がありません。画像からすべてのデータを読み取ることで、copilot で対処できる問題の柔軟性がほぼ無限に広がります。「すべてのテキストを抽出" トリガーアクションは、このような柔軟性を提供します。

    image.png{高さ ="" 幅 =""}

    入力入力画像/ドキュメント

    テキストを抽出する画像です。カメラ入力ウィジェット、Tulip Vision、または外部システムから取得できます。ファイルの場合は、静的に設定するか、ファイル入力ウィジェットで入力するか、テーブルに保存されているファイルを参照します。

    サポートされるデータ型
    入力画像URLまたはファイルURL

    出力抽出テキスト

    これは、それぞれの画像またはドキュメントで見つかったすべてのテキストです。Documents はデータの配列を返し、各項目は提供されたドキュメントの1ページのテキストを表します。

    サポートされるデータ型
    出力(画像の場合) テキスト。(ドキュメントの場合) テキストリスト

    エッジの場合

    入力画像やクエリが提供されていない

    入力画像やクエリがトリガーアクションに提供されていない場合、アプリは以下のシステムエラーを表示します*。*

    入力画像やクエリ入力に値が割り当てられていません。クエリには空の文字列が割り当てられています。

    クエリの結果がない

    クエリの結果が見つからない場合、トリガアクションは空のテキストを返します。

    制限

    Warning

    The following languages are the only languages supported for documents where values are being extracted: English, Spanish, Italian, Portuguese, French, German.
    :::現在、"画像からテキストを抽出 "トリガーには以下の制限があります。これらの制限はインスタンスレベルで追跡されます。これらの制限を超えた場合、「画像からテキストを抽出」トリガーアクションは失敗します。


    この記事は役に立ちましたか?