画像からテキストを抽出するトリガーアクション
  • 24 Jan 2024
  • 1 読む分
  • 寄稿者

画像からテキストを抽出するトリガーアクション


Article Summary

:::(Info) (オープンベータ)フロントライン・コパイロットのトリガーアクションは現在オープンベータ中です。ベータ版への参加に興味がある方は copilot@tulip.co::::::(Warning) (ベータ版に関する免責事項) Tulipが提供するベータ版の使用は任意であり、ご自身の責任で行ってください。ベータ版は未テスト/未検証の性質上、「現状のまま」、「利用可能な限り」、無保証で提供されます。 これは、サービス利用規約またはMSAに基づくTulipのいかなる保証、補償、およびその他の義務も、ベータ版には適用されないことを意味します。 * Frontline Copilotは強力です!当社は、予期せぬ事態に気づいた場合、いつでもすべてのCopilotトリガーをオフにする権利を留保します。 当社は、ベータ版の期間中、必要に応じてCopilotトリガーを制限する権利を留保します。プログラム終了後3ヶ月以内に、この機能を継続するかどうかを決定できます。
* 将来のある時点で、ベータ版機能の使用量に基づく価格設定を導入する可能性があります。
:::

画像からテキストを抽出トリガーアクションは、クエリに基づいて画像からテキストを抽出します。別の言い方をすると、"クエリベースのOCR(光学式文字認識)"または "画像からテキストを取り出す "です。

トリガは常に、画像に実際に存在するテキストのみを返します。トリガーは、画像に付加的な情報や解釈を加えることはありません。このため、物理的な世界からデジタルの世界へデータを転送するのに非常に強力です。

使用例

  • **外部ベンダーからの注文書からデータを取り込む。**サプライヤーの請求書からWMSに14文字の注文書番号を手作業で転送する必要はありません。シンプルなアプリと「画像からテキストを抽出」を組み合わせれば、このデータを数秒で取り込むことができます。
  • **紙のフォームをデジタル化。**既存の紙の伝票に含まれるデータは、チューリップのアプリでアクセスできれば、さらに価値が高まります。「画像からテキストを抽出」アクションは、物理的な世界とデジタルの世界を橋渡しする優れたメカニズムです。
  • **オペレーターにとって外国語のテキストを確実に扱うことができます。**製造業の世界はグローバルです。"画像からテキストを抽出 "と "翻訳 "トリガーアクションを組み合わせることで、オペレータにスーパーパワーを与え、紙ベースの情報をオペレータが行動できるものに変えることができます。

トリガー例

モバイルアプリを使って製品のラベルを撮影し、バッチ番号を取得する。

ImageTriggerResult
image.pngimage.png11ep8f4wa58ccx

画像から値を抽出

入力と出力

トリガーアクションは、2つの入力、入力画像とクエリ、そして1つの出力、抽出されたテキストを持ちます。

入力入力画像

テキストを抽出する画像。カメラ入力ウィジェット、Tulip Vision、または外部システムから取得できます。

| サポートされるデータタイプ|---|入力|画像URL

入力クエリー

画像やドキュメントからテキストを抽出するためのクエリです。

クエリのベストプラクティス: * 可能であれば、文書にある単語を使用する。これは特に頭字語や略語(SN、ID、SSN、ロット番号など)に役立ちます。テキスト抽出トリガーアクションは、データ/文書トリガーアクションからの質問への回答よりも複雑なクエリをサポートしません。偉大な入力:「サプライヤーは誰ですか?悪い入力:「情報の場所を指定することも役に立ちます(例えば、"底にある参照番号は何ですか?")。

| サポートされるデータ型は?

出力抽出されたテキスト

クエリに基づいて画像から抽出されたテキストです。

| サポートされるデータ型||---|出力||テキスト||です。


画像/ドキュメントからの値の抽出

:::(Warning) (注)ドキュメントから値を抽出するのは比較的時間のかかる作業です。実行時間を制限するために、文書を10ページに制限しています。
:::

画像/ドキュメントからの値の抽出は画像からの値の抽出と同様に動作しますが、質問の配列をサポートします。これは、画像から値を抽出するトリガーアクションを実行するよりもかなりパフォーマンスが高くなります。

入力入力画像/ドキュメント

これはテキストを抽出する画像です。カメラ入力ウィジェット、Tulip Vision、または外部システムから取得できます。ファイルの場合は、静的に設定するか、ファイル入力ウィジェットで入力するか、テーブルに保存されているファイルを参照します。

| サポートされるデータタイプ|---|入力|画像URL

入力:クエリー

画像からテキストを抽出するためのクエリ。テキスト値の配列/リストでなければなりません。

| サポートされるデータ型 | | --- | --- | 入力 | テキストリスト

出力:抽出されたテキスト

クエリに基づいて画像から抽出されたテキストです。

| サポートされるデータ型||---|出力||オブジェクト配列。各要素は "Question "属性と "Answer "属性を持ちます。


画像/文書からすべてのテキストを抽出する

場合によっては、抽出値トリガーアクションのkey:valueパラダイムは、ユースケースにとって意味がありません。画像からすべてのデータを読み取ることで、copilot で対処できる問題の柔軟性がほぼ無限に広がります。「すべてのテキストを抽出" トリガーアクションは、この柔軟性を提供します。

image.png

入力入力画像/ドキュメント

テキストを抽出する画像です。カメラ入力ウィジェット、Tulip Vision、または外部システムから取得できます。ファイルの場合は、静的に設定するか、ファイル入力ウィジェットで入力するか、テーブル内のファイルを参照します。

| サポートされるデータタイプ|---|入力|画像URLまたはファイルURL

出力抽出テキスト

これは、それぞれの画像またはドキュメントで見つかったすべてのテキストです。ドキュメントはデータの配列を返し、各項目は提供されたドキュメントの1ページのテキストを表します。

| (画像用) テキスト。(ドキュメントの場合) テキストリスト


エッジケース

入力画像がない、あるいはクエリが提供されていない

入力画像またはクエリがトリガーアクションに提供されない場合、アプリは以下のシステムエラーを表示します。

入力画像やクエリ入力に値が割り当てられていない。クエリに空の文字列が割り当てられている。

クエリの結果がない

クエリの結果が見つからない場合、トリガアクションは空のテキストを返します。

制限

:::(Warning) (警告)制限は変更される可能性があります。
:: 現在、"Extract Text from Image "トリガーには以下の制限があります。これらの制限はインスタンスレベルで追跡されます。これらの制限を超えた場合、「画像からテキストを抽出」トリガーアクションは失敗します。

月間制限: 10,000 リクエスト/月 レート制限: 10 リクエスト/分


この記事は役に立ちましたか?