光学式文字認識(OCR)検出器の使用
  • 20 Feb 2024
  • 1 読む分
  • 寄稿者

光学式文字認識(OCR)検出器の使用


Article Summary

:::(Warning) (注)Frontline Coplilot™を使用すると、画像や文書から直接テキストを抽出できるため、Tulipで画像に対してOCRを行うプロセスが大幅に簡素化されます。今後はこの方法を推奨します:

カメラのビューでテキストを検出し、VisionのOCR検出器を使用してアプリのアクションをトリガーする

OCR検出器の概要

光学式文字認識(OCR)とは、画像内のテキストを見つけ、読み取るために画像をデコードするプロセスです。OCRは、何十年もの間、コンピュータビジョン技術の長い間、集中的に追求されてきたものですが、現存する認識問題の中でも難しいものの一つです。

OCR検出器を使用すると、カメラのストリーム上で事前に定義された領域を監視し、リアルタイムでテキストを検出することができます。その後、テキスト検出イベントを使用して、アプリ内でロジックを構築することができます。

:::(Info) (注)リアルタイムのOCR検出結果は、入力画像の品質に大きく依存します。再現性のある結果を得るためには、一貫性のある、非常に明るい読み取り環境を用意するよう努力してください。テキストが表示される場所にできるだけカメラを近づけてください。ハードウェアの推奨記事で提案されているように、ZoomカメラまたはDocumentカメラの使用を検討してください:

この記事では...

  • OCR検出器の設定方法
  • アプリ内トリガーによるOCR検出イベントの使用
  • OCR検出器の設定を調整する方法

前提条件

  • Visionの機能と要件を理解し、カメラのセットアップ方法を説明するために、Visionを始めるをご覧ください。
  • この機能はカラーカメラとデプスカメラの両方で動作します。
  • OCR機能はTulipバージョンr210+とPlayer1.1.0+で利用可能です。

OCR検出器の設定

カメラ設定のセットアップが完了すると、ビデオストリームが表示されます。OCR検出器を設定するには、テキストを検出するために監視したい領域を選択します。領域を定義するために、画像をクリックしてドラッグし、新しい領域を作成する必要がある場合があります:

Creating a region for OCR detection

次に、[検出器の作成] リンクをクリックして、OCR 検出器を作成します。検出器に名前を付け、説明(オプション)を付け、検出器のタイプとして OCR を選択します。トグルを使って、このリージョンのOCR検出器を有効にします。

Creating an OCR detector

領域内でテキストが検出されると、領域の境界が緑色に変わり、そうでなければ赤色のままになります。検出しきい値が 50% の場合、このリージョンで検出されたテキストは、正しく検出された信頼度が 50% 以上でなければなりません。この時点で、このカメラ設定を使用しているアプリでイベントがトリガーされます。

OCR 検出領域設定

ユースケースに適した結果を得るために、リージョンの設定を調整する必要があるでしょう。地域の設定を編集するには、カメラ設定をクリックし、調整したい地域を選択します。

以下の設定が可能です:

OCR detector confidence threshold

OCR 信頼度検出しきい値

これは「テキスト検出」イベントをトリガーするために必要な信頼度のパーセンテージです。厳しい条件下でテキストを検出する必要がある場合は、このしきい値を 40-50% のような低い値に設定できます。このしきい値を超える値は、その領域で以前テキストが検出されなかった場合、テキスト検出イベントをトリガーします。

アプリでOCR検出器を使う

アプリのエディターに切り替え、新しいデバイス出力トリガーを作成します。

すべてのカメラ設定が特定のデバイス」のサブリストに表示されます。ドロップダウンからカメラ設定を選択してください。

特定の デバイス] セクションでは、同じアプリで複数のカメラを使用できます。このアプリを実行するステーションには、カメラに選択した特定のカメラ設定が必要です。そうでない場合、アプリの実行時に警告が表示されます。

トリガを実行する様々なイベントのドロップダウンが表示されます:

この例では、イベントリストから "Text Detected"を選択します。

Creating a text detection trigger

ステップにビデオプレビューウィジェットがある場合、"Show Overlay "オプションでビデオの上にリージョンを表示しないようにすることができます。OCR検出情報を表示するには、"OCR DETECTOR "オーバーレイを有効にします。

カメラ構成を割り当てたステーションでアプリを実行します。

プレーヤーでVision Camera Widgetを使用してステップを開くと、カメラのビデオストリームが表示されます。設定で指定した色と同じ色のオブジェクトを領域内で動かすと、領域の境界が緑色に変わり、トリガーアクションが実行されます。

OCR detector running in an App

これで、カメラ設定でのOCR検出器の設定が完了し、この機能を本番アプリに組み込む準備ができました。

さらに読む


この記事は役に立ちましたか?